برنامه نويسي

Learning Spark: Lightning-Fast Data Analytics

Learning Spark: Lightning-Fast Data Analytics

دانلود کتاب Learning Spark: Lightning-Fast Data Analytics (به فارسی: Learning Spark: Lightning-Fast Data Analytics) نوشته شده توسط «Jules S. Damji – Brooke Wenig – Tathagata Das – Denny Lee»


اطلاعات کتاب Learning Spark: Lightning-Fast Data Analytics

موضوع اصلی: کامپیوتر – برنامه نویسی

نوع: کتاب الکترونیکی

ناشر: O’Reilly Media

نویسنده: Jules S. Damji – Brooke Wenig – Tathagata Das – Denny Lee

زبان: english

فرمت کتاب: PDF (قابل تبدیل به سایر فرمت ها)

سال انتشار: 2020

تعداد صفحه: 300 / 399

حجم فایل: 15.31 مگابایت

کد کتاب: 1492050040 , 9781492050049

نوبت چاپ: 2

توضیحات کتاب Learning Spark: Lightning-Fast Data Analytics

داده‌ها بزرگ‌تر می‌شوند، سریع‌تر می‌رسند و در قالب‌های متنوعی می‌آیند – و همه باید در مقیاس برای تجزیه و تحلیل یا یادگیری ماشین پردازش شوند. چگونه می توانید چنین حجم کاری داده های متنوعی را به طور موثر پردازش کنید؟ Apache Spark را وارد کنید.

این ویرایش دوم که برای تأکید بر ویژگی‌های جدید در Spark 2.x به‌روزرسانی شده است، به مهندسان داده و دانشمندان نشان می‌دهد که چرا ساختار و یکپارچگی در Spark مهم است. به طور خاص، این کتاب نحوه انجام تجزیه و تحلیل داده های ساده و پیچیده و به کارگیری الگوریتم های یادگیری ماشینی را توضیح می دهد. از طریق گفتمان، قطعه کد و دفترچه یادداشت، شما قادر خواهید بود:
• Python، SQL، Scala، یا APIهای سطح بالای جاوا را بیاموزید: DataFrames و Datasets
• زیر کاپوت موتور Spark SQL نگاه کنید تا تغییرات و عملکرد Spark را درک کنید
• عملیات Spark خود را با تنظیمات Spark و Spark UI بررسی، تنظیم و اشکال زدایی کنید
• اتصال به منابع داده: JSON، Parquet، CSV، Avro، ORC، Hive، S3 یا Kafka
• تجزیه و تحلیل را روی داده های دسته ای و جریانی با استفاده از جریان ساختاری
انجام دهید
• خطوط لوله داده قابل اعتماد را با منبع باز دلتا لیک و اسپارک بسازید
• خطوط لوله یادگیری ماشین را با MLlib توسعه دهید و مدل هایی را با استفاده از MLflow تولید کنید
• از چارچوب پانداهای منبع باز کوالا و اسپارک برای تبدیل داده ها و مهندسی ویژگی ها استفاده کنید


Data is getting bigger, arriving faster, and coming in varied formats — and it all needs to be processed at scale for analytics or machine learning. How can you process such varied data workloads efficiently? Enter Apache Spark.

Updated to emphasize new features in Spark 2.x., this second edition shows data engineers and scientists why structure and unification in Spark matters. Specifically, this book explains how to perform simple and complex data analytics and employ machine-learning algorithms. Through discourse, code snippets, and notebooks, you’ll be able to:
• Learn Python, SQL, Scala, or Java high-level APIs: DataFrames and Datasets
• Peek under the hood of the Spark SQL engine to understand Spark transformations and performance
• Inspect, tune, and debug your Spark operations with Spark configurations and Spark UI
• Connect to data sources: JSON, Parquet, CSV, Avro, ORC, Hive, S3, or Kafka
• Perform analytics on batch and streaming data using Structured Streaming
• Build reliable data pipelines with open source Delta Lake and Spark
• Develop machine learning pipelines with MLlib and productionize models using MLflow
• Use open source Pandas framework Koalas and Spark for data transformation and feature engineering

دانلود کتاب «Learning Spark: Lightning-Fast Data Analytics»

مبلغی که بابت خرید کتاب می‌پردازیم به مراتب پایین‌تر از هزینه‌هایی است که در آینده بابت نخواندن آن خواهیم پرداخت.

📖 خرید این کتاب

برای دریافت فایل و اطلاع از قیمت، روی یکی از دکمه‌های زیر کلیک کنید تا پیام آماده برای شما ارسال شود:

پس از ارسال پیام، قیمت و لینک دریافت فایل در اسرع وقت برای شما ارسال خواهد شد.

دیدگاهتان را بنویسید