
دانلود کتاب Learning Spark: Lightning-Fast Data Analytics (به فارسی: Learning Spark: Lightning-Fast Data Analytics) نوشته شده توسط «Jules S. Damji – Brooke Wenig – Tathagata Das – Denny Lee»
اطلاعات کتاب Learning Spark: Lightning-Fast Data Analytics
موضوع اصلی: کامپیوتر – برنامه نویسی
نوع: کتاب الکترونیکی
ناشر: O’Reilly Media
نویسنده: Jules S. Damji – Brooke Wenig – Tathagata Das – Denny Lee
زبان: english
فرمت کتاب: PDF (قابل تبدیل به سایر فرمت ها)
سال انتشار: 2020
تعداد صفحه: 300 / 399
حجم فایل: 15.31 مگابایت
کد کتاب: 1492050040 , 9781492050049
نوبت چاپ: 2
توضیحات کتاب Learning Spark: Lightning-Fast Data Analytics
دادهها بزرگتر میشوند، سریعتر میرسند و در قالبهای متنوعی میآیند – و همه باید در مقیاس برای تجزیه و تحلیل یا یادگیری ماشین پردازش شوند. چگونه می توانید چنین حجم کاری داده های متنوعی را به طور موثر پردازش کنید؟ Apache Spark را وارد کنید.
این ویرایش دوم که برای تأکید بر ویژگیهای جدید در Spark 2.x بهروزرسانی شده است، به مهندسان داده و دانشمندان نشان میدهد که چرا ساختار و یکپارچگی در Spark مهم است. به طور خاص، این کتاب نحوه انجام تجزیه و تحلیل داده های ساده و پیچیده و به کارگیری الگوریتم های یادگیری ماشینی را توضیح می دهد. از طریق گفتمان، قطعه کد و دفترچه یادداشت، شما قادر خواهید بود:
• Python، SQL، Scala، یا APIهای سطح بالای جاوا را بیاموزید: DataFrames و Datasets
• زیر کاپوت موتور Spark SQL نگاه کنید تا تغییرات و عملکرد Spark را درک کنید
• عملیات Spark خود را با تنظیمات Spark و Spark UI بررسی، تنظیم و اشکال زدایی کنید
• اتصال به منابع داده: JSON، Parquet، CSV، Avro، ORC، Hive، S3 یا Kafka
• تجزیه و تحلیل را روی داده های دسته ای و جریانی با استفاده از جریان ساختاری
انجام دهید
• خطوط لوله داده قابل اعتماد را با منبع باز دلتا لیک و اسپارک بسازید
• خطوط لوله یادگیری ماشین را با MLlib توسعه دهید و مدل هایی را با استفاده از MLflow تولید کنید
• از چارچوب پانداهای منبع باز کوالا و اسپارک برای تبدیل داده ها و مهندسی ویژگی ها استفاده کنید
Updated to emphasize new features in Spark 2.x., this second edition shows data engineers and scientists why structure and unification in Spark matters. Specifically, this book explains how to perform simple and complex data analytics and employ machine-learning algorithms. Through discourse, code snippets, and notebooks, you’ll be able to:
• Learn Python, SQL, Scala, or Java high-level APIs: DataFrames and Datasets
• Peek under the hood of the Spark SQL engine to understand Spark transformations and performance
• Inspect, tune, and debug your Spark operations with Spark configurations and Spark UI
• Connect to data sources: JSON, Parquet, CSV, Avro, ORC, Hive, S3, or Kafka
• Perform analytics on batch and streaming data using Structured Streaming
• Build reliable data pipelines with open source Delta Lake and Spark
• Develop machine learning pipelines with MLlib and productionize models using MLflow
• Use open source Pandas framework Koalas and Spark for data transformation and feature engineering
دانلود کتاب «Learning Spark: Lightning-Fast Data Analytics»

📖 خرید این کتاب
برای دریافت فایل و اطلاع از قیمت، روی یکی از دکمههای زیر کلیک کنید تا پیام آماده برای شما ارسال شود:
پس از ارسال پیام، قیمت و لینک دریافت فایل در اسرع وقت برای شما ارسال خواهد شد.