دانلود کتاب Data Analysis with Python and PySpark (Final Release) (به فارسی: تجزیه و تحلیل داده ها با پایتون و PySpark (نسخه نهایی)) نوشته شده توسط «Jonathan Rioux»
اطلاعات کتاب تجزیه و تحلیل داده ها با پایتون و PySpark (نسخه نهایی)
موضوع اصلی: کامپیوتر – برنامه نویسی
نوع: کتاب الکترونیکی
ناشر: Manning Publications
نویسنده: Jonathan Rioux
زبان: english
فرمت کتاب: PDF (قابل تبدیل به سایر فرمت ها)
سال انتشار: 2022
تعداد صفحه: 425
حجم فایل: 14.58 مگابایت
کد کتاب: 1617297208 , 9781617297205
توضیحات کتاب تجزیه و تحلیل داده ها با پایتون و PySpark (نسخه نهایی)
در مورد داده های خود بزرگ فکر کنید! PySpark موتور قدرتمند پردازش داده های بزرگ Spark را به اکوسیستم پایتون می آورد و به شما این امکان را می دهد تا وظایف داده خود را به طور یکپارچه افزایش دهید و خطوط لوله بسیار سریع ایجاد کنید.
در تجزیه و تحلیل داده ها با پایتون و PySpark شما یاد خواهید گرفت که چگونه:
• داده های خود را با مقیاس شدن در چندین ماشین مدیریت کنید
• برنامه های داده خود را با اطمینان کامل افزایش دهید
• خواندن و نوشتن داده ها از منابع و قالب های مختلف
• با داده های آشفته با قابلیت دستکاری داده PySpark برخورد کنید
• کشف مجموعه داده های جدید و انجام تجزیه و تحلیل داده های اکتشافی
• خطوط لوله داده خودکار بسازید که تبدیل، خلاصه و بینش از داده ها می شود
• عیب یابی خطاهای رایج PySpark
• ایجاد مشاغل طولانی مدت قابل اعتماد
تجزیه و تحلیل داده ها با Python و PySpark راهنمای شما برای ارائه پروژه های داده مبتنی بر پایتون موفق است. این کتاب کاربردی با نمونههای مرتبط و تکنیکهای ضروری، به شما میآموزد که خطوط لوله را برای گزارشدهی، یادگیری ماشین و سایر وظایف داده محور بسازید. تمرینات سریع در هر فصل به شما کمک می کند تا آنچه را که آموخته اید تمرین کنید و به سرعت PySpark را در سیستم های داده خود پیاده سازی کنید. هیچ دانش قبلی در مورد Spark مورد نیاز نیست.
درباره فناوری
موتور پردازش داده Spark یک کارخانه تجزیه و تحلیل شگفت انگیز است: داده های خام وارد می شوند، بینش بیرون می آید. PySpark موتور اصلی Spark را با یک API مبتنی بر پایتون میپیچد. این به سادهسازی منحنی یادگیری پرشیب Spark کمک میکند و این ابزار قدرتمند را برای هر کسی که در اکوسیستم داده پایتون کار میکند در دسترس قرار میدهد.
درباره کتاب
تجزیه و تحلیل داده با Python و PySpark به شما کمک می کند تا چالش های روزانه علم داده را با PySpark حل کنید. شما یاد خواهید گرفت که چگونه قابلیتهای پردازشی خود را در چندین ماشین مقیاس کنید، در حالی که دادهها را از هر منبعی دریافت میکنید – خواه خوشههای Hadoop، ذخیرهسازی دادههای ابری یا فایلهای داده محلی باشد. هنگامی که اصول اولیه را پوشش دادید، تطبیق پذیری کامل PySpark را با ساخت خطوط لوله یادگیری ماشین و ترکیب Python، پانداها و کد PySpark کشف خواهید کرد.
آنچه در داخل است
• سازماندهی کد PySpark شما
• مدیریت داده های خود، بدون توجه به اندازه
• برنامه های داده خود را با اطمینان کامل افزایش دهید
• عیب یابی مشکلات رایج خط لوله داده
• ایجاد مشاغل طولانی مدت قابل اعتماد
درباره خواننده
نوشته شده برای دانشمندان داده و مهندسان داده که با پایتون راحت هستند.
درباره نویسنده
جاناتان ریوکس به عنوان مدیر ML برای یک شرکت نرم افزاری مبتنی بر داده، روزانه از PySpark استفاده می کند. او این نرم افزار را به دانشمندان داده، مهندسان و تحلیلگران کسب و کار باهوش داده آموزش می دهد.
In Data Analysis with Python and PySpark you will learn how to:
• Manage your data as it scales across multiple machines
• Scale up your data programs with full confidence
• Read and write data to and from a variety of sources and formats
• Deal with messy data with PySpark’s data manipulation functionality
• Discover new data sets and perform exploratory data analysis
• Build automated data pipelines that transform, summarize, and get insights from data
• Troubleshoot common PySpark errors
• Creating reliable long-running jobs
Data Analysis with Python and PySpark is your guide to delivering successful Python-driven data projects. Packed with relevant examples and essential techniques, this practical book teaches you to build pipelines for reporting, machine learning, and other data-centric tasks. Quick exercises in every chapter help you practice what you’ve learned, and rapidly start implementing PySpark into your data systems. No previous knowledge of Spark is required.
About the technology
The Spark data processing engine is an amazing analytics factory: raw data comes in, insight comes out. PySpark wraps Spark’s core engine with a Python-based API. It helps simplify Spark’s steep learning curve and makes this powerful tool available to anyone working in the Python data ecosystem.
About the book
Data Analysis with Python and PySpark helps you solve the daily challenges of data science with PySpark. You’ll learn how to scale your processing capabilities across multiple machines while ingesting data from any source—whether that’s Hadoop clusters, cloud data storage, or local data files. Once you’ve covered the fundamentals, you’ll explore the full versatility of PySpark by building machine learning pipelines, and blending Python, pandas, and PySpark code.
What’s inside
• Organizing your PySpark code
• Managing your data, no matter the size
• Scale up your data programs with full confidence
• Troubleshooting common data pipeline problems
• Creating reliable long-running jobs
About the reader
Written for data scientists and data engineers comfortable with Python.
About the author
As a ML director for a data-driven software company, Jonathan Rioux uses PySpark daily. He teaches the software to data scientists, engineers, and data-savvy business analysts.
دانلود کتاب «تجزیه و تحلیل داده ها با پایتون و PySpark (نسخه نهایی)»

برای دریافت کد تخفیف ۲۰ درصدی این کتاب، ابتدا صفحه اینستاگرام کازرون آنلاین (@kazerun.online ) را دنبال کنید. سپس، کلمه «بلیان» را در دایرکت ارسال کنید تا کد تخفیف به شما ارسال شود.