برنامه نويسي

تجزیه و تحلیل داده ها با پایتون و PySpark (نسخه نهایی)

Data Analysis with Python and PySpark (Final Release)

دانلود کتاب Data Analysis with Python and PySpark (Final Release) (به فارسی: تجزیه و تحلیل داده ها با پایتون و PySpark (نسخه نهایی)) نوشته شده توسط «Jonathan Rioux»


اطلاعات کتاب تجزیه و تحلیل داده ها با پایتون و PySpark (نسخه نهایی)

موضوع اصلی: کامپیوتر – برنامه نویسی

نوع: کتاب الکترونیکی

ناشر: Manning Publications

نویسنده: Jonathan Rioux

زبان: english

فرمت کتاب: PDF (قابل تبدیل به سایر فرمت ها)

سال انتشار: 2022

تعداد صفحه: 425

حجم فایل: 14.58 مگابایت

کد کتاب: 1617297208 , 9781617297205

توضیحات کتاب تجزیه و تحلیل داده ها با پایتون و PySpark (نسخه نهایی)

در مورد داده های خود بزرگ فکر کنید! PySpark موتور قدرتمند پردازش داده های بزرگ Spark را به اکوسیستم پایتون می آورد و به شما این امکان را می دهد تا وظایف داده خود را به طور یکپارچه افزایش دهید و خطوط لوله بسیار سریع ایجاد کنید.

در تجزیه و تحلیل داده ها با پایتون و PySpark شما یاد خواهید گرفت که چگونه:
• داده های خود را با مقیاس شدن در چندین ماشین مدیریت کنید
• برنامه های داده خود را با اطمینان کامل افزایش دهید
• خواندن و نوشتن داده ها از منابع و قالب های مختلف
• با داده های آشفته با قابلیت دستکاری داده PySpark برخورد کنید
• کشف مجموعه داده های جدید و انجام تجزیه و تحلیل داده های اکتشافی
• خطوط لوله داده خودکار بسازید که تبدیل، خلاصه و بینش از داده ها می شود
• عیب یابی خطاهای رایج PySpark
• ایجاد مشاغل طولانی مدت قابل اعتماد

تجزیه و تحلیل داده ها با Python و PySpark راهنمای شما برای ارائه پروژه های داده مبتنی بر پایتون موفق است. این کتاب کاربردی با نمونه‌های مرتبط و تکنیک‌های ضروری، به شما می‌آموزد که خطوط لوله را برای گزارش‌دهی، یادگیری ماشین و سایر وظایف داده محور بسازید. تمرینات سریع در هر فصل به شما کمک می کند تا آنچه را که آموخته اید تمرین کنید و به سرعت PySpark را در سیستم های داده خود پیاده سازی کنید. هیچ دانش قبلی در مورد Spark مورد نیاز نیست.

درباره فناوری
موتور پردازش داده Spark یک کارخانه تجزیه و تحلیل شگفت انگیز است: داده های خام وارد می شوند، بینش بیرون می آید. PySpark موتور اصلی Spark را با یک API مبتنی بر پایتون می‌پیچد. این به ساده‌سازی منحنی یادگیری پرشیب Spark کمک می‌کند و این ابزار قدرتمند را برای هر کسی که در اکوسیستم داده پایتون کار می‌کند در دسترس قرار می‌دهد.

درباره کتاب
تجزیه و تحلیل داده با Python و PySpark به شما کمک می کند تا چالش های روزانه علم داده را با PySpark حل کنید. شما یاد خواهید گرفت که چگونه قابلیت‌های پردازشی خود را در چندین ماشین مقیاس کنید، در حالی که داده‌ها را از هر منبعی دریافت می‌کنید – خواه خوشه‌های Hadoop، ذخیره‌سازی داده‌های ابری یا فایل‌های داده محلی باشد. هنگامی که اصول اولیه را پوشش دادید، تطبیق پذیری کامل PySpark را با ساخت خطوط لوله یادگیری ماشین و ترکیب Python، پانداها و کد PySpark کشف خواهید کرد.

آنچه در داخل است
• سازماندهی کد PySpark شما
• مدیریت داده های خود، بدون توجه به اندازه
• برنامه های داده خود را با اطمینان کامل افزایش دهید
• عیب یابی مشکلات رایج خط لوله داده
• ایجاد مشاغل طولانی مدت قابل اعتماد

درباره خواننده
نوشته شده برای دانشمندان داده و مهندسان داده که با پایتون راحت هستند.

درباره نویسنده
جاناتان ریوکس به عنوان مدیر ML برای یک شرکت نرم افزاری مبتنی بر داده، روزانه از PySpark استفاده می کند. او این نرم افزار را به دانشمندان داده، مهندسان و تحلیلگران کسب و کار باهوش داده آموزش می دهد.


Think big about your data! PySpark brings the powerful Spark big data processing engine to the Python ecosystem, letting you seamlessly scale up your data tasks and create lightning-fast pipelines.

In Data Analysis with Python and PySpark you will learn how to:
• Manage your data as it scales across multiple machines
• Scale up your data programs with full confidence
• Read and write data to and from a variety of sources and formats
• Deal with messy data with PySpark’s data manipulation functionality
• Discover new data sets and perform exploratory data analysis
• Build automated data pipelines that transform, summarize, and get insights from data
• Troubleshoot common PySpark errors
• Creating reliable long-running jobs

Data Analysis with Python and PySpark is your guide to delivering successful Python-driven data projects. Packed with relevant examples and essential techniques, this practical book teaches you to build pipelines for reporting, machine learning, and other data-centric tasks. Quick exercises in every chapter help you practice what you’ve learned, and rapidly start implementing PySpark into your data systems. No previous knowledge of Spark is required.

About the technology
The Spark data processing engine is an amazing analytics factory: raw data comes in, insight comes out. PySpark wraps Spark’s core engine with a Python-based API. It helps simplify Spark’s steep learning curve and makes this powerful tool available to anyone working in the Python data ecosystem.

About the book
Data Analysis with Python and PySpark helps you solve the daily challenges of data science with PySpark. You’ll learn how to scale your processing capabilities across multiple machines while ingesting data from any source—whether that’s Hadoop clusters, cloud data storage, or local data files. Once you’ve covered the fundamentals, you’ll explore the full versatility of PySpark by building machine learning pipelines, and blending Python, pandas, and PySpark code.

What’s inside
• Organizing your PySpark code
• Managing your data, no matter the size
• Scale up your data programs with full confidence
• Troubleshooting common data pipeline problems
• Creating reliable long-running jobs

About the reader
Written for data scientists and data engineers comfortable with Python.

About the author
As a ML director for a data-driven software company, Jonathan Rioux uses PySpark daily. He teaches the software to data scientists, engineers, and data-savvy business analysts.

دانلود کتاب «تجزیه و تحلیل داده ها با پایتون و PySpark (نسخه نهایی)»

مبلغی که بابت خرید کتاب می‌پردازیم به مراتب پایین‌تر از هزینه‌هایی است که در آینده بابت نخواندن آن خواهیم پرداخت.

برای دریافت کد تخفیف ۲۰ درصدی این کتاب، ابتدا صفحه اینستاگرام کازرون آنلاین (@kazerun.online ) را دنبال کنید. سپس، کلمه «بلیان» را در دایرکت ارسال کنید تا کد تخفیف به شما ارسال شود.

دیدگاهتان را بنویسید