دانلود کتاب Python Data Cleaning Cookbook: Modern techniques and Python tools to detect and remove dirty data to extract key insights (به فارسی: کتاب آشپزی پاکسازی دادههای پایتون: تکنیکهای مدرن و ابزار پایتون برای شناسایی و حذف دادههای کثیف برای استخراج بینشهای کلیدی) نوشته شده توسط «Michael Walker»
اطلاعات کتاب کتاب آشپزی پاکسازی دادههای پایتون: تکنیکهای مدرن و ابزار پایتون برای شناسایی و حذف دادههای کثیف برای استخراج بینشهای کلیدی
موضوع اصلی: کامپیوتر – پایگاه داده
نوع: کتاب الکترونیکی
ناشر: Packt Publishing
نویسنده: Michael Walker
زبان: english
فرمت کتاب: EPUB (قابل تبدیل به سایر فرمت ها)
سال انتشار: 2021
تعداد صفحه: 344
حجم فایل: 3.05 مگابایت
کد کتاب: 1800565666 , 9781800565661
توضیحات کتاب کتاب آشپزی پاکسازی دادههای پایتون: تکنیکهای مدرن و ابزار پایتون برای شناسایی و حذف دادههای کثیف برای استخراج بینشهای کلیدی
دریابید که چگونه داده های خود را با جزئیات توصیف کنید، مشکلات داده را شناسایی کنید، و نحوه حل آنها را با استفاده از تکنیک ها و نکات و ترفندهای رایج بیابید
ویژگی های کلیدی
- با تکنیکهای مختلف پاکسازی دادهها برای آشکار کردن بینشهای کلیدی آشنا شوید
- دادهها را با پیچیدگیهای مختلف دستکاری کنید تا آنها را به شکل مناسب مطابق با نیازهای کسبوکار خود شکل دهید
- پاک کردن، نظارت، و اعتبارسنجی حجم زیاد داده برای تشخیص مشکلات قبل از رفتن به تجزیه و تحلیل داده
توضیحات کتاب
به دست آوردن داده های تمیز برای آشکارسازی بینش ضروری است، زیرا پرش مستقیم به تجزیه و تحلیل داده ها بدون پاکسازی مناسب داده ها ممکن است منجر به نتایج نادرست شود. این کتاب ابزارها و تکنیکهایی را به شما نشان میدهد که میتوانید برای تمیز کردن و مدیریت دادهها با پایتون به کار ببرید.
شما با آشنایی با شکل دادهها با استفاده از روشهایی که میتوان به طور معمول در اکثر منابع داده به کار گرفته شود، شروع میکنید. . سپس، این کتاب به شما می آموزد که چگونه داده ها را دستکاری کنید تا آنها را به شکل مفیدی درآورید. همچنین یاد خواهید گرفت که چگونه داده ها را فیلتر و خلاصه کنید تا بینش به دست آورید و بهتر درک کنید چه چیزی منطقی است و چه چیزی نیست، همراه با کشف نحوه کار بر روی داده ها برای رسیدگی به مسائلی که شناسایی کرده اید. با ادامه کار، کارهای کلیدی مانند رسیدگی به مقادیر از دست رفته، اعتبارسنجی خطاها، حذف داده های تکراری، نظارت بر حجم بالای داده ها، و رسیدگی به موارد پرت و تاریخ های نامعتبر را انجام خواهید داد. در مرحله بعد، دستورالعملهای استفاده از یادگیری نظارتشده و تجزیه و تحلیل Naive Bayes را برای شناسایی مقادیر غیرمنتظره و خطاهای طبقهبندی، و ایجاد تجسم برای تجزیه و تحلیل دادههای اکتشافی (EDA) برای تجسم مقادیر غیرمنتظره پوشش خواهید داد. در نهایت، توابع و کلاسهایی میسازید که میتوانید در صورت داشتن دادههای جدید، بدون تغییر مجدداً از آنها استفاده کنید.
در پایان این کتاب پایتون، به تمام مهارتهای کلیدی که برای آن نیاز دارید مجهز خواهید شد. داده ها را پاک کنید و مشکلات را در آنها تشخیص دهید.
آنچه یاد خواهید گرفت
- چگونگی خواندن و تجزیه و تحلیل داده ها را از منابع مختلف بیاموزید
- خلاصه ای از ویژگی های چارچوب داده تهیه کنید. ، ستونها و ردیفها
- دادهها را فیلتر کنید و ستونهای مورد علاقه را که معیارهای داده شده را برآورده میکنند انتخاب کنید
- به مشکلات دادههای آشفته، از جمله کار با تاریخها و مقادیر گمشده رسیدگی کنید
- بهبود بهره وری شما در پانداهای پایتون با استفاده از روش زنجیره ای
- از تجسم ها برای به دست آوردن بینش بیشتر و شناسایی مشکلات احتمالی داده استفاده کنید
- توانایی خود را برای یادگیری آنچه در داده های شما می گذرد افزایش دهید
- ساخت توابع و کلاسهای تعریفشده توسط کاربر برای تمیز کردن خودکار دادهها
این کتاب برای چه کسی است
این کتاب برای کسانی است که به دنبال راههایی برای مدیریت دادههای کثیف، تکراری و ضعیف ما هستند. استفاده از ابزارها و تکنیک های مختلف پایتون این کتاب یک رویکرد مبتنی بر دستور العمل دارد تا به شما کمک کند تا نحوه تمیز کردن و مدیریت داده ها را بیاموزید. دانش برنامه نویسی پایتون تنها چیزی است که برای استفاده حداکثری از کتاب نیاز دارید.
Discover how to describe your data in detail, identify data issues, and find out how to solve them using commonly used techniques and tips and tricks
Key Features
- Get well-versed with various data cleaning techniques to reveal key insights
- Manipulate data of different complexities to shape them into the right form as per your business needs
- Clean, monitor, and validate large data volumes to diagnose problems before moving on to data analysis
Book Description
Getting clean data to reveal insights is essential, as directly jumping into data analysis without proper data cleaning may lead to incorrect results. This book shows you tools and techniques that you can apply to clean and handle data with Python.
You’ll begin by getting familiar with the shape of data by using practices that can be deployed routinely with most data sources. Then, the book teaches you how to manipulate data to get them into a useful form. You’ll also learn how to filter and summarize data to gain insights and better understand what makes sense and what does not, along with discovering how to operate on data to address the issues you’ve identified. Moving on, you’ll perform key tasks such as handling missing values, validating errors, removing duplicate data, monitoring high volumes of data, and handling outliers and invalid dates. Next, you’ll cover recipes on using supervised learning and Naive Bayes analysis to identify unexpected values and classification errors, and generate visualizations for exploratory data analysis (EDA) to visualize unexpected values. Finally, you’ll build functions and classes that you can reuse without modifying when you have new data.
By the end of this Python book, you’ll be equipped with all the key skills that you need to clean data and diagnose problems in it.
What you will learn
- Find out how to read and analyze data from a variety of sources
- Produce summaries of the attributes of data frames, columns, and rows
- Filter data and select columns of interest that satisfy given criteria
- Address messy data issues, including working with dates and missing values
- Improve your productivity in Python pandas using method chaining
- Use visualizations to gain additional insights and identify potential data issues
- Enhance your ability to learn what is going on in your data
- Build user-defined functions and classes to automate data cleaning
Who This Book Is For
This book is for anyone looking for ways to handle messy, duplicate, and poor data using different Python tools and techniques. The book takes a recipe-based approach to help you to learn how to clean and manage data. Working knowledge of Python programming is all you need to get the most out of the book.
برای دریافت کد تخفیف ۲۰ درصدی این کتاب، ابتدا صفحه اینستاگرام کازرون آنلاین (@kazerun.online ) را دنبال کنید. سپس، کلمه «بلیان» را در دایرکت ارسال کنید تا کد تخفیف به شما ارسال شود.