دانلود کتاب The Data Wrangling Workshop: Create your own actionable insights using data from multiple raw sources, 2nd Edition (به فارسی: کارگاه مبارزه با داده ها: بینش عملی خود را با استفاده از داده های چند منبع خام، ویرایش دوم ایجاد کنید) نوشته شده توسط «Brian Lipp – Shubhadeep Roychowdhury – Dr. Tirthajyoti Sarkar»
اطلاعات کتاب کارگاه مبارزه با داده ها: بینش عملی خود را با استفاده از داده های چند منبع خام، ویرایش دوم ایجاد کنید
موضوع اصلی: کامپیوتر – پایگاه داده
نوع: کتاب الکترونیکی
ناشر: Packt Publishing
نویسنده: Brian Lipp – Shubhadeep Roychowdhury – Dr. Tirthajyoti Sarkar
زبان: english
فرمت کتاب: PDF (قابل تبدیل به سایر فرمت ها)
سال انتشار: 2020
تعداد صفحه: 576 / 575
حجم فایل: 15.65 مگابایت
کد کتاب: 1839215003 , 9781839215001
توضیحات کتاب کارگاه مبارزه با داده ها: بینش عملی خود را با استفاده از داده های چند منبع خام، ویرایش دوم ایجاد کنید
راهنمای مبتدی برای سادهسازی فرآیندهای استخراج، تبدیل، بارگذاری (ETL) با کمک نکات عملی، ترفندها و بهترین شیوهها، به روشی سرگرمکننده و تعاملی
کلید ویژگی ها
- کاوش در جدال داده ها با کمک مثال های دنیای واقعی و موارد استفاده تجاری
- روش های مختلف را مطالعه کنید تا بیشترین ارزش را از داده های خود در کمترین زمان استخراج کنید
- دانش خود را با موضوعات اضافی، مانند تولید تصادفی داده و بررسی یکپارچگی داده ها تقویت کنید
توضیحات کتاب
در حالی که حجم عظیمی از داده ها به راحتی در دسترس ما هستند، به شکل خام مفید نیستند. برای اینکه دادهها معنیدار باشند، باید آنها را مدیریت و اصلاح کنید.
اگر مبتدی هستید، کارگاه بحث جدال داده ها به شما کمک می کند تا این روند را برای شما شکسته شود. شما با اصول اولیه شروع میکنید و دانش خود را ایجاد میکنید، از جنبههای اصلی در پشت بحث دادهها تا استفاده از محبوبترین ابزارها و تکنیکها پیشرفت میکنید.
این کتاب با نشان دادن نحوه کار با ساختارهای داده با استفاده از پایتون شروع می شود. از طریق مثالها و فعالیتها، متوجه خواهید شد که چرا باید از روشهای سنتی پاکسازی دادهها که در زبانهای دیگر استفاده میشود دوری کنید و از روالهای از پیش ساخته شده تخصصی در پایتون استفاده کنید. بعداً، یاد خواهید گرفت که چگونه از همان بکاند پایتون برای استخراج و تبدیل دادهها از مجموعهای از منابع، از جمله اینترنت، خزانههای پایگاه داده بزرگ و جداول مالی اکسل استفاده کنید. برای کمک به شما برای آماده شدن برای سناریوهای چالش برانگیزتر، این کتاب به شما می آموزد که چگونه داده های گم شده یا نادرست را مدیریت کنید و آن ها را بر اساس الزامات ابزار تجزیه و تحلیل پایین دستی خود قالب بندی کنید.
در پایان این کتاب، شما درک کاملی از نحوه انجام جدال داده با پایتون خواهید داشت و چندین تکنیک و بهترین روش برای استخراج، پاکسازی، تبدیل و قالببندی کارآمد دادههای خود را یاد خواهید گرفت. از مجموعه ای متنوع از منابع.
آنچه یاد خواهید گرفت
- با اصول بحث و جدل داده ها آشنا شوید
- با نحوه مدل سازی داده ها با تولید تصادفی داده و بررسی یکپارچگی داده آشنا شوید.
- کشف نحوه بررسی داده ها با آمار توصیفی و تکنیک های ترسیم نمودار
- کاوش در مورد نحوه جستجو و بازیابی اطلاعات با عبارات منظم
- کاوش در علم داده رایج پایتون کتابخانه ها
- با نحوه مدیریت و جبران داده های از دست رفته به خوبی آشنا شوید
این کتاب برای چه کسانی است
کارگاه بحث جدال داده برای توسعه دهندگان، تحلیلگران داده، و تحلیلگران تجاری که به دنبال شغلی به عنوان یک دانشمند داده یا متخصص تجزیه و تحلیل تمام عیار هستند. اگرچه این کتاب برای مبتدیانی است که میخواهند بحث و جدل دادهها را شروع کنند، دانش قبلی زبان برنامهنویسی پایتون برای درک آسان مفاهیم زیر ضروری است. همچنین به داشتن دانش ابتدایی از پایگاه های داده رابطه ای و SQL کمک می کند.
فهرست مطالب
- مقدمه ای بر جدال داده با پایتون
- عملیات پیشرفته در ساختارهای داده داخلی
- مقدمه ای بر Numpy، Pandas، و Matplotlib
- غواصی عمیق در جدال داده با پایتون
- با انواع مختلف منابع داده راحت شوید
- یادگیری با اسرار پنهان کشمکش داده ها
- برداشتن وب پیشرفته و جمع آوری داده
- RDBMS و SQL
- کاربردها در موارد استفاده تجاری و نتیجه گیری از دوره
li>
A beginner’s guide to simplifying Extract, Transform, Load (ETL) processes with the help of hands-on tips, tricks, and best practices, in a fun and interactive way
Key Features
- Explore data wrangling with the help of real-world examples and business use cases
- Study various ways to extract the most value from your data in minimal time
- Boost your knowledge with bonus topics, such as random data generation and data integrity checks
Book Description
While a huge amount of data is readily available to us, it is not useful in its raw form. For data to be meaningful, it must be curated and refined.
If you’re a beginner, then The Data Wrangling Workshop will help to break down the process for you. You’ll start with the basics and build your knowledge, progressing from the core aspects behind data wrangling, to using the most popular tools and techniques.
This book starts by showing you how to work with data structures using Python. Through examples and activities, you’ll understand why you should stay away from traditional methods of data cleaning used in other languages and take advantage of the specialized pre-built routines in Python. Later, you’ll learn how to use the same Python backend to extract and transform data from an array of sources, including the internet, large database vaults, and Excel financial tables. To help you prepare for more challenging scenarios, the book teaches you how to handle missing or incorrect data, and reformat it based on the requirements from your downstream analytics tool.
By the end of this book, you will have developed a solid understanding of how to perform data wrangling with Python, and learned several techniques and best practices to extract, clean, transform, and format your data efficiently, from a diverse array of sources.
What you will learn
- Get to grips with the fundamentals of data wrangling
- Understand how to model data with random data generation and data integrity checks
- Discover how to examine data with descriptive statistics and plotting techniques
- Explore how to search and retrieve information with regular expressions
- Delve into commonly-used Python data science libraries
- Become well-versed with how to handle and compensate for missing data
Who this book is for
The Data Wrangling Workshop is designed for developers, data analysts, and business analysts who are looking to pursue a career as a full-fledged data scientist or analytics expert. Although this book is for beginners who want to start data wrangling, prior working knowledge of the Python programming language is necessary to easily grasp the concepts covered here. It will also help to have a rudimentary knowledge of relational databases and SQL.
Table of Contents
- Introduction to Data Wrangling with Python
- Advanced Operations on Built-In Data Structures
- Introduction to Numpy, Pandas, and Matplotlib
- A Deep Dive into Data Wrangling with Python
- Get Comfortable with Different Kinds of Data Sources
- Learning with Hidden Secrets of Data Wrangling
- Advanced Web Scrapping and Data Gathering
- RDBMS and SQL
- Applications in Business Use Cases and Conclusion of the Course
برای دریافت کد تخفیف ۲۰ درصدی این کتاب، ابتدا صفحه اینستاگرام کازرون آنلاین (@kazerun.online ) را دنبال کنید. سپس، کلمه «بلیان» را در دایرکت ارسال کنید تا کد تخفیف به شما ارسال شود.