پایگاه های داده

SQL برای علم داده: تمیز کردن داده ها، بحث و تجزیه و تحلیل با پایگاه های داده رابطه ای

SQL for Data Science: Data Cleaning, Wrangling and Analytics with Relational Databases

دانلود کتاب SQL for Data Science: Data Cleaning, Wrangling and Analytics with Relational Databases (به فارسی: SQL برای علم داده: تمیز کردن داده ها، بحث و تجزیه و تحلیل با پایگاه های داده رابطه ای) نوشته شده توسط «Antonio Badia»


اطلاعات کتاب SQL برای علم داده: تمیز کردن داده ها، بحث و تجزیه و تحلیل با پایگاه های داده رابطه ای

موضوع اصلی: کامپیوتر – پایگاه داده

نوع: کتاب الکترونیکی

ناشر: Springer

نویسنده: Antonio Badia

زبان: english

فرمت کتاب: PDF (قابل تبدیل به سایر فرمت ها)

سال انتشار: 2020

تعداد صفحه: 285 / 290

حجم فایل: 2.80 مگابایت

کد کتاب: 3030575926 , 9783030575922

نوبت چاپ: 1

توضیحات کتاب SQL برای علم داده: تمیز کردن داده ها، بحث و تجزیه و تحلیل با پایگاه های داده رابطه ای

این کتاب درسی SQL را در زمینه علم داده توضیح می‌دهد و بخش‌های مختلف SQL را برای کارهایی که معمولاً در طول تجزیه و تحلیل داده‌ها انجام می‌شوند، مورد نیاز است، معرفی می‌کند. با استفاده از چارچوب چرخه عمر داده، بر مراحلی تمرکز می‌کند که اغلب در کتاب‌های درسی سنتی تغییر کوتاهی داده می‌شود، مانند بارگیری داده‌ها، تمیز کردن و پیش پردازش.

کتاب سازمان‌دهی شده است. به شرح زیر است. فصل 1 چرخه عمر داده ها را شرح می دهد، یعنی دنباله ای از مراحل از اکتساب داده تا بایگانی، که داده ها هنگام تهیه و سپس تجزیه و تحلیل واقعی، همراه با فعالیت های مختلفی که در هر مرحله انجام می شود، طی می شوند. فصل 2 به درستی به پایگاه های داده می پردازد و توضیح می دهد که چگونه پایگاه های داده رابطه ای داده ها را سازماندهی می کنند. داده های غیر سنتی مانند XML و متن نیز پوشش داده شده است. فصل 3 پرس‌و‌جوهای SQL را معرفی می‌کند، اما برخلاف کتاب‌های درسی سنتی، پرس‌و‌جوها و بخش‌های آن‌ها حول وظایف تجزیه و تحلیل داده‌های معمولی مانند کاوش داده، تمیز کردن و تبدیل توضیح داده می‌شوند. فصل 4 چند تکنیک اساسی برای تجزیه و تحلیل داده ها را معرفی می کند و نشان می دهد که چگونه می توان از SQL برای برخی از تجزیه و تحلیل های ساده بدون پیچیدگی زیاد استفاده کرد. فصل 5 ساختارهای SQL اضافی را معرفی می کند که در موقعیت های مختلف مهم هستند و بنابراین پوشش پرس و جوهای SQL را کامل می کند. در نهایت، فصل 6 به طور خلاصه نحوه استفاده از SQL از داخل R و از داخل برنامه های پایتون را توضیح می دهد. این زبان بر نحوه تعامل این زبان‌ها با پایگاه داده تمرکز می‌کند و چگونه می‌توان از آنچه در مورد SQL آموخته شده استفاده کرد تا در هنگام استفاده از R یا Python زندگی را آسان‌تر کند. همه فصل‌ها شامل مثال‌ها و تمرین‌های زیادی در راه هستند، و خوانندگان تشویق می‌شوند دو سیستم پایگاه داده منبع باز (MySQL و Postgres) را که در سراسر کتاب استفاده می‌شوند، برای تمرین و کار روی تمرین‌ها نصب کنند، زیرا به سادگی خواندن این کتاب بسیار کمتر از استفاده واقعی از آن مفید است.

این کتاب برای هر کسی که به علم داده و/یا پایگاه داده علاقه‌مند است مناسب است. این فقط به کمی تسلط کامپیوتری نیاز دارد، اما هیچ پیشینه خاصی در پایگاه داده یا تجزیه و تحلیل داده ها وجود ندارد. همه مفاهیم به طور مستقیم و با حداقل اصطلاحات تخصصی معرفی شده اند. پس از مطالعه این کتاب، خوانندگان باید بتوانند با سودآوری اطلاعات بیشتری در مورد داده کاوی، یادگیری ماشینی و مدیریت پایگاه داده از کتاب های درسی و دوره های پیشرفته تر بیاموزند.


This textbook explains SQL within the context of data science and introduces the different parts of SQL as they are needed for the tasks usually carried out during data analysis. Using the framework of the data life cycle, it focuses on the steps that are very often given the short shift in traditional textbooks, like data loading, cleaning and pre-processing.

The book is organized as follows. Chapter 1 describes the data life cycle, i.e. the sequence of stages from data acquisition to archiving, that data goes through as it is prepared and then actually analyzed, together with the different activities that take place at each stage. Chapter 2 gets into databases proper, explaining how relational databases organize data. Non-traditional data, like XML and text, are also covered. Chapter 3 introduces SQL queries, but unlike traditional textbooks, queries and their parts are described around typical data analysis tasks like data exploration, cleaning and transformation. Chapter 4 introduces some basic techniques for data analysis and shows how SQL can be used for some simple analyses without too much complication. Chapter 5 introduces additional SQL constructs that are important in a variety of situations and thus completes the coverage of SQL queries. Lastly, chapter 6 briefly explains how to use SQL from within R and from within Python programs. It focuses on how these languages can interact with a database, and how what has been learned about SQL can be leveraged to make life easier when using R or Python. All chapters contain a lot of examples and exercises on the way, and readers are encouraged to install the two open-source database systems (MySQL and Postgres) that are used throughout the book in order to practice and work on the exercises, because simply reading the book is much less useful than actually using it.

This book is for anyone interested in data science and/or databases. It just demands a bit of computer fluency, but no specific background on databases or data analysis. All concepts are introduced intuitively and with a minimum of specialized jargon. After going through this book, readers should be able to profitably learn more about data mining, machine learning, and database management from more advanced textbooks and courses.

دانلود کتاب «SQL برای علم داده: تمیز کردن داده ها، بحث و تجزیه و تحلیل با پایگاه های داده رابطه ای»

مبلغی که بابت خرید کتاب می‌پردازیم به مراتب پایین‌تر از هزینه‌هایی است که در آینده بابت نخواندن آن خواهیم پرداخت.

📖 خرید این کتاب

برای دریافت فایل و اطلاع از قیمت، روی یکی از دکمه‌های زیر کلیک کنید تا پیام آماده برای شما ارسال شود:

پس از ارسال پیام، قیمت و لینک دریافت فایل در اسرع وقت برای شما ارسال خواهد شد.

دیدگاهتان را بنویسید