تجارت

پردازش کلان داده با استفاده از Spark در ابر

Big Data Processing Using Spark in Cloud

دانلود کتاب Big Data Processing Using Spark in Cloud (به فارسی: پردازش کلان داده با استفاده از Spark در ابر) نوشته شده توسط «Mamta Mittal – Valentina E. Balas – Lalit Mohan Goyal – Raghvendra Kumar»


اطلاعات کتاب پردازش کلان داده با استفاده از Spark در ابر

موضوع اصلی: تجارت و اقتصاد

نوع: کتاب الکترونیکی

ناشر: Springer

نویسنده: Mamta Mittal – Valentina E. Balas – Lalit Mohan Goyal – Raghvendra Kumar

زبان: english

فرمت کتاب: PDF (قابل تبدیل به سایر فرمت ها)

سال انتشار: 2019

تعداد صفحه: 264 / 274

حجم فایل: 8.49 مگابایت

کد کتاب: 9811305501 , 9789811305504

توضیحات کتاب پردازش کلان داده با استفاده از Spark در ابر

این کتاب ظهور فناوری‌های کلان داده و نقش Spark در کل پشته کلان داده را توصیف می‌کند. Spark و Hadoop را با هم مقایسه می کند و کاستی های Hadoop را که توسط Spark برطرف شده است شناسایی می کند. این کتاب عمدتاً بر روی معماری عمیق Spark و درک ما از Spark RDD ها و اینکه چگونه RDD ماهیت تغییرناپذیر داده های بزرگ را تکمیل می کند، تمرکز دارد و آن را با ارزیابی تنبل، قابل ذخیره سازی و استنتاج نوع حل می کند. همچنین به موضوعات پیشرفته در Spark می پردازد که با اصول اولیه Scala و چارچوب اصلی Spark شروع می شود و فریم های داده Spark، یادگیری ماشین با استفاده از Mllib، تجزیه و تحلیل گراف با استفاده از Graph X و پردازش بلادرنگ با Apache Kafka، AWS Kenisis و Azure را بررسی می کند. مرکز رویداد. سپس به بررسی Spark با استفاده از PySpark و R ادامه می‌دهد. این کتاب با تمرکز بر پشته داده‌های بزرگ فعلی، تعامل با ابزارهای کلان داده فعلی را بررسی می‌کند، که Spark لایه پردازشی اصلی برای همه انواع داده است.

این کتاب برای مهندسان داده و دانشمندانی است که روی مجموعه داده های عظیم و فناوری های کلان داده در فضای ابری کار می کنند. علاوه بر متخصصان صنعت، برای متخصصان مشتاق پردازش داده و دانش آموزانی که در محیط های پردازش داده های بزرگ و محاسبات ابری کار می کنند مفید است.


The book describes the emergence of big data technologies and the role of Spark in the entire big data stack. It compares Spark and Hadoop and identifies the shortcomings of Hadoop that have been overcome by Spark. The book mainly focuses on the in-depth architecture of Spark and our understanding of Spark RDDs and how RDD complements big data’s immutable nature, and solves it with lazy evaluation, cacheable and type inference. It also addresses advanced topics in Spark, starting with the basics of Scala and the core Spark framework, and exploring Spark data frames, machine learning using Mllib, graph analytics using Graph X and real-time processing with Apache Kafka, AWS Kenisis, and Azure Event Hub. It then goes on to investigate Spark using PySpark and R. Focusing on the current big data stack, the book examines the interaction with current big data tools, with Spark being the core processing layer for all types of data.

The book is intended for data engineers and scientists working on massive datasets and big data technologies in the cloud. In addition to industry professionals, it is helpful for aspiring data processing professionals and students working in big data processing and cloud computing environments.

دانلود کتاب «پردازش کلان داده با استفاده از Spark در ابر»

مبلغی که بابت خرید کتاب می‌پردازیم به مراتب پایین‌تر از هزینه‌هایی است که در آینده بابت نخواندن آن خواهیم پرداخت.

دیدگاهتان را بنویسید