نرم افزار: سیستم ها: محاسبات علمی

یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع (مهندسی اتوماسیون و کنترل)

Reinforcement Learning and Dynamic Programming Using Function Approximators (Automation and Control Engineering)

دانلود کتاب Reinforcement Learning and Dynamic Programming Using Function Approximators (Automation and Control Engineering) (به فارسی: یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع (مهندسی اتوماسیون و کنترل)) نوشته شده توسط «Lucian Busoniu – Robert Babuska – Bart De Schutter – Damien Ernst»


اطلاعات کتاب یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع (مهندسی اتوماسیون و کنترل)

موضوع اصلی: کامپیوتر – علوم کامپیوتر

نوع: کتاب الکترونیکی

نویسنده: Lucian Busoniu – Robert Babuska – Bart De Schutter – Damien Ernst

زبان: english

فرمت کتاب: PDF (قابل تبدیل به سایر فرمت ها)

سال انتشار: 2010

تعداد صفحه: 280 / 275

حجم فایل: 8.34 مگابایت

کد کتاب: 1439821097 , 9781439821091

نوبت چاپ: 1

توضیحات کتاب یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع (مهندسی اتوماسیون و کنترل)

از لوازم خانگی گرفته تا کاربردها در رباتیک، سیستم های مهندسی شده که شامل دینامیک پیچیده است، فقط می توانند به اندازه الگوریتم هایی که آنها را کنترل می کنند مؤثر باشند. در حالی که برنامه‌نویسی پویا (DP) راهی برای حل بهینه مسائل تصمیم‌گیری و کنترل مربوط به سیستم‌های دینامیکی پیچیده در اختیار محققان قرار داده است، ارزش عملی آن توسط الگوریتم‌هایی که فاقد ظرفیت مقیاس‌سازی تا مسائل واقعی هستند، محدود شده است. با این حال، در سال‌های اخیر، پیشرفت‌های چشمگیر در یادگیری تقویتی (RL)، همتای بدون مدل DP، درک ما را از آنچه ممکن است تغییر داد. این پیشرفت‌ها منجر به ایجاد روش‌های قابل اعتمادی شد که می‌توان آن‌ها را حتی زمانی که یک مدل ریاضی از سیستم در دسترس نیست به کار برد، و به محققان این امکان را می‌دهد تا مسائل کنترل چالش‌برانگیز را در مهندسی، و همچنین در رشته‌های مختلف دیگر، از جمله اقتصاد، پزشکی، حل کنند. هوش مصنوعی یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع، کاوشی جامع و بی نظیر در زمینه RL و DP فراهم می کند. با تمرکز بر مسائل متغیر پیوسته، این متن اصلی به جزئیات تحولات اساسی می‌پردازد که در دهه گذشته این زمینه را به‌طور اساسی تغییر داده‌اند. در صفحات خود، متخصصان پیشگام، مقدمه ای مختصر بر RL و DP کلاسیک ارائه می کنند و به دنبال آن روش های پیشرفته و جدید در RL و DP با تقریب ارائه می شود. آنها با ترکیب توسعه الگوریتم با تضمین های نظری، کار خود را با مثال های گویا و مقایسه های روشنگر توضیح می دهند. سه فصل جداگانه به الگوریتم های نماینده از هر یک از کلاس های اصلی تکنیک ها اختصاص داده شده است: تکرار ارزش، تکرار خط مشی، و جستجوی خط مشی. ویژگی ها و عملکرد این الگوریتم ها در مطالعات تجربی گسترده بر روی طیف وسیعی از کاربردهای کنترل برجسته شده است. توسعه اخیر برنامه های کاربردی شامل سیستم های پیچیده منجر به افزایش علاقه به روش های RL و DP و نیاز متعاقب آن به یک منبع با کیفیت در مورد این موضوع شده است. برای دانشجویان فارغ التحصیل و سایر افراد تازه وارد در این زمینه، این کتاب مقدمه ای کامل بر اصول و روش های نوظهور ارائه می دهد. و برای آن دسته از محققین و دست اندرکارانی که در زمینه های کنترل بهینه و انطباقی، یادگیری ماشین، هوش مصنوعی و تحقیقات عملیاتی کار می کنند، این منبع ترکیبی از الگوریتم های عملی، تجزیه و تحلیل نظری و مثال های جامعی را ارائه می دهد که قادر به تطبیق و اعمال آن خواهند بود. به کار خودشون برای مطالب بیشتر، از جمله کد کامپیوتری مورد استفاده در مطالعات و اطلاعات مربوط به پیشرفت های جدید، به وب سایت نویسندگان به آدرس www.dcsc.tudelft.nl/rlbook/ مراجعه کنید.


From household appliances to applications in robotics, engineered systems involving complex dynamics can only be as effective as the algorithms that control them. While Dynamic Programming (DP) has provided researchers with a way to optimally solve decision and control problems involving complex dynamic systems, its practical value was limited by algorithms that lacked the capacity to scale up to realistic problems.  However, in recent years, dramatic developments in Reinforcement Learning (RL), the model-free counterpart of DP, changed our understanding of what is possible. Those developments led to the creation of reliable methods that can be applied even when a mathematical model of the system is unavailable, allowing researchers to solve challenging control problems in engineering, as well as in a variety of other disciplines, including economics, medicine, and artificial intelligence. Reinforcement Learning and Dynamic Programming Using Function Approximators provides a comprehensive and unparalleled exploration of the field of RL and DP. With a focus on continuous-variable problems, this seminal text details essential developments that have substantially altered the field over the past decade. In its pages, pioneering experts provide a concise introduction to classical RL and DP, followed by an extensive presentation of the state-of-the-art and novel methods in RL and DP with approximation. Combining algorithm development with theoretical guarantees, they elaborate on their work with illustrative examples and insightful comparisons. Three individual chapters are dedicated to representative algorithms from each of the major classes of techniques: value iteration, policy iteration, and policy search. The features and performance of these algorithms are highlighted in extensive experimental studies on a range of control applications. The recent development of applications involving complex systems has led to a surge of interest in RL and DP methods and the subsequent need for a quality resource on the subject. For graduate students and others new to the field, this book offers a thorough introduction to both the basics and emerging methods. And for those researchers and practitioners working in the fields of optimal and adaptive control, machine learning, artificial intelligence, and operations research, this resource offers a combination of practical algorithms, theoretical analysis, and comprehensive examples that they will be able to adapt and apply to their own work. Access the authors’ website at www.dcsc.tudelft.nl/rlbook/ for additional material, including computer code used in the studies and information concerning new developments.

دانلود کتاب «یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع (مهندسی اتوماسیون و کنترل)»

مبلغی که بابت خرید کتاب می‌پردازیم به مراتب پایین‌تر از هزینه‌هایی است که در آینده بابت نخواندن آن خواهیم پرداخت.

دیدگاهتان را بنویسید