دانلود کتاب Reinforcement Learning and Dynamic Programming Using Function Approximators (Automation and Control Engineering) (به فارسی: یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع (مهندسی اتوماسیون و کنترل)) نوشته شده توسط «Lucian Busoniu – Robert Babuska – Bart De Schutter – Damien Ernst»
اطلاعات کتاب یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع (مهندسی اتوماسیون و کنترل)
موضوع اصلی: کامپیوتر – علوم کامپیوتر
نوع: کتاب الکترونیکی
نویسنده: Lucian Busoniu – Robert Babuska – Bart De Schutter – Damien Ernst
زبان: english
فرمت کتاب: PDF (قابل تبدیل به سایر فرمت ها)
سال انتشار: 2010
تعداد صفحه: 280 / 275
حجم فایل: 8.34 مگابایت
کد کتاب: 1439821097 , 9781439821091
نوبت چاپ: 1
توضیحات کتاب یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع (مهندسی اتوماسیون و کنترل)
از لوازم خانگی گرفته تا کاربردها در رباتیک، سیستم های مهندسی شده که شامل دینامیک پیچیده است، فقط می توانند به اندازه الگوریتم هایی که آنها را کنترل می کنند مؤثر باشند. در حالی که برنامهنویسی پویا (DP) راهی برای حل بهینه مسائل تصمیمگیری و کنترل مربوط به سیستمهای دینامیکی پیچیده در اختیار محققان قرار داده است، ارزش عملی آن توسط الگوریتمهایی که فاقد ظرفیت مقیاسسازی تا مسائل واقعی هستند، محدود شده است. با این حال، در سالهای اخیر، پیشرفتهای چشمگیر در یادگیری تقویتی (RL)، همتای بدون مدل DP، درک ما را از آنچه ممکن است تغییر داد. این پیشرفتها منجر به ایجاد روشهای قابل اعتمادی شد که میتوان آنها را حتی زمانی که یک مدل ریاضی از سیستم در دسترس نیست به کار برد، و به محققان این امکان را میدهد تا مسائل کنترل چالشبرانگیز را در مهندسی، و همچنین در رشتههای مختلف دیگر، از جمله اقتصاد، پزشکی، حل کنند. هوش مصنوعی یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع، کاوشی جامع و بی نظیر در زمینه RL و DP فراهم می کند. با تمرکز بر مسائل متغیر پیوسته، این متن اصلی به جزئیات تحولات اساسی میپردازد که در دهه گذشته این زمینه را بهطور اساسی تغییر دادهاند. در صفحات خود، متخصصان پیشگام، مقدمه ای مختصر بر RL و DP کلاسیک ارائه می کنند و به دنبال آن روش های پیشرفته و جدید در RL و DP با تقریب ارائه می شود. آنها با ترکیب توسعه الگوریتم با تضمین های نظری، کار خود را با مثال های گویا و مقایسه های روشنگر توضیح می دهند. سه فصل جداگانه به الگوریتم های نماینده از هر یک از کلاس های اصلی تکنیک ها اختصاص داده شده است: تکرار ارزش، تکرار خط مشی، و جستجوی خط مشی. ویژگی ها و عملکرد این الگوریتم ها در مطالعات تجربی گسترده بر روی طیف وسیعی از کاربردهای کنترل برجسته شده است. توسعه اخیر برنامه های کاربردی شامل سیستم های پیچیده منجر به افزایش علاقه به روش های RL و DP و نیاز متعاقب آن به یک منبع با کیفیت در مورد این موضوع شده است. برای دانشجویان فارغ التحصیل و سایر افراد تازه وارد در این زمینه، این کتاب مقدمه ای کامل بر اصول و روش های نوظهور ارائه می دهد. و برای آن دسته از محققین و دست اندرکارانی که در زمینه های کنترل بهینه و انطباقی، یادگیری ماشین، هوش مصنوعی و تحقیقات عملیاتی کار می کنند، این منبع ترکیبی از الگوریتم های عملی، تجزیه و تحلیل نظری و مثال های جامعی را ارائه می دهد که قادر به تطبیق و اعمال آن خواهند بود. به کار خودشون برای مطالب بیشتر، از جمله کد کامپیوتری مورد استفاده در مطالعات و اطلاعات مربوط به پیشرفت های جدید، به وب سایت نویسندگان به آدرس www.dcsc.tudelft.nl/rlbook/ مراجعه کنید.