اتومات های یادگیری

اتومات های یادگیری


چکیده:
در دهه 1960میلادی Tsypkin روشی برای ساده کردن مسائل به مساله‌ای برای تشخیص پارامترهای بهینه معرفی کرد ‎و نخستین بار مسئله اتوماتای یادگیری توسط  Tsetlinدر اتحاد جماهیر شوروی مطرح شد Varshavski و Vorontsova بر روی اتوماتای تصادفی کار کردند. کارهای صورت گرفته عبارت بودند از: تئوری بازی، اتوماتای تصادفی در تخمین پارمترها، تشخیص الگو. McLaren روشهای بِروز رسانی خطی و ویژگیهایش و Chandrasekar و Shen روشهای بِروزرسانی غیر خطی را مطرح کردند. اتوماتایک ماشین است برای انجام خودکار یکسری اعمال یا جواب به مجموعه ای از دستورات. اتوماتای یادگیری یک شئ مجرداست که میتوان تعدادی عمل متناهی انجام دهد. اتوماتا ازمجموعه ی اقدام های خود یکی را انتخاب می کند و آنها را بر محیط اعمال میکند. اتوماتا از پاسخی که محیط به آن می دهد اقدام بعدی خودش را انتخاب میکند. نتیجه این کار بهینه عمل کردن اتوماتا است. هر عملی که انتخاب می شود در یک محیط احتمالی بررسی می شود و نتیجه این بررسی سیگنال مثبت یا منفی است که به اتوماتا داده می شود و اتوماتا از این جواب در انتخاب عمل بعدی استفاده می کند در واقع هدف نهایی این است که اتوماتا از بین کارهای خود کارهایی را انتخاب کند که احتمال گرفتن پاداش از محیط را به بیشترین حد خود برساند. یادگیری همان تغییرات ایجاد شده در کارایی یک سیستم بر اساس تجربه های گذشته است.                 
یادگیری موجودات زنده به دودسته تقسیم می شود:
1 .به شناخت اصول یادگیری موجودات زنده و مراحل آن می‌پردازند.
2. دنبال ارائه یک روش هستندبرای قراردادن این اصول در یک ماشین.
ویژگی مهم سیستمهای یادگیر: توانایی بهبود کارایی خود با گذشت زمان است.

فهرست مطالب:
چکیده
مقدمه
تاریخچه اتوماتای یادگیری
تعریفی از اتومات های یادگیری
اتوماتا
اتوماتای یادگیری تصادفی
یادگیری 
ویژگی مهم سیستمهای یادگیر
یادگیری نظارتی
یادگیری تقویتی
مزیت اصلی یادگیری تقویتی
تعریف مجموعه ی اتوماتای یادگیری
ساختار اتوماتا 
ساختار ثابت
انواع اتوماتاهای یادگیری با ساختار ثابت
ساختار متغیر
محیط
انواع رفتارهای اتوماتای یادگیری
اتوماتای یادگیری توزیع شده
پیش بینی حرکت کاربران در وب بااتوماتای توزیع شده
اتوماتاچه محدودیت هایی دارد
اتوماتا چه ویژگی هایی دارد
نحوه تشخیص اجتماعات وب بااتوماتای یادگیری سلولی
تعریفی ازاتوماتی سلولی
عملکرداتوماتای سلولی
الگوریتم HITS
ضریب پاداش
ضریب جریمه
خوشه بندی مورچه ها بااتوماتای یادگیری
مزیت خوشه بندی مورچه ها
تفاوت خوشه بندی مورچه ها
نتیجه گیری 
مراجع

تعداد مشاهده: 2226 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 25

حجم فایل:404 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته کامپیوتر و فناوری اطلاعات

  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش
    به همراه لیست منابع

یادگیری تقویتی

یادگیری تقویتی


بخشی از مقدمه:
حیوانات، انسان ها، اتومات ها و .. از خود رفتار های مختلفی در محیطی که آن ها را احاطه کرده، در شرایط مختلف، از خود نشان می دهند. آن ها کارهای مختلفی را به عنوان باز خورد در جواب ورودی هایی که از محیط می گیرند انجام می دهند. بعضی از این عامل ها رفتار های خود را در طول زمان عوض می کنند. آن ها ممکن است با دادن ورودی های یکسان، عمل های متفاوتی نسبت به حرکت های قبلی خود انجام دهند. چنین عاملی یاد می گیرد. شاخه یادگیری ماشین به مطالعه الگوریتم های یادگیری که مشخص می کند تغییر در ورودی ها چگونه در رفتار عامل تغییر ایجاد می کند می پردازد. الگوریتم های یادگیری به 3 دسته تقسیم می شوند: ...

فهرست مطالب:
معرفی یادگیری تقویتی
برنامه نویسی پویا
اجزا یک سیستم یادگیری تقویتی
 محیط
 تابع پاداش
 تابع مقدار
 Q-Learning
 معرفی
 الگوریتم یادگیری
 مثالی از یک عامل
 مثالی از برج هانوی
 اثبات همگرایی
 یادگیری Q برای MDP غیرقطعی
 روش های مونت کارلو در یادگیری تقویتی
 ویژگیها
 سیاست first visit MC
 کنترل مونت کارلو
 همگرایی مونت کارلو
on line policy و off linepolicy
منابع

تعداد مشاهده: 2554 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 25

حجم فایل:718 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    گزارش کاربردی و تصویری و گام به گام
    مناسب جهت استفاده دانشجویان رشته کامپیوتر و فناوری اطلاعات


  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش