میرنیوز

ربات ارزانی که از طریق یادگیری تقویتی می‌آموزد

2020-12-06T17:13:14+03:30

به گزارش ایسنا و به نقل از آی ای، محققان دانشگاه "آلتو"(Aalto) و شرکت "OTE Robotics" ربات کم هزینه‌ای را تولید کرده‌اند که می‌تواند برای آزمایش الگوریتم‌های "یادگیری تقویتی"(RL) مورد استفاده قرار گیرد.

این ربات که "RealAnt" نامیده می‌شود تنها با قیمت ۸۹۹ یورو(۱۰۹۰ دلار آمریکا) کاملا مقرون به صرفه است.

یادگیری تقویتی یکی از گرایش‌های یادگیری ماشینی است که از روانشناسی رفتارگرایی الهام می‌گیرد. این روش بر رفتارهایی تمرکز دارد که ماشین باید برای بیشینه کردن پاداشش انجام دهد. این مسئله با توجه به گستردگی‌اش در زمینه‌های گوناگونی مانند نظریه بازی‌ها، نظریه کنترل، تحقیق در عملیات، نظریه اطلاعات، سامانه چندعامله، هوش ازدحامی، آمار، الگوریتم ژنتیک، بهینه‌سازی بر مبنای شبیه‌سازی بررسی می‌شود.

در مبحث تحقیق در عملیات و در ادبیات کنترل، حوزه‌ای که در آن روش یادگیری تقویتی مطالعه می‌شود "برنامه‌نویسی تخمینی پویا"(approximate dynamic programming) خوانده می‌شود. این مسئله در تئوری کنترل بهینه نیز مطالعه شده‌ است. البته دغدغه اصلی بیشتر مطالعات در این زمینه، اثبات وجود پاسخ بهینه و یافتن ویژگی‌های آن است و به دنبال جزئیات یادگیری یا تخمین نیست. یادگیری تقویتی در اقتصاد و نظریه بازی‌ها بیشتر به بررسی تعادل‌های ایجاد شده تحت عقلانیت محدود می‌پردازد.

در یادگیری ماشینی با توجه به این که بسیاری از الگوریتم‌های یادگیری تقویتی از تکنیک‌های برنامه‌نویسی پویا استفاده می‌کنند. تفاوت اصلی بین روش‌های سنتی و الگوریتم‌های یادگیری تقویتی این است که در یادگیری تقویتی نیازی به داشتن اطلاعات راجع به فرآیند تصمیم‌گیری نیست.

یادگیری تقویتی با یادگیری با نظارت معمول دو تفاوت عمده دارد، نخست اینکه در آن زوج‌های صحیح ورودی و خروجی در کار نیست و رفتارهای ناکارآمد نیز از بیرون اصلاح نمی‌شوند و دیگر آنکه تمرکز زیادی روی کارایی زنده وجود دارد که نیازمند پیدا کردن یک تعادل مناسب بین اکتشاف چیزهای جدید و بهره‌برداری از دانش اندوخته شده دارد.

"جوسی ساینیو" یکی از بنیانگذاران شرکت "Ote Robotics" می‌گوید: الهامات اولیه برای کار ما مطالعات یادگیری تقویتی(RL) بود که با موفقیت، یادگیری راه رفتن از ابتدا از روی شبیه‌سازی‌های ربات‌های چهارپا و شبه انسان را نشان داد.

وی افزود: پیش فرض اساسی در مورد الگوریتم‌های یادگیری تقویتی این است که برنامه نویسی یک ربات برای انجام کارها با آن بسیار آسان‌تر و طبیعی‌تر می‌شود و تنها به تعریف اندازه‌گیری های حسگر موجود، اقدامات حرکتی و سپس تعیین یک هدف و اتصال همه آنها به یک الگوریتم یادگیری تقویتی است که بقیه کارها را این الگوریتم انجام می‌دهد.

"یادگیری تقویتی"(RL) قبلاً به هزاران ساعت آموزش شبیه‌سازی ربات نیاز داشت. با این حال، اخیراً محققان موفق شده‌اند با داده‌های آموزشی بسیار کم، راه رفتن را به این ربات‌ها آموزش دهند. این بدان معناست که ربات‌ها اکنون می‌توانند بدون استفاده از آموزش طولانی مدت مبتنی بر شبیه سازی، در محیط‌های واقعی آموزش ببینند.

"ساینیو" توضیح داد: ما متوجه شدیم که ربات‌های متحرک مانند "RealAnt" به ویژه برای یادگیری تقویتی به راحتی و با قیمت مناسب در دسترس نیستند و این موضوع می‌تواند به ربات‌ها آسیب برساند.

وی افزود: در مقایسه با محیط شبیه‌سازی شده، هیچ پشتوانه ترکیبی نرم افزاری و سخت افزاری کاملی وجود ندارد که بتوان با آن یادگیری تقویتی را در دنیای واقعی شروع کرد. بنابراین من شروع به ساخت نمونه‌های اولیه نرم افزار ربات و رابط خودم کردم.

در نهایت "ساینیو" موفق به ساخت نمونه‌های اولیه قابل توجهی شد.

بنا به اعلام وبسایت "Ote robotics"، پلتفرم ربات "RealAnt" برای تحقیق و توسعه یادگیری تقویتی در دنیای واقعی طراحی شده است.

انتهای پیام

منبع : خبرگزاری ایسنا

کلمات کلیدی : میرنیوز یادگیری تقویتی ربات
اشتراک گذاری :

آخرین اخبار علمی

نیروهای پلیس راهور سفیر اهدای عضو شدند

2024-11-26T16:40:44+03:30

جلسه توجیهی ویژه کارکنان نیروهای پلیس راهور تهران بزرگ با حضور بیش از ۱۰۰ نفر در سالن الغدیر پلیس راهور برگزار شد.

حضور ۱۸ شرکت‌ دانش‌بنیان در نمایشگاه صنعت بازی رایانه‌ای روسیه

2024-11-26T16:14:03+03:30

هیئت تجاری متشکل از شرکت‌های دانش‌بنیان کشورمان با حمایت صندوق نوآوری و شکوفایی در نمایشگاه صنعت بازی رایانه‌ای مسکو حاضر شدند.

پیش بینی اکونومیست از سال ۲۰۲۵؛ شکوفایی فناوری‌های پاک به رهبری چین

2024-11-26T15:47:23+03:30

یک نشریه اقتصادی در گزارشی پیش بینی کرده در سال آتی میلادی چین سردمدار تولید فناوری های حافظ محیط زیست خواهد بود و آینده هوش مصنوعی با وجود سرمایه گذاری کلان...

«صندوق بیمه ویژه» برای اجرای مطمئن‌تر پروژه‌های صنعتی راه اندازی شد

2024-11-26T15:47:22+03:30

معاون علمی، فناوری و اقتصاد دانش بنیان رئیس جمهور گفت: یک صندوق بیمه تشکیل شده و تقریبا ۱۲ بیمه کشور در آن حاضر هستند تا ریسک پروژه های صنعتی مخصوصا در حوزه ...

فیلترینگ در چه شرایطی موجه و مطلوب است/ پالایش هوشمند در اینستاگرام

2024-11-26T15:34:03+03:30

نشست فیلترینگ فضای مجازی در ایران با محوریت ابعاد حقوقی آن ظهر امروز در دانشگاه علامه طباطبایی برگزار شد.

پوشش ضد رادار چین هواپیماها و تجهیزات نظامی را نامرئی می‌کند

2024-11-26T14:54:05+03:30

ارتش چین مدعی شده یک پوشش ضد رادار جدید ابداع کرده که می تواند هدف های مورد نظر را از رادارهای ضد پنهان کاری( شناساگر) مخفی کند.

۶۴۵ میلیارد تومان وام ودیعه مسکن به دانشجویان پرداخت شد

2024-11-26T14:40:43+03:30

رئیس صندوق رفاه دانشجویان گفت: ۶۴۵ میلیارد تومان، وام ودیعه مسکن توسط صندوق رفاه دانشجویان پرداخت شده است.

پوشش ضد رادار چین هواپیماها و تجیهزات نظامی را نامرئی می‌کند

2024-11-26T14:27:34+03:30

مراکز علمی کاربردی ملزم به ارائه قیمت تمام شده آموزش شدند

2024-11-26T14:27:33+03:30

معاون اداری، مالی و مدیریت منابع دانشگاه جامع علمی کاربردی گفت: قیمت تمام شده آموزش توسط مراکز آموزش علمی کاربردی ارائه شود.

مهلت شرکت در تکمیل ظرفیت آزمون دستیاری دندانپزشکی تا ۱۰ آذر تمدید شد

2024-11-26T14:27:33+03:30

فرصت شرکت در مرحله تکمیل ظرفیت سی و هشتمین دوره آزمون پذیرش دستیار در رشته های تخصصی دندانپزشکی سال تحصیلی ۱۴۰۴-۱۴۰۳ با توجه به ایجاد ظرفیت های جدید تا ۱۰ آذ...

پرهیز از تبعیض میان تشکل‌های دانشجویی در آستانه ۱۶ آذر

2024-11-26T14:27:28+03:30

معاون وزیر علوم با اشاره به ۱۶ آذر گفت: ضروری است معاونان دانشجویی با هماهنگی روسای دانشگاه‌ها اقداماتی را برای پاسخ‌گویی به سوالات دانشجویان داشته باشند.

مهلت اجرای تکمیل ظرفیت آزمون دستیاری دندانپزشکی تا ۱۰ آذر تمدید شد

2024-11-26T14:14:04+03:30

دوره آموزشی «کاربردهای هوش مصنوعی در علوم پزشکی» ویژه دانشجویان آغاز به کار کرد

2024-11-26T13:47:22+03:30

درس «کاربردهای هوش مصنوعی درعلوم پزشکی» برای دانشجویان دانشگاه های علوم پزشکی کشور توسط دانشگاه علوم پزشکی هوشمند ارائه شده و این دوره از امروز ۶ آذر آغاز شد...

حضور بیش از ۲۰ هزار نفر از ۷۰ کشور جهان در مسابقات «برنامه‌سازی رایان»

2024-11-26T13:34:05+03:30

مسابقه‌ بین‌المللی برنامه‌سازی رایان با حمایت معاونت علمی و ستاد اقتصاد دانش‌بنیان دیجیتال به میزبانی دانشگاه شریف برگزار می‌شود.پیش بینی می شود از ۷۰ کشور...

دلایل پایین بودن نرخ اتصال فیبرنوری در ایران

2024-11-26T13:34:04+03:30

وزیر ارتباطات با تأکید بر اهمیت کیفیت خدمات دیجیتال از ضعف جدی در اجرای پروژه فیبرنوری و فاصله ۲۵درصدی با استانداردهای جهانی خبر داد و خواستار نقش‌آفرینی تسه...

افتخارآفرینی تیم دانشگاه تهران در المپیاد جهانی معماری منظر

2024-11-26T13:34:04+03:30

تیم دانشگاه تهران موفق شد در المپیاد جهانی معماری منظر در بخش «همکاری دانشجویی»، رتبه نخست را کسب کند.

برگزیدگان همایش کتاب سال بانوان معرفی شدند

2024-11-26T13:20:46+03:30

چهارمین همایش ملی کتاب سال بانوان با پیام آیت‌الله العظمی سبحانی و تقدیر از برگزیدگان به کار خود پایان داد.

هوش مصنوعی آهنگساز می شود

2024-11-26T12:40:42+03:30

انویدیا یک مدل هوش مصنوعی جدید برای تولید موسیقی و صوت رونمایی کرد که می تواند اصوات را اصلاح و صداهای جدید تولید کند.

دوره آموزشی «کاربردهای هوش مصنوعی درعلوم پزشکی» ویژه دانشجویان آغاز به کار کرد

2024-11-26T12:00:39+03:30

دولت چهاردهم اهتمامی به اجرای قانون جوانی جمعیت ندارد

2024-11-26T11:47:23+03:30

کارشناس حوزه جمعیت گفت: موضع گیری هایی که از سوی شخص رئیس جمهور تخاذ شده است، نشان می دهد اهتمام زیادی به اجرای قانون جوانی جمعیت ندارند.

استفاده از هوش مصنوعی در دندان پزشکی

2024-11-26T11:47:22+03:30

رئیس شانزدهمین کنگره دندان پزشکان عمومی ایران گفت: هوش مصنوعی مبحث تازه ای است که کاربردهای موثری را در درمان دندان پزشکی دارد و استفاده از این ظرفیت کار دند...

حضور سرزده پزشکیان در وزارت بهداشت

2024-11-26T11:47:22+03:30

رئیس جمهور، روز سه شنبه ششم آذر ۱۴۰۳ به طور سرزده راهی وزارت بهداشت شد.

اندونزی پیشنهاد سرمایه گذاری اپل در این کشور را رد کرد

2024-11-26T11:47:21+03:30

وزارت صنعت اندونزی پیشنهاد اپل برای سرمایه گذاری ۱۰۰ میلیون دلاری در کارخانه تولید تجهیزات و قطعات آیفون در این کشور را قبول نکرد.

امکان تغییر محل آزمون دانشجویان پیام‌نور فراهم شد

2024-11-26T11:47:20+03:30

بر اساس تقویم آموزشی دانشگاه پیام‌نور امکان تغییر محل آزمون برای دانشجویان این دانشگاه در سامانه گلستان فراهم شد.

برنامه وزارت علوم برای حل مسکن دانشگاهیان و خوابگاه متاهلی

2024-11-26T11:20:39+03:30

مشاور اقتصادی وزیر علوم تحقیقات و فناوری گفت: پیش‌بینی ما این است که در دوره چهارساله وزارت دکتر سیمایی حدود ۳۰ هزار خوابگاه متأهلی ایجاد کنیم.

پرهیز از تمایز میان تشکل‌های دانشجویی در آستانه ۱۶ آذر

2024-11-26T11:20:39+03:30

تقلید از سیستم بینایی انسان برای ارتقای عملکرد حسگرها

2024-11-26T10:54:06+03:30

محققان دستگاه اپتوالکترونیکی ساختند که از بینایی انسان برای محاسبات درون حسگری تقلید می‌کند؛ این سامانه مصرف انرژی کم و سرعت بالایی دارد.

امضای نخستین قرارداد الکترونیکی صندوق نوآوری با یک شرکت دانش‌بنیان

2024-11-26T10:54:05+03:30

صندوق نوآوری و شکوفایی با هدف سرعت بخشیدن به درخواست‌ها و کاهش میزان مراجعات حضوری، نخستین قرارداد الکترونیکی را با یک شرکت دانش‌بنیان منعقد کرد.

آخرین تغییرات در شورای عالی حوزه‌های علمیه

2024-11-26T10:40:40+03:30

اعضای جدید شورای عالی حوزه‌های علمیه با تأیید رهبر معظم انقلاب اسلامی و مراجع تقلید معرفی شدند.

زنجیره تولید و تامین دارو گرفتار کمبود نقدینگی است

2024-11-26T10:27:19+03:30

رئیس سازمان غذا و دارو، با اشاره به کمبود نقدینگی در زنجیره تولید و تامین دارو، گفت: چالش‌های بیرونی بر فعالیت‌های داخلی سازمان غذا و دارو سایه انداخته است.