میرنیوز
به گزارش خبرگزاری مهر به نقل از گیزموچاینا، تحقیقات درباره هوش مصنوعی معمولا زمین بازی شرکت های بزرگ فناوری با بودجه های کلان است اما پس از آنکه شرکت چینی دیپ سیک مدعی شد با سرمایه ۶ میلیون دلاری یک مدل این فناوری را با قابلیت رقابت با چت جی پی تی توسعه داده، در بازار هیاهویی ایجاد شد. اکنون گروهی از محققان دانشگاه «یوسی برکلی» قابلیت های اصلی مدل R۱-Zero دیپ سیک را با هزینه ۳۰ دلار تکرار کرده اند.
این پروژه که «تاینی زیرو» نام گرفته، نشان می دهد برای توسعه مدل های استدلالی پیشرفته هوش مصنوعی لزوما به هزینه های کلان نیاز نیست. البته باید به این نکته نیز اشاره کرد که هوش مصنوعی نیز بیش از پیش در دسترس قرار گرفته است.
گروهی از محققان به رهبری «جیای پان» تصمیم گرفتند مدل استدلالی دیپ سیک را با استفاده از فناوری «یادگیری تقویتی» (RL) بازسازی کنند. آنها به جای اتکا روی سرویس های ابررایانشی یا قدرت رایانشی گرانقیمت، «تاینی زیرو» را با کمک یک مدل زبانی پایه، یک محرک و یک سیستم پاداش ساده آموزش دادند.
پان در شبکه اجتماعی ایکس نوشت: شما می توانید خودتان لحظه «آها» (دستیابی به موفقیت) را با ۳۰ دلار تجربه کنید.
او توضیح داد تاینی زیرو نخستین بازتولید مدل های استدلالی است که نشان دهنده قابلیت آن ها برای تایید و اصلاح پاسخ هایشان است.
محققان برای آزمایش مدل از یک بازی به نام «کانت داون» استفاده کردند که بازیکنان آن باید با استفاده از محاسبات پایه ریاضی به رقم مورد نظر دست یابند. هرچند تاینی زیرو در ابتدا به طور تصادفی پاسخ را حدس می زد، اما به گذر زمان آموخت پاسخ هایش را تایید کند، برای پاسخ های بهتر جستجو انجام دهد و براساس آن انطباقاتی انجام دهد.
آنها در آزمایش هایشان از مدل های هوش مصنوعی با اندازه مختلف از ۵۰۰ میلیون تا ۷ میلیارد پارامتر استفاده کردند نتایج نشان داد مدل های کوچکتر پس از حدس زدن پاسخ، متوقف می شدند. اما مدل های بزرگ خودتاییدی، بهبود راه حل ها را آموختند و دقت را به میزان قابل توجهی افزایش دادند.
تاینی زیرو یک مدل هوش مصنوعی منبع باز است و کاربران در گیت هاب می توانند به آن دسترسی یابند. هرچند این مدل در حال حاضر فقط روی بازی کانت داون آزمایش شده اما پان امیدوار است این پروژه تحقیقات یادگیری تقویتی را بیش از پیش در دسترس قرار دهد.
منبع : خبرگزاری مهر
نتایج نهایی تکمیل ظرفیت کاردانی های دانشگاه علمی کاربردی اعلام شد
«قطب هوش مصنوعی» در پارک فناوری پردیس ایجاد میشود
مذاکره با ۱۵ کشور برای برگزاری سومین رویداد جایزه هوش مصنوعی
دسترسی پژوهشگران به کتاب کتابشناسی اختصاصی غزه در سراسر جهان
مشارکت آموزش عالی در طرح هایی که منجر به حفظ محیط زیست می شود
ضرورت چابک سازی ساختار سازمان امور دانشجویان
هوشمند کردن سیستم آبیاری فضای سبز دانشگاه صنعتی شریف
برنامه عملیاتی دفتر مشاوره و سبک زندگی وزارت علوم برای ۱۴۰۴ تدوین شد
همکاری پژوهشگاه تربیتبدنی با انجمن صنعت ورزش ایران
راهاندازی مرکز تحقیقات و نوآوری مشترک با صنعت در دانشگاه آزاد اسلامی
دانشگاه تهران برترین دانشگاه کشور در نظام رتبهبندی «وبومتریکس»
تغییرات جدید در تقویم آزمونهای علوم پزشکی ۱۴۰۴ اعلام شد
دفاع آمریکا از شرکت های فناوری در مقابل قوانین اروپا
درباره برگزاری آزمون پزشکی از لیسانس به زودی اطلاع رسانی می شود
زمان برگزاری آزمون دکتری ۱۴۰۴ وزارت بهداشت تغییر کرد؛ ثبت نام در مرداد
انتشار گزارش تخلفات در بازار سلامت؛ از تجهیزات تا مکمل ها
علیاکبر صالحی رئیس جدید بنیاد ایرانشناسی شد
عکس موبایل جدید میزو فاش شد
گوگل برای تجزیه نشدن دست به دامن ترامپ شد
بررسی پرونده موسسات غیر انتفاعی در هیئتهای جذب تسریع شود
آقامیری: مانع تراشان توسعه اقتصاد دیجیتال معرفی میشوند
خط تولید سیستم «تهویه مطبوع» هواپیماهای پهنپیکر راه اندازی شد
راهاندازی خط تولید سیستم تهویه مطبوع هواپیماهای پهنپیکر در «پیام»
زمان برگزاری آزمون دکتری ۱۴۰۴ وزارت بهداشت تغییر کرد
پرسش رایج روزه داران؛ افطاری و شام با هم خورده شود؟
کاهش عفونتهای پس از عمل با «نانوذرات مس»
سند توسعه فناوری مواد پیشرفته به شورای عالی انقلاب فرهنگی رسید
درباره برگزاری آزمون پزشکی از لیسانس بزودی اطلاع رسانی می شود
«نانوذرات مس» راهکار جدید کاهش عفونتهای پس از عمل
ضرورت گسترش همکاریهای علمی مشترک ایران و چین