میرنیوز
به گزارش خبرگزاری مهر به نقل از فیوچریسم، شرکت اوپن ای آی یک معیار جدید به نام «پرسش و پاسخ ساده» (SimpleQA) ارائه کرده که هدف آن اندازه گیری دقت خروجی مدل های هوش مصنوعی خود و شرکت های دیگر است.
این شرکت هوش مصنوعی با انجام چنین اقدامی نشان داد مدل های جدید فناوری مذکور در فراهم کردن پاسخ درست به سوالات عملکرد بدی دارند. نسخه هوش مصنوعی o۱-preview این شرکت که ماه گذشته ارائه شد در آزمون جدید به نرخ موفقیت ۴۲.۷ درصد دست یافت.
به بیان دیگر حتی برترین مدل های بزرگ زبانی که به تازگی معرفی شده اند احتمال زیادی دارد به جای پاسخ درست، جوابی اشتباه به کاربر بدهند. با توجه به آنکه این فناوری در بسیاری از وجوه مختلف زندگی انسان ها نفوذ کرده، چنین امری نگران کننده است.
مدل های هوش مصنوعی رقیب مانند محصول شرکت «آنتروپیک» در آزمون SimpleQA امتیاز پایین تری کسب کردند، به طوریکه مدل تازه منتشر شده Claude-۳.۵-sonnet این شرکت فقط به ۲۸.۹ درصد سوالات پاسخ درست داد. با این وجود مدل مذکور بیشتر تمایل داشت عدم قطعیت خود را نشان دهد و از پاسخ دادن خودداری کند، که این امر با توجه به نتایج ناامید کننده احتمالا گزینه بهتری است.
در این میان اوپن ای آی متوجه شد مدل های هوش مصنوعی خود این شرکت توانمندی هایشان را فراتر از حد معمول تخمین می زنند. این ویژگی احتمالا سبب می شود تا مدل ها نسبت به پاسخ های اشتباهی که می سازند، اطمینان بیشتری داشته باشند.
مدل های زبانی بزرگ از مدت ها قبل با اشتباهات یا «توهمات» دست وپنجه نرم می کنند. این اصطلاحی است که شرکت های هوش مصنوعی برای تمایل محصولاتشان به تولید پاسخ های بی ربط به کارمی برند.
جدیدترین یافته های اوپن ای آی یک نشانه نگران کننده مهم در خود دارد و حاکی از آن است که مدل های زبانی بزرگ نمی توانند حقیقت را بیان کنند.
منبع : خبرگزاری مهر
هنوز اظهارنظر قضایی درخصوص فوت بیماران دیالیزی نشده است
مشاور دبیر شورای آموزش پزشکی و تخصصی منصوب شد
دبیر شورای آموزش پزشکی عمومی وزارت بهداشت منصوب شد
انصراف ۶ هزار نفر از سقط جنین در دو سال
رصد شی آسمانی که چشمک می زند
مصوبه کنکوری شورای عالی انقلاب فرهنگی تغییری نکرده است
پذیرش دکتری تخصصی داروسازی به آزمون دکتری علوم پزشکی بازگشت/ برگزاری آزمون در تیر ۱۴۰۴
وعده خوش وزیر بهداشت برای رزیدنتهایی که صاحب فرزند شوند
مراسم چهلمین روز شهادت سیدحسن نصرالله در دانشگاه خواجه نصیر
وعده خوش وزیر بهداشت برای رزیدنت هایی که صاحب فرزند شوند
بومی سازی «چرخدنده خورشیدی» با یکبیستم قیمت نمونه مشابه خارجی
ساخت نانوداروی «رمدسیویر» در دانشگاه تهران با هدف کاهش عوارض دارو
موبایل ساز چینی رنگ پوست واقعی افراد را نشان می دهد
وزارت بهداشت در بخش جذب پرستار و ماما به شدت ضعیف عمل کرده است
استانداردهایی برای تولید نرم افزار و اپلیکیشن تدوین می شود
مشاور عالی بنیاد ملی نخبگان منصوب شد
چهاردهمین شماره مجله تصویری «دانش نما» منتشر شد
پرداخت سهم ارزی داروخانهها و یارانه شیرخشک
شیوع بیماری نارسایی قلب/ آگاهی عمومی از بیماری اندک است
روند انتصاب رئیس دانشگاه تهران شفاف شود
کارت آزمون اخذ پروانه کارشناسی رسمی دادگستری منتشر شد
کارت شرکت در آزمون وکالت کانون های وکلای دادگستری منتشر شد
توصیه وزارت بهداشت برای آگاهی از شایع ترین سرطان زنان
افزایش ۲.۵ برابری شناسهگذاری فرآوردههای طبیعی
تیک تاک عامل خودکشی نوجوانان در فرانسه شد
کلید اولیه سوالات آزمون دکتری تخصصی علوم پایه پزشکی منتشر شد/ امکان ارسال اعتراض تا فردا
ضرورت اجرای سیاستهای موثر برای افزایش فرزندآوری
قابلیت کنترل گرمای دستگاه های سامسونگ از انحصار شرکت خارج می شود
تقویت ورزش دانشگاهی یکی از ماموریتهای سازمان امور دانشجویان است
انتخابات شورای صنفی دانشگاه شهید بهشتی برگزار میشود