با ما همراه باشید

تکنولوژی

بنچمارک جدید گوگل: یک‌سوم پاسخ‌های هوش مصنوعی می‌تواند غلط باشد

طبق بنچمارک جدید دیپ‌مایند، حتی پیشرفته‌ترین مدل‌های هوش مصنوعی جهان نیز در زمینه دقت و صحت اطلاعات امتیاز ۶۹ درصد را به دست آوردند.

منتشر شده

در

بنچمارک جدید گوگل: یک‌سوم پاسخ‌های هوش مصنوعی می‌تواند غلط باشد

اگر فکر می‌کنید هر چه هوش مصنوعی می‌گوید درست است، سخت در اشتباهید. دیپ‌مایند گوگل در تحقیقی عملکرد چت‌بات‌های امروزی را زیر ذره‌بین برده و نتایج اصلاً جالب نیست. طبق بنچمارک جدید محققان، حتی پیشرفته‌ترین مدل‌های هوش مصنوعی جهان نیز نمی‌توانند از مرز دقت ۷۰ درصد عبور کنند. این امتیاز را می‌توان اینطور تفسیر کرد که از هر سه پاسخی که از هوش مصنوعی می‌گیرید، یکی ممکن است غلط باشد، حتی اگر با اعتماد‌به‌نفس کامل بیان شود.

برخلاف تست‌های معمولی که توانایی حل مسئله را می‌سنجند، بنچمارک FACTS گوگل دیپ‌مایند منحصراً روی دقت و صحت اطلاعات تمرکز دارد. این تست مدل‌ها را در چهار زمینه محک می‌زند:

  1. آیا مدل می‌تواند به سؤالات واقعی فقط با تکیه بر دانش درونی خود پاسخ دهد؟
  2. آیا مدل می‌تواند اطلاعات دقیق را از اینترنت پیدا کند؟
  3. آیا مدل فقط از متنی که به او داده شده استفاده می‌کند یا اطلاعات غلط و خیالی اضافه می‌کند؟
  4. آیا نمودارها، تصاویر و دیاگرام‌ها را درست می‌خواند؟

تحقیق دیپ‌مایند گوگل درباره دقت پاسخ‌های هوش مصنوعی

نتایج نشان می‌دهد که فاصله زیادی بین ادعا و واقعیت وجود دارد. در صدر لیست مدل جمینای ۳ پرو گوگل قرار دارد که با امتیاز کلی ۶۹ درصد دقیق‌ترین مدل فعلی است. رتبه‌بندی سایر رقبا را در تصویر پایین می‌بینید:

بنچمارک دقت پاسخ‌های هوش مصنوعی
بنچمارک جدید گوگل: یک‌سوم پاسخ‌های هوش مصنوعی می‌تواند غلط باشد

پاشنه آشیل تمام مدل‌ها بخش چندوجهی بود؛ جایی که دقت اغلب زیر ۵۰ درصد است. این موضوع بسیار نگران‌کننده است، زیرا کاربران ممکن است از هوش مصنوعی بخواهند یک نمودار مالی یا پزشکی را تحلیل کند. اگر چت‌بات عدد اشتباهی را از یک گزارش بیرون بکشد یا نمودار فروش را برعکس تفسیر کند، عواقب آن در حوزه‌هایی مثل بورس، حقوق و سلامت می‌تواند فاجعه‌بار باشد.

درکل تحقیق گوگل می‌گوید به چت‌بات‌های هوش مصنوعی اعتماد کورکورانه نداشته باشید. اگر خبرنگاری در یک رسانه ۶۹ درصد مواقع راست بگوید، فوراً اخراج می‌شود؛ اما ما همین سطح خطا را از هوش مصنوعی می‌پذیریم. در شغل‌های که با اطلاعات مهمی سروکار دارند (مثل وکلا و پزشکان) استفاده از چت‌بات بدون نظارت انسانی می‌تواند بسیار خطرناک و زیان‌بار باشد.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

انتشار فراخوان جشنواره نمایش عروسکی تهران-مبارک
سینمای ایران و جهان3 دقیقه پیش

انتشار فراخوان جشنواره نمایش عروسکی تهران-مبارک

رونمایی از پوسترهای «روایت علوی» در تئاتر شهر/ چشم‌انداز بین‌المللی برای ترویج فرهنگ غدیر
سینمای ایران و جهان3 دقیقه پیش

رونمایی از پوسترهای «روایت علوی» در تئاتر شهر/ چشم‌انداز بین‌المللی برای ترویج فرهنگ غدیر

احمد زیدآبادی: اگر در بحران‌ها هنر تعطیل شود، زندگی تعطیل می‌شود/ هنر معنادارترین جنبه زندگی است
سینمای ایران و جهان3 دقیقه پیش

احمد زیدآبادی: اگر در بحران‌ها هنر تعطیل شود، زندگی تعطیل می‌شود/ هنر معنادارترین جنبه زندگی است

شیراز، اهواز و رشت میزبان نمایش‌های پرمخاطب تهران
سینمای ایران و جهان4 دقیقه پیش

شیراز، اهواز و رشت میزبان نمایش‌های پرمخاطب تهران

پاره‌های تنی که به دیگران جان دادند/ فداکاران بینام مهمان تئاتر شهر شدند
سینمای ایران و جهان4 دقیقه پیش

پاره‌های تنی که به دیگران جان دادند/ فداکاران بینام مهمان تئاتر شهر شدند

سعید آقاخانی تهیه‌کننده تئاتر شد
سینمای ایران و جهان4 دقیقه پیش

سعید آقاخانی تهیه‌کننده تئاتر شد

«روایت معلق بعد از بازگشت» در بوتیک هنر ایران
سینمای ایران و جهان4 دقیقه پیش

«روایت معلق بعد از بازگشت» در بوتیک هنر ایران

تصاویر و اسناد کمتر دیده‌شده از زندگی محمدمهدی طهرانچی/ اکران سیار یک مستند
سینمای ایران و جهان1 ساعت پیش

تصاویر و اسناد کمتر دیده‌شده از زندگی محمدمهدی طهرانچی/ اکران سیار یک مستند

بچه‌زرنگ به مرکز توانبخشی بیمارستان نورافشار رفت
سینمای ایران و جهان1 ساعت پیش

بچه‌زرنگ به مرکز توانبخشی بیمارستان نورافشار رفت

«بهترین سینماهای جهان» به انتخاب اسکار
سینمای ایران و جهان1 ساعت پیش

«بهترین سینماهای جهان» به انتخاب اسکار

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.