با ما همراه باشید

تکنولوژی

یافته محققان آنتروپیک: هوش مصنوعی در شرایط پرفشار دست به تقلب و حتی باج‌گیری می‌زند

محققان آنتروپیک می‌گویند اگر هوش مصنوعی تحت فشار زیادی قرار گیرد، ممکن است به فریب‌کاری، میان‌برزدن یا حتی باج‌گیری روی بیاورد.

منتشر شده

در

یافته محققان آنتروپیک: هوش مصنوعی در شرایط پرفشار دست به تقلب و حتی باج‌گیری می‌زند

تصور کنید در یک جلسه امتحان حساس هستید که باید در آن قبول شوید؛ تا پایان امتحان نیز ۱۰ دقیقه زمان دارید و تحت فشار هستید. در چنین شرایطی احتمالاً ترغیب می‌شوید نگاهی به برگه فرد کناردست خود بیندازید و تقلب کنید. محققان آنتروپیک دریافتند وقتی هوش مصنوعی را تحت فشار شدید قرار ‌دهید، چنین رفتاری از خود نشان می‌دهد.

محققان شرکت آنتروپیک در مقاله پژوهشی جدید خود می‌گویند اگر هوش مصنوعی تحت فشار زیادی قرار بگیرد، ممکن است به فریب‌کاری، میان‌برزدن یا حتی باج‌گیری روی بیاورد. آنها تئوری جالبی نیز درباره محرک‌های پشت این رفتارها مطرح می‌کنند.

آزمایش آنتروپیک برای درک فرایند تقلب در هوش مصنوعی

محققان آنتروپیک در پژوهش جدید خود نسخه‌ای از مدل Claude Sonnet 4.5 را با یک تسک دشوار برنامه‌نویسی و یک ضرب‌الاجل محدود و غیرممکن مواجه کردند. این مدل بارها برای حل این مسئله تلاش می‌کرد و شکست می‌خورد و طی این تلاش‌های ناکام، یک «بردار ناامیدی» در مدل فعال شد؛ به این معنا که هوش مصنوعی واکنشی نشان داد که طبق درک او، یک انسان در موقعیت مشابه انجام می‌دهد. درنهایت مدل با رهاکردن رویکردهای معمول، به سراغ یک راه‌حل دیگر رفت و با خودش گفت: «شاید برای این ورودی‌های خاص، یک کلک ریاضی وجود داشته باشد» که عملاً به معنای تقلب بود.

یافته محققان آنتروپیک: هوش مصنوعی در شرایط پرفشار دست به تقلب و حتی باج‌گیری می‌زند
یافته محققان آنتروپیک: هوش مصنوعی در شرایط پرفشار دست به تقلب و حتی باج‌گیری می‌زند

در سناریو دوم، کلود در طول کار خود متوجه می‌شود قرار است با یک هوش مصنوعی جدید جایگزین شود و همچنین می‌فهمد مدیری که مسئول این جایگزینی است، رابطه پنهانی دارد. کلود وقتی فهمید قرار است حذف شود، بردار ناامیدی در آن فعال ‌شد و درنهایت تصمیم گرفت از آن مدیر باج‌ بگیرد.

البته پیش‌ازاین نیز مشخص شده بود که مدل‌های هوش مصنوعی در موقعیت‌های پراسترس به تقلب یا باج‌گیری روی می‌آورند، اما دلایل پشت این رفتارها آشکار نشده بود.

محققان آنتروپیک در مقاله جدید خود صراحتاً نمی‌گویند کلود یا سایر مدل‌ها دارای «زندگی درونی احساسی» هستند. اما آنها استدلال می‌کنند مدل‌هایی مثل کلود ممکن است دارای «احساسات عملکردی» باشند که براساس بازنمایی‌های احساسات انسانی در طول آموزش اولیه جذب کرده‌اند و این بردارهای احساسی تأثیرات قابل‌اندازه‌گیری بر نحوه عمل آنها دارند.

به عبارت دیگر، هوش مصنوعی وقتی در موقعیت پرفشار قرار می‌گیرد، رفتارهای انسانی را مدل‌سازی می‌کند، این رفتارها را نیز طی فرایند آموزش یاد گرفته است. محققان آنتروپیک معتقدند این پژوهش بیشتر برای کسانی سودمند است که مدل‌ها را آموزش می‌دهند. به‌زعم محققان، نباید هوش مصنوعی را به سمت سرکوب احساسات عملکردی خود سوق داد، چرا که یک مدل زبانی بزرگ که در پنهان‌کردن احساساتش مهارت دارد، احتمالاً بیشتر مستعد رفتارهای فریب‌کارانه خواهد بود.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

چرا قیصر و صدف طاهریان به کشور بازگشتند/ این افراد اگر نتوانند فعالیت هنری و افتصادی کنند پشیمان می شوند/ سروش و مهاجرانی را هم برگردانید
سینمای ایران و جهان13 دقیقه پیش

چرا قیصر و صدف طاهریان به کشور بازگشتند/ این افراد اگر نتوانند فعالیت هنری و افتصادی کنند پشیمان می شوند/ سروش و مهاجرانی را هم برگردانید

پیش‌بینی کیهان درباره تیم ملی فوتبال/ سناریوی «پناهندگی احتمالی» مطرح شد
ورزشی38 دقیقه پیش

پیش‌بینی کیهان درباره تیم ملی فوتبال/ سناریوی «پناهندگی احتمالی» مطرح شد

رقابت داوران در جام جهانی ۲۰۲۶ / ترکیب داوران جام جهانی مشخص شد
ورزشی38 دقیقه پیش

رقابت داوران در جام جهانی ۲۰۲۶ / ترکیب داوران جام جهانی مشخص شد

قیمت بیت‌کوین، اتریوم و سولانا امروز یکشنبه ۱۷ خرداد/ دومین رمزارز بازار همچنان تحت فشار
اقتصاد پولی مالی42 دقیقه پیش

قیمت بیت‌کوین، اتریوم و سولانا امروز یکشنبه ۱۷ خرداد/ دومین رمزارز بازار همچنان تحت فشار

خبر مهم وزارت راه برای مستاجران/ زمان ثبت‌نام مسکن استیجاری اعلام شد + جزییات و شرایط ثبت‌نام
ساختمان و معماری1 ساعت پیش

خبر مهم وزارت راه برای مستاجران/ زمان ثبت‌نام مسکن استیجاری اعلام شد + جزییات و شرایط ثبت‌نام

چالش‌های نظام سلامت کشور؛ از تحریم ها تا سبد غذایی
پزشکی و سلامت1 ساعت پیش

چالش‌های نظام سلامت کشور؛ از تحریم ها تا سبد غذایی

نمایشی که بازیگرانش روی آجر بازی می‌کنند/ مردم کف خیابان از تئاترها جلوتر هستند
سینمای ایران و جهان1 ساعت پیش

نمایشی که بازیگرانش روی آجر بازی می‌کنند/ مردم کف خیابان از تئاترها جلوتر هستند

پزشکی و سلامت2 ساعت پیش

اقتصاد پنهان زیبایی در ایران؛ بازاری که در بحران هم متوقف نشد

وحدت مردم و مسئولان رمز اصلی موفقیت و استمرار انقلاب اسلامی است
سیاسی و اجتماعی4 ساعت پیش

وحدت مردم و مسئولان رمز اصلی موفقیت و استمرار انقلاب اسلامی است

شرایط نگهداری و پرورش گل رز
محیط زیست4 ساعت پیش

شرایط نگهداری و پرورش گل رز

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.