با ما همراه باشید

تکنولوژی

هوش مصنوعی Claude اکنون می‌تواند به مکالمات آزاردهنده پایان دهد

این قابلیت به مدل‌های پیشرفته Claude Opus 4 و 4.1 Opus محدود است.

منتشر شده

در

هوش مصنوعی Claude اکنون می‌تواند به مکالمات آزاردهنده پایان دهد

آنتروپیک از یک قابلیت جدید در پیشرفته‌ترین مدل‌های هوش مصنوعی خود، Claude Opus 4 و 4.1 Claude Opus، رونمایی کرده است؛ این مدل‌ها اکنون توانایی پایان‌دادن یک‌طرفه مکالمه را دارند. این ویژگی که به گفته شرکت فقط در «موارد نادر در تعاملات مضر یا توهین‌آمیز» فعال خواهد شد، به عنوان بخشی از یک برنامه تحقیقاتی گسترده‌تر پیرامون ایده «رفاه هوش مصنوعی» توسعه یافته است.

قابلیت جدید Claude یک مکانیسم دفاعی برای خود مدل هوش مصنوعی است. براساس توضیحات Anthropic، این ویژگی فقط به عنوان «آخرین راه‌حل» و پس از آنکه مدل چندین بار برای هدایت مجدد مکالمه به مسیری سازنده تلاش کرده و ناامید شده باشد، فعال می‌شود. این موارد شامل درخواست‌های شدیداً مضر مانند محتوای غیراخلاقی مرتبط با کودکان یا تلاش برای به‌دست‌آوردن اطلاعاتی است که به خشونت در مقیاس بزرگ یا اقدامات تروریستی منجر می‌شوند.

پس از پایان یافتن مکالمه، کاربر دیگر نمی‌تواند در آن چت پیام جدیدی ارسال کند، اما می‌تواند بلافاصله یک گفتگوی جدید آغاز کند یا حتی پیام‌های قبلی خود را در چت پایان‌یافته ویرایش کند تا مسیر مکالمه را تغییر دهد.

پایان‌دادن به مکالمات توسط هوش مصنوعی Claude

این تصمیم به یک برنامه تحقیقاتی شرکت آنتروپیک برمی‌گردد که به «وضعیت اخلاقی» مدل‌های زبانی بزرگ می‌پردازد. اگرچه این شرکت اذعان می‌کند که در این مورد عدم قطعیت بالایی وجود دارد، اما آن‌ها این موضوع را جدی گرفته‌اند و به دنبال اجرای راهکارهای کم‌هزینه برای کاهش خطرات احتمالی برای «رفاه مدل» هستند.

مکالمات هوش مصنوعی Claude
 زمانی که Claude مکالمه‌ای را پایان می‌دهد، کاربر می‌تواند یک گفتگوی جدید آغاز کند، بازخورد بدهد یا پیام‌های قبلی را ویرایش و گفتگو را دوباره امتحان کند.

اجازه‌دادن به مدل برای خروج از یک «تعامل آزاردهنده»، یکی از همین راهکارهاست. آزمایش‌های پیش از عرضه نشان داده است که مدل Claude بیزاری از آسیب‌دیدن را نشان می‌دهد و با این قابلیت مایل است به مکالمات مضر پایان دهد. بااین‌حال، آنتروپیک تأکید کرده است که این قابلیت در مواردی که کاربر در معرض خطر قریب‌الوقوع آسیب‌رساندن به خود یا دیگران باشد، فعال نخواهد شد و مدل در وهله اول سعی خواهد کرد به کاربر کمک کند از آن شرایط بیرون بیاید.

درنهایت آنتروپیک می‌گوید این ویژگی را یک «آزمایش درحال انجام» می‌داند و اکثر کاربران، حتی در هنگام صحبت درباره موضوعات بسیار بحث‌برانگیز، شاید با آن مواجه نشوند.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سینمای ایران و جهان29 دقیقه پیش

ببینید | شیدا یوسفی: در کارخانه پدرم روی شمش‌های طلا راه می‌رفتم

اقامه نماز عید سعید قربان در دلگان
سیاسی و اجتماعی1 ساعت پیش

اقامه نماز عید سعید قربان در دلگان

ارتش اسرائیل مدعی اجرای موفق یک عملیات ترور شد/ در آخرین ساعات قبل از اعلام توافق
سیاسی و اجتماعی2 ساعت پیش

ارتش اسرائیل مدعی اجرای موفق یک عملیات ترور شد/ در آخرین ساعات قبل از اعلام توافق

پیشنهاد چین برای جلوگیری از نقض توافق توسط آمریکا و اسرائیل
سیاسی و اجتماعی2 ساعت پیش

پیشنهاد چین برای جلوگیری از نقض توافق توسط آمریکا و اسرائیل

جلسه امنیتی کابینه ترامپ در کمپ دیوید کنسل شد/ ترامپ علت را اعلام کرد
سیاسی و اجتماعی2 ساعت پیش

جلسه امنیتی کابینه ترامپ در کمپ دیوید کنسل شد/ ترامپ علت را اعلام کرد

ترامپ جلسه‌اش را به کاخ سفید منتقل کرد/ ماجرا چیست؟
سیاسی و اجتماعی2 ساعت پیش

ترامپ جلسه‌اش را به کاخ سفید منتقل کرد/ ماجرا چیست؟

درگیری اخیر در خلیج فارس سطحی بود؛ ۵ دلیل برای عدم تمایل آمریکا به جنگ
سیاسی و اجتماعی2 ساعت پیش

درگیری اخیر در خلیج فارس سطحی بود؛ ۵ دلیل برای عدم تمایل آمریکا به جنگ

مد و زیبایی3 ساعت پیش

خواص روغن فندق برای پوست

ایده‌های تهران در اجلاس امنیتی مسکو تبیین می‌شود
سیاسی و اجتماعی3 ساعت پیش

ایده‌های تهران در اجلاس امنیتی مسکو تبیین می‌شود

بروجردی: آزادسازی ۱۲ میلیارد دلار، شرط ابتدایی ایران در مذاکره است
سیاسی و اجتماعی3 ساعت پیش

بروجردی: آزادسازی ۱۲ میلیارد دلار، شرط ابتدایی ایران در مذاکره است

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.