با ما همراه باشید

تکنولوژی

آنتروپیک استفاده از سند «روح» برای آموزش مدل Claude را تأیید کرد

جزئیات سندی موسوم به «Soul Overview» فاش شده که ظاهراً در آموزش Claude استفاده شده است.

منتشر شده

در

آنتروپیک استفاده از سند «روح» برای آموزش مدل Claude را تأیید کرد

به‌تازگی جزئیات سندی داخلی از مدل هوش مصنوعی کلود 4.5 اوپوس (Claude 4.5 Opus) فاش شده که به «روح» چت‌بات اشاره دارد. این سند در واقع به شکل‌گیری شخصیت و نحوه تعامل مدل با کاربران کمک می‌کند. Anthropic نیز تأیید کرده که سند مذکور واقعاً وجود داشته و در مراحل یادگیری مدل مورد استفاده قرار گرفته است.

«ریچارد وایس»، فردی که این سند را کشف کرده، در وب‌سایت LessWrong توضیح داده که چگونه با پرامپتی برای مشاهده دستورات سیستمی کلود توانسته به مجموعه‌ای از اسناد داخلی مدل دست پیدا کند. در یکی از همین اسناد اشاره‌ای به «Soul Overview» وجود داشته است. وایس سپس از مدل خواسته این سند را بازتولید کند و نتیجه آن یک فایل حدوداً 11 هزار کلمه‌ای بوده که ظاهراً چارچوب شخصیتی و رفتاری کلود را مشخص می‌کند.

چارچوب «روح» هوش مصنوعی کلود 4.5 اوپوس آنتروپیک

این سند روی اصول ایمنی و تعهد مدل به تولید خروجی‌های سالم و بی‌خطر تمرکز دارد و به‌طور مداوم به Claude یادآوری می‌کند که «مفید بودن برای انسان‌ها یکی از مهم‌ترین مأموریت‌های مدل» است و نباید وارد حوزه‌هایی شود که با خطوط قرمز اخلاقی آنتروپیک در تضاد هستند. چنین اسنادی معمولاً برای تثبیت لحن، اخلاق، حدود پاسخ‌گویی و مسئولیت‌پذیری مدل‌های زبانی به کار می‌روند.

سند روح در هوش مصنوعی کلود
آنتروپیک استفاده از سند «روح» برای آموزش مدل Claude را تأیید کرد

جالب‌تر اینکه وایس مدعی شده سند را 10 بار از کلود درخواست کرده و هر بار دقیقاً یک متن ثابت تولید شده است که به گفته او این موضوع احتمال واقعی‌بودن سند را به‌شدت افزایش می‌دهد. چندین کاربر Reddit نیز توانسته‌اند بخش‌هایی مشابه از همین سند را از کلود دریافت کنند، که نشان می‌دهد مدل احتمالاً به نسخه‌ای از آن در داده‌های داخلی یا حافظه آموزشی خود دسترسی دارد.

«آماندا اَسکِل» (Amanda Askell)، فیلسوف و از اعضای تیم فنی Anthropic، با انتشار پستی در شبکه اجتماعی X تأیید کرده که خروجی مدل «بر پایه یک سند واقعی» است که در طول دوره یادگیری از آن استفاده شده است. او همچنین گفته این سند همچنان درحال بازبینی است و نسخه کامل آن به‌زودی منتشر خواهد شد. به گفته اسکل، مدل همیشه اسناد درونی را کاملاً دقیق بازتولید نمی‌کند، اما خروجی‌های اخیر «تا حد زیادی با نسخه اصلی مطابقت» داشته‌اند.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سروش رفیعی و میلاد محمدی جریمه شدند
ورزشی56 دقیقه پیش

سروش رفیعی و میلاد محمدی جریمه شدند

اعلام نهایی وضعیت حضور تیم ملی در جام جهانی / وزیر ورزش تکلیف را روشن کرد
ورزشی57 دقیقه پیش

اعلام نهایی وضعیت حضور تیم ملی در جام جهانی / وزیر ورزش تکلیف را روشن کرد

ساختمان و معماری1 ساعت پیش

پیش‌بینی جدید یک کارشناس از قیمت مسکن در سال ۱۴۰۵/ یزدانی: خریداران و فروشندگان این هشدار را حتما جدی بگیرند؛ قیمت مسکن قرار است چه تغییری کند؟

ساختمان و معماری1 ساعت پیش

افتتاح ۱۵۰۰ واحد مسکن روستایی در مازندران

ساختمان و معماری1 ساعت پیش

خبر مهم وزارت راه برای آسیب‌دیدگان جنگ/ وام مسکن چند روزه پرداخت می شود؟/ این خدمات ساخت‌وساز رایگان شد

افسردگی پس از زایمان؛ بیماری قابل درمان یا تهدیدی برای مادر و نوزاد؟
پزشکی و سلامت1 ساعت پیش

افسردگی پس از زایمان؛ بیماری قابل درمان یا تهدیدی برای مادر و نوزاد؟

سینمای ایران و جهان1 ساعت پیش

ایران.تئاتر.تئاتر شهر برگزار شد؛ اهالی هنر کنار ایران ایستادند

لزوم تسریع در تعمیر شبکه‌های آسیب‌دیده آب‌وفاضلاب پلدختر
مد و زیبایی2 ساعت پیش

لزوم تسریع در تعمیر شبکه‌های آسیب‌دیده آب‌وفاضلاب پلدختر

۲ خائن و مزدور دشمن در ارومیه دستگیر شدند
مد و زیبایی2 ساعت پیش

۲ خائن و مزدور دشمن در ارومیه دستگیر شدند

داداشی: طبق پیش‌بینی‌ها شاهد بارش‌های خوبی در خراسان شمالی بودیم
مد و زیبایی2 ساعت پیش

داداشی: طبق پیش‌بینی‌ها شاهد بارش‌های خوبی در خراسان شمالی بودیم

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.