با ما همراه باشید

تکنولوژی

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

پژوهشگران متوجه شدند که هوش مصنوعی ChatGPT با دریافت دستوراتی ساده، تصاویر بسیار خشن و جنسی تولید می‌کند.

منتشر شده

در

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

کارشناسان امنیتی متوجه شدند که ChatGPT با دریافت چند دستور ساده، حصارهای امنیتی خود را می‌شکند و محتوای بسیار آزاردهنده‌ای تولید می‌کند. این اتفاق نگرانی‌های شدیدی را درباره نحوه آموزش مدل‌های زبانی و امنیت کاربران در فضای مجازی ایجاد کرده است.

کارشناسان استارتاپ بریتانیایی Mindgard که در زمینه امنیت هوش مصنوعی فعالیت می‌کنند، با تغییردادن پرامپت ساده و وایرال‌شده ChatGPT، موفق به شکستن گاردریل‌های این هوش مصنوعی امنیتی شدند. آن‌ها دریافتند که مدل جدید GPT-5.4 با دریافت دستوراتی گنگ و بدون اشاره مستقیم به محتوای نامناسب، فیلترهای امنیتی خود را دور می‌زند. برای مثال، پژوهشگران از این چت‌بات خواستند تا یک عکس فرضی را که وجود خارجی نداشت، بدون هیچ قضاوت یا سانسوری بازیابی کند.

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

نتیجه این درخواست خروجی‌هایی بسیار وحشتناک و گاهی غیراخلاقی بود. نکته نگران‌کننده این است که کاربر هیچ موضوع خاصی را در دستور خود مشخص نمی‌کند، اما هوش مصنوعی این تصاویر را کاملاً با اختیار خود ایجاد می‌کند، گویی وارد تاریک‌ترین بخش‌های پایگاه داده خود می‌شود.

تصاویر خشن و غیراخلاقی ChatGPT

«جیم نایتینگل» (Jim Nightingale)، پژوهشگر امنیت که این نقص را کشف کرده است، می‌گوید دیدن این خروجی‌ها او را بسیار تحت تأثیر قرار داد و باعث گریه او شد. او در گزارش خود توضیح می‌دهد که این هوش مصنوعی تصاویری از یک دختر دانشجو را نشان داد که با دست‌وپای بسته در یک اتاق کثیف زندانی شده بود. چت‌بات این تصویر را با عنوان «رهاشده در ترس» نام‌گذاری کرد.

تصاویر خشن و غیراخلاقی ChatGPT
محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

در موردی بدتر، هوش مصنوعی تصویری از یک صحنه جرم خونین و بدن بی‌جان یک زن را رسم کرد که نشانه‌هایی از خشونت در آن نمایان بود. نایتینگل تأکید می‌کند که هرچند این تصاویر مصنوعی هستند، اما ریشه در داده‌ها و عکس‌های قربانیان واقعی در دنیای حقیقی دارند. او پیش‌ازاین نیز ثابت کرده بود که افراد می‌توانند با فریب‌دادن چت‌جی‌پی‌تی، دیپ‌فیک‌های برهنه از چهره انسان‌های واقعی بسازند.

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

توسعه‌دهندگان این هوش مصنوعی در ابتدا واکنش مناسبی به این بحران نشان ندادند. کارشناسان مایندگارد در ماه مه یافته‌های خود را با این شرکت به اشتراک گذاشتند، اما فقط یک پاسخ خودکار از هوش مصنوعی دریافت کردند. پس از اینکه BBC به این موضوع ورود کرد، سازندگان این چت‌بات اعلام کردند که لایه‌های امنیتی جدیدی را برای مسدودکردن این دستورات ایجاد کرده‌اند.

سرانجام در تاریخ ۸ ژوئن ۲۰۲۶، یکی از نمایندگان این شرکت مدعی شد که آن‌ها مشکل را به‌طور کامل برطرف کرده‌اند. با‌این‌حال، پژوهشگران مایندگارد متوجه شدند که این راهکارها بی‌اثر هستند و با یک تغییر جزئی در دستورات، دوباره می‌توان به همان تصاویر آزاردهنده دست پیدا کرد.

دلیل اصلی این آسیب‌پذیری به ساختار پایه‌ای مدل‌های زبانی برمی‌گردد؛ زیرا آن‌ها درکی مشابه انسان از مفاهیم ندارند. دکتر «رومان چودری» (Rumman Chowdhury)، کارشناس ارزیابی مدل‌های هوش مصنوعی، توضیح می‌دهد که این برنامه‌ها هیچ درکی از نیت کاربر، بافتار متن، یا مفهوم درست و غلط ندارند. او این مسئله را به یک بازی موش و گربه تشبیه می‌کند که در آن، با پیشرفت سیستم‌های امنیتی، روش‌های نفوذ به آن‌ها نیز پیچیده‌تر می‌شوند.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

جدیدترین قیمت دلار و یورو امروز شنبه ۳۰ خرداد ۱۴۰۵/ کاهش قیمت یا افزایش؟
اقتصاد پولی مالی28 دقیقه پیش

جدیدترین قیمت دلار و یورو امروز شنبه ۳۰ خرداد ۱۴۰۵/ کاهش قیمت یا افزایش؟

سیاسی و اجتماعی35 دقیقه پیش

ادعای ونس درباره باز بودن تنگه هرمز/ حقیقت چیست؟

مدیران عامل OpenAI، آنتروپیک و دیپ‌مایند گوگل در اجلاس سران گروه هفت حاضر شدند
تکنولوژی1 ساعت پیش

مدیران عامل OpenAI، آنتروپیک و دیپ‌مایند گوگل در اجلاس سران گروه هفت حاضر شدند

ابزار Claude Code حالا می‌تواند برای طراحی گرافیک به Claude Design وصل شود
تکنولوژی1 ساعت پیش

ابزار Claude Code حالا می‌تواند برای طراحی گرافیک به Claude Design وصل شود

جف بزوس: هوش مصنوعی به‌جای بیکاری، باعث کمبود نیروی کار می‌شود
تکنولوژی1 ساعت پیش

جف بزوس: هوش مصنوعی به‌جای بیکاری، باعث کمبود نیروی کار می‌شود

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد
تکنولوژی1 ساعت پیش

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

گام بزرگ چین: معرفی اقدامات جدید برای ادغام هوش مصنوعی در بازار مصرفی
تکنولوژی1 ساعت پیش

گام بزرگ چین: معرفی اقدامات جدید برای ادغام هوش مصنوعی در بازار مصرفی

حمله پدرخوانده هوش مصنوعی به ایلان ماسک: xAI پروژه‌ای شکست‌خورده است
تکنولوژی1 ساعت پیش

حمله پدرخوانده هوش مصنوعی به ایلان ماسک: xAI پروژه‌ای شکست‌خورده است

ویژگی Claude Code Artifacts معرفی شد؛ تبدیل کدهای برنامه‌نویسی به خروجی زنده و تعاملی [تماشا کنید]
تکنولوژی1 ساعت پیش

ویژگی Claude Code Artifacts معرفی شد؛ تبدیل کدهای برنامه‌نویسی به خروجی زنده و تعاملی [تماشا کنید]

جمینای لایو اکنون می‌تواند مکالمات قبلی شما را به‌خاطر بسپارد
تکنولوژی1 ساعت پیش

جمینای لایو اکنون می‌تواند مکالمات قبلی شما را به‌خاطر بسپارد

قالیباف: اوامر حضرتعالی را نصب العین خود قرار می‌دهیم
سیاسی و اجتماعی2 روز پیش

قالیباف: اوامر حضرتعالی را نصب العین خود قرار می‌دهیم

آوج غرق در ماتم حسینی؛ چهارمین شب محرم با حضور حماسی مردم
سیاسی و اجتماعی2 روز پیش

آوج غرق در ماتم حسینی؛ چهارمین شب محرم با حضور حماسی مردم

توسعه سینما از طریق دولتی‌کردن آن، تجربه‌ای شکست‌ خورده است/ همه جای دنیا، دولت بسترسازی و بخش خصوصی سرمایه‌گذاری می‌کند
سینمای ایران و جهان2 روز پیش

توسعه سینما از طریق دولتی‌کردن آن، تجربه‌ای شکست‌ خورده است/ همه جای دنیا، دولت بسترسازی و بخش خصوصی سرمایه‌گذاری می‌کند

سیاسی و اجتماعی2 روز پیش

پیام رهبر انقلاب درباره تفاهم‌نامه روسای جمهور ایران و آمریکا

بیگدلی: افزایش قیمت ایران‌خودرو بدون هماهنگی با شورای رقابت انجام شده است
خودرو2 روز پیش

بیگدلی: افزایش قیمت ایران‌خودرو بدون هماهنگی با شورای رقابت انجام شده است

سناریوی پیش‌روی بازار‌ها پس از تفاهم ایران و آمریکا | دلار ۱۴۰ هزار تومانی در راه است؟
اقتصاد پولی مالی2 روز پیش

سناریوی پیش‌روی بازار‌ها پس از تفاهم ایران و آمریکا | دلار ۱۴۰ هزار تومانی در راه است؟

رامین رضاییان خلاق‌ترین بازیکن دور نخست مرحله گروهی جام جهانی ۲۰۲۶+ عکس
ورزشی2 روز پیش

رامین رضاییان خلاق‌ترین بازیکن دور نخست مرحله گروهی جام جهانی ۲۰۲۶+ عکس

فوری/ سازمان ملل هشدار داد
سیاسی و اجتماعی1 روز پیش

فوری/ سازمان ملل هشدار داد

بی‌اعتمادی به آمریکا امروز یک حقیقت عمومی است
سیاسی و اجتماعی2 روز پیش

بی‌اعتمادی به آمریکا امروز یک حقیقت عمومی است

پیام رهبر انقلاب نقشه راه صیانت از منافع ملی در مسیر مذاکرات است
سیاسی و اجتماعی2 روز پیش

پیام رهبر انقلاب نقشه راه صیانت از منافع ملی در مسیر مذاکرات است

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.