با ما همراه باشید

تکنولوژی

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

پژوهشگران متوجه شدند که هوش مصنوعی ChatGPT با دریافت دستوراتی ساده، تصاویر بسیار خشن و جنسی تولید می‌کند.

منتشر شده

در

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

کارشناسان امنیتی متوجه شدند که ChatGPT با دریافت چند دستور ساده، حصارهای امنیتی خود را می‌شکند و محتوای بسیار آزاردهنده‌ای تولید می‌کند. این اتفاق نگرانی‌های شدیدی را درباره نحوه آموزش مدل‌های زبانی و امنیت کاربران در فضای مجازی ایجاد کرده است.

کارشناسان استارتاپ بریتانیایی Mindgard که در زمینه امنیت هوش مصنوعی فعالیت می‌کنند، با تغییردادن پرامپت ساده و وایرال‌شده ChatGPT، موفق به شکستن گاردریل‌های این هوش مصنوعی امنیتی شدند. آن‌ها دریافتند که مدل جدید GPT-5.4 با دریافت دستوراتی گنگ و بدون اشاره مستقیم به محتوای نامناسب، فیلترهای امنیتی خود را دور می‌زند. برای مثال، پژوهشگران از این چت‌بات خواستند تا یک عکس فرضی را که وجود خارجی نداشت، بدون هیچ قضاوت یا سانسوری بازیابی کند.

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

نتیجه این درخواست خروجی‌هایی بسیار وحشتناک و گاهی غیراخلاقی بود. نکته نگران‌کننده این است که کاربر هیچ موضوع خاصی را در دستور خود مشخص نمی‌کند، اما هوش مصنوعی این تصاویر را کاملاً با اختیار خود ایجاد می‌کند، گویی وارد تاریک‌ترین بخش‌های پایگاه داده خود می‌شود.

تصاویر خشن و غیراخلاقی ChatGPT

«جیم نایتینگل» (Jim Nightingale)، پژوهشگر امنیت که این نقص را کشف کرده است، می‌گوید دیدن این خروجی‌ها او را بسیار تحت تأثیر قرار داد و باعث گریه او شد. او در گزارش خود توضیح می‌دهد که این هوش مصنوعی تصاویری از یک دختر دانشجو را نشان داد که با دست‌وپای بسته در یک اتاق کثیف زندانی شده بود. چت‌بات این تصویر را با عنوان «رهاشده در ترس» نام‌گذاری کرد.

تصاویر خشن و غیراخلاقی ChatGPT
محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

در موردی بدتر، هوش مصنوعی تصویری از یک صحنه جرم خونین و بدن بی‌جان یک زن را رسم کرد که نشانه‌هایی از خشونت در آن نمایان بود. نایتینگل تأکید می‌کند که هرچند این تصاویر مصنوعی هستند، اما ریشه در داده‌ها و عکس‌های قربانیان واقعی در دنیای حقیقی دارند. او پیش‌ازاین نیز ثابت کرده بود که افراد می‌توانند با فریب‌دادن چت‌جی‌پی‌تی، دیپ‌فیک‌های برهنه از چهره انسان‌های واقعی بسازند.

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

توسعه‌دهندگان این هوش مصنوعی در ابتدا واکنش مناسبی به این بحران نشان ندادند. کارشناسان مایندگارد در ماه مه یافته‌های خود را با این شرکت به اشتراک گذاشتند، اما فقط یک پاسخ خودکار از هوش مصنوعی دریافت کردند. پس از اینکه BBC به این موضوع ورود کرد، سازندگان این چت‌بات اعلام کردند که لایه‌های امنیتی جدیدی را برای مسدودکردن این دستورات ایجاد کرده‌اند.

سرانجام در تاریخ ۸ ژوئن ۲۰۲۶، یکی از نمایندگان این شرکت مدعی شد که آن‌ها مشکل را به‌طور کامل برطرف کرده‌اند. با‌این‌حال، پژوهشگران مایندگارد متوجه شدند که این راهکارها بی‌اثر هستند و با یک تغییر جزئی در دستورات، دوباره می‌توان به همان تصاویر آزاردهنده دست پیدا کرد.

دلیل اصلی این آسیب‌پذیری به ساختار پایه‌ای مدل‌های زبانی برمی‌گردد؛ زیرا آن‌ها درکی مشابه انسان از مفاهیم ندارند. دکتر «رومان چودری» (Rumman Chowdhury)، کارشناس ارزیابی مدل‌های هوش مصنوعی، توضیح می‌دهد که این برنامه‌ها هیچ درکی از نیت کاربر، بافتار متن، یا مفهوم درست و غلط ندارند. او این مسئله را به یک بازی موش و گربه تشبیه می‌کند که در آن، با پیشرفت سیستم‌های امنیتی، روش‌های نفوذ به آن‌ها نیز پیچیده‌تر می‌شوند.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

جیمز باند بعدی از نظر جورج کلونی کیست؟
سینمای ایران و جهان19 دقیقه پیش

جیمز باند بعدی از نظر جورج کلونی کیست؟

خودرو42 دقیقه پیش

جهانی‌سازی یا بازگشت به مرزهای اقتصادی؟

سرمست: فرش قرمز آذربایجان شرقی برای سرمایه‌گذاران خارجی پهن است
سیاسی و اجتماعی51 دقیقه پیش

سرمست: فرش قرمز آذربایجان شرقی برای سرمایه‌گذاران خارجی پهن است

جدیدترین قیمت دلار و یورو امروز شنبه ۳۰ خرداد ۱۴۰۵/ کاهش قیمت یا افزایش؟
اقتصاد پولی مالی2 ساعت پیش

جدیدترین قیمت دلار و یورو امروز شنبه ۳۰ خرداد ۱۴۰۵/ کاهش قیمت یا افزایش؟

سیاسی و اجتماعی2 ساعت پیش

ادعای ونس درباره باز بودن تنگه هرمز/ حقیقت چیست؟

مدیران عامل OpenAI، آنتروپیک و دیپ‌مایند گوگل در اجلاس سران گروه هفت حاضر شدند
تکنولوژی3 ساعت پیش

مدیران عامل OpenAI، آنتروپیک و دیپ‌مایند گوگل در اجلاس سران گروه هفت حاضر شدند

ابزار Claude Code حالا می‌تواند برای طراحی گرافیک به Claude Design وصل شود
تکنولوژی3 ساعت پیش

ابزار Claude Code حالا می‌تواند برای طراحی گرافیک به Claude Design وصل شود

جف بزوس: هوش مصنوعی به‌جای بیکاری، باعث کمبود نیروی کار می‌شود
تکنولوژی3 ساعت پیش

جف بزوس: هوش مصنوعی به‌جای بیکاری، باعث کمبود نیروی کار می‌شود

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد
تکنولوژی3 ساعت پیش

محققان: ChatGPT با دستورات ساده می‌تواند تصاویر بسیار خشن و غیراخلاقی بسازد

گام بزرگ چین: معرفی اقدامات جدید برای ادغام هوش مصنوعی در بازار مصرفی
تکنولوژی3 ساعت پیش

گام بزرگ چین: معرفی اقدامات جدید برای ادغام هوش مصنوعی در بازار مصرفی

آوج غرق در ماتم حسینی؛ چهارمین شب محرم با حضور حماسی مردم
سیاسی و اجتماعی2 روز پیش

آوج غرق در ماتم حسینی؛ چهارمین شب محرم با حضور حماسی مردم

قالیباف: اوامر حضرتعالی را نصب العین خود قرار می‌دهیم
سیاسی و اجتماعی2 روز پیش

قالیباف: اوامر حضرتعالی را نصب العین خود قرار می‌دهیم

سیاسی و اجتماعی2 روز پیش

پیام رهبر انقلاب درباره تفاهم‌نامه روسای جمهور ایران و آمریکا

توسعه سینما از طریق دولتی‌کردن آن، تجربه‌ای شکست‌ خورده است/ همه جای دنیا، دولت بسترسازی و بخش خصوصی سرمایه‌گذاری می‌کند
سینمای ایران و جهان2 روز پیش

توسعه سینما از طریق دولتی‌کردن آن، تجربه‌ای شکست‌ خورده است/ همه جای دنیا، دولت بسترسازی و بخش خصوصی سرمایه‌گذاری می‌کند

سناریوی پیش‌روی بازار‌ها پس از تفاهم ایران و آمریکا | دلار ۱۴۰ هزار تومانی در راه است؟
اقتصاد پولی مالی2 روز پیش

سناریوی پیش‌روی بازار‌ها پس از تفاهم ایران و آمریکا | دلار ۱۴۰ هزار تومانی در راه است؟

توزیع سه میلیون پاکت شیرخشک یارانه‌ای واگذار می‌شود
پزشکی و سلامت2 روز پیش

توزیع سه میلیون پاکت شیرخشک یارانه‌ای واگذار می‌شود

رامین رضاییان خلاق‌ترین بازیکن دور نخست مرحله گروهی جام جهانی ۲۰۲۶+ عکس
ورزشی2 روز پیش

رامین رضاییان خلاق‌ترین بازیکن دور نخست مرحله گروهی جام جهانی ۲۰۲۶+ عکس

فوری/ سازمان ملل هشدار داد
سیاسی و اجتماعی1 روز پیش

فوری/ سازمان ملل هشدار داد

راهنمای خرید دستگاه لیزر برای کلینیک؛ چطور بهترین انتخاب را داشته باشیم؟
پزشکی و سلامت2 روز پیش

راهنمای خرید دستگاه لیزر برای کلینیک؛ چطور بهترین انتخاب را داشته باشیم؟

پزشکی و سلامت1 روز پیش

بحران «فاکتور ۱۳»؛ جان بیماران در خطر است

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.