با ما همراه باشید

تکنولوژی

مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد

مطالعه‌ای جدید نشان می‌دهد که اکثر مدل‌های زبانی هوش مصنوعی در تشخیص اولیه بیماری‌ها عملکرد خوبی ندارند.

منتشر شده

در

مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد

مطالعه‌ای جدید نشان داده است که مدل‌های هوش مصنوعی هنوز برای استفاده پزشکی آماده نیستند. در این پژوهش مدل‌های زبانی نتوانسته در ۸۰ درصد مواقع تشخیص اولیه مناسبی برای بیماری‌ها داشته باشند. محققان می‌گویند هوش مصنوعی مولد فاقد قابلیت استدلال مناسب برای استفاده بالینی ایمن است.

محققان بیمارستان Mass General Brigham بوستون دریافتند که چت‌بات‌های هوش مصنوعی در مواجهه با اطلاعات بالینی جامع عملکرد خوبی در تشخیص بیماری‌ها پیدا کرده‌اند، اما همچنان در تشخیص افتراقی در بیش از ۸۰ درصد مواقع شکست می‌خورند.

عملکرد ناموفق مدل‌های هوش مصنوعی در تشخیص افتراقی بیماری‌ها

پژوهشگران در این مطالعه ۲۱ مدل زبانی بزرگ ازجمله جدیدترین نسخه‌های جمینای، GPT، گراک، Claude و دیپ‌سیک را آزمایش کردند. آن‌ها این مدل‌ها را از طریق ابزاری موسوم به PrIME-LLM در ۲۹ آزمون بالینی استاندارد تحت ارزیابی قرار دادند. این ابزار توانایی‌های مدل را در مراحل مختلف استدلال بالینی بررسی می‌کند: از تشخیص اولیه و مرتب‌سازی نتایج آزمایشات گرفته، تا رسیدن به تشخیص نهایی و برنامه‌ریزی برای درمان.

مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد
مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد

محققان می‌گویند مدل‌های زبانی در رسیدن به تشخیص نهایی دقت بالایی داشتند، اما در تشخیص افتراقی و عبور از تردیدها ضعیف عمل کردند. تشخیص افتراقی مرحله‌ای حیاتی در تشخیص‌های پزشکی است که طی آن متخصصان یک بیماری را شناسایی و آن را از سایر علائم متمایز می‌کنند.

همه مدل‌ها در بیش از ۸۰ درصد مواقع در تشخیص افتراقی ناموفق عمل می‌کردند، اما با دریافت اطلاعات جامع، در تشخیص نهایی نرخ موفقیت حدود ۶۰ تا ۹۰ درصدی داشتند. طبق این تحقیق، مدل‌های گراک ۴، جی‌پی‌تی ۵، جی‌پی‌تی ۴.۵، کلود ۴.۵ اوپوس، جمینای ۳ فلش و جمینای ۳ پرو از بقیه بهتر ظاهر شدند.

پژوهشگران یادآور شده‌اند که مدل‌های عمومی برای استدلال بالینی مهارت‌های کافی ندارند و برای این کاربردها باید به‌سراغ مدل‌های تخصصی‌تر رفت. بنابراین ضروری است که در صورت استفاده از هوش مصنوعی در امور پزشکی، همچنان انسان‌ها در این فرایند حضور داشته باشند تا نتیجه کار را بررسی کنند.

نتایج این تحقیق در ژورنال JAMA Network Open منتشر شده است.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

واکنش تند انجمن تجارت الکترونیک به تحریم صرافی‌های رمزارز
اقتصاد پولی مالی39 دقیقه پیش

واکنش تند انجمن تجارت الکترونیک به تحریم صرافی‌های رمزارز

لیست قیمت خرید مسکن در مشهد / خرید آپارتمان ۲ خوابه در مناطق مختلف این کلان‌شهر چقدر هزینه دارد؟ + جدول خردادماه ۱۴۰۵
ساختمان و معماری1 ساعت پیش

لیست قیمت خرید مسکن در مشهد / خرید آپارتمان ۲ خوابه در مناطق مختلف این کلان‌شهر چقدر هزینه دارد؟ + جدول خردادماه ۱۴۰۵

پرداخت هزینه‌های سلامت از جیب مردم به ۷۰ درصد رسیده است
پزشکی و سلامت1 ساعت پیش

پرداخت هزینه‌های سلامت از جیب مردم به ۷۰ درصد رسیده است

نمایشی که پس از ۵۰۰ اجرا باز هم به صحنه رفت!
سینمای ایران و جهان1 ساعت پیش

نمایشی که پس از ۵۰۰ اجرا باز هم به صحنه رفت!

«آرش» بیضایی در قالبی تازه/«ایرانی‌خوانی»؛ تلاش برای زنده نگه داشتن نمایشنامه‌های ایرانی
سینمای ایران و جهان1 ساعت پیش

«آرش» بیضایی در قالبی تازه/«ایرانی‌خوانی»؛ تلاش برای زنده نگه داشتن نمایشنامه‌های ایرانی

یادبود ماکان نصیری در میناب
سینمای ایران و جهان1 ساعت پیش

یادبود ماکان نصیری در میناب

یکشنبه‌های نیم‌بها برای دانشجویان همه رشته‌ها/ در تئاتر شهر چه می‌گذرد؟
سینمای ایران و جهان1 ساعت پیش

یکشنبه‌های نیم‌بها برای دانشجویان همه رشته‌ها/ در تئاتر شهر چه می‌گذرد؟

پزشکی و سلامت1 ساعت پیش

بهترین کرم ضد چروک بالای 50 سال؛ کدام کرم واقعاً چروک‌ها را کم می‌کند؟

سائوتومه و پرنسیپ؛ مسیر جدید و قانونی اخذ پاسپورت دوم برای ایرانیان
گردشگری و مهاجرت2 ساعت پیش

سائوتومه و پرنسیپ؛ مسیر جدید و قانونی اخذ پاسپورت دوم برای ایرانیان

سینمای جنگ ایران؛ از حماسه شهادت تا قهرمان متفکر
سینمای ایران و جهان2 ساعت پیش

سینمای جنگ ایران؛ از حماسه شهادت تا قهرمان متفکر

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.