با ما همراه باشید

تکنولوژی

مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد

مطالعه‌ای جدید نشان می‌دهد که اکثر مدل‌های زبانی هوش مصنوعی در تشخیص اولیه بیماری‌ها عملکرد خوبی ندارند.

منتشر شده

در

مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد

مطالعه‌ای جدید نشان داده است که مدل‌های هوش مصنوعی هنوز برای استفاده پزشکی آماده نیستند. در این پژوهش مدل‌های زبانی نتوانسته در ۸۰ درصد مواقع تشخیص اولیه مناسبی برای بیماری‌ها داشته باشند. محققان می‌گویند هوش مصنوعی مولد فاقد قابلیت استدلال مناسب برای استفاده بالینی ایمن است.

محققان بیمارستان Mass General Brigham بوستون دریافتند که چت‌بات‌های هوش مصنوعی در مواجهه با اطلاعات بالینی جامع عملکرد خوبی در تشخیص بیماری‌ها پیدا کرده‌اند، اما همچنان در تشخیص افتراقی در بیش از ۸۰ درصد مواقع شکست می‌خورند.

عملکرد ناموفق مدل‌های هوش مصنوعی در تشخیص افتراقی بیماری‌ها

پژوهشگران در این مطالعه ۲۱ مدل زبانی بزرگ ازجمله جدیدترین نسخه‌های جمینای، GPT، گراک، Claude و دیپ‌سیک را آزمایش کردند. آن‌ها این مدل‌ها را از طریق ابزاری موسوم به PrIME-LLM در ۲۹ آزمون بالینی استاندارد تحت ارزیابی قرار دادند. این ابزار توانایی‌های مدل را در مراحل مختلف استدلال بالینی بررسی می‌کند: از تشخیص اولیه و مرتب‌سازی نتایج آزمایشات گرفته، تا رسیدن به تشخیص نهایی و برنامه‌ریزی برای درمان.

مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد
مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد

محققان می‌گویند مدل‌های زبانی در رسیدن به تشخیص نهایی دقت بالایی داشتند، اما در تشخیص افتراقی و عبور از تردیدها ضعیف عمل کردند. تشخیص افتراقی مرحله‌ای حیاتی در تشخیص‌های پزشکی است که طی آن متخصصان یک بیماری را شناسایی و آن را از سایر علائم متمایز می‌کنند.

همه مدل‌ها در بیش از ۸۰ درصد مواقع در تشخیص افتراقی ناموفق عمل می‌کردند، اما با دریافت اطلاعات جامع، در تشخیص نهایی نرخ موفقیت حدود ۶۰ تا ۹۰ درصدی داشتند. طبق این تحقیق، مدل‌های گراک ۴، جی‌پی‌تی ۵، جی‌پی‌تی ۴.۵، کلود ۴.۵ اوپوس، جمینای ۳ فلش و جمینای ۳ پرو از بقیه بهتر ظاهر شدند.

پژوهشگران یادآور شده‌اند که مدل‌های عمومی برای استدلال بالینی مهارت‌های کافی ندارند و برای این کاربردها باید به‌سراغ مدل‌های تخصصی‌تر رفت. بنابراین ضروری است که در صورت استفاده از هوش مصنوعی در امور پزشکی، همچنان انسان‌ها در این فرایند حضور داشته باشند تا نتیجه کار را بررسی کنند.

نتایج این تحقیق در ژورنال JAMA Network Open منتشر شده است.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سینمای ایران و جهان10 دقیقه پیش

دیدار انجمن مدیران و دستیاران تدارکات با ۳ سینماگر آسیب‌دیده جنگ

امیرحسین قیاسی پس از استوری جنجالی، عذرخواهی کرد
سینمای ایران و جهان15 دقیقه پیش

امیرحسین قیاسی پس از استوری جنجالی، عذرخواهی کرد

حضور شبانه 25 میلیون ایرانی در میدان/حمایت 67 درصدی از تداوم حضور
سینمای ایران و جهان15 دقیقه پیش

حضور شبانه 25 میلیون ایرانی در میدان/حمایت 67 درصدی از تداوم حضور

سینمای ایران و جهان1 ساعت پیش

«پدرکشتگی» با موضوع جنگ تولید شد

یگانه: حمایت حداکثری از واحدهای اقتصادی برای افزایش تاب‌آوری ضروری است
سیاسی و اجتماعی2 ساعت پیش

یگانه: حمایت حداکثری از واحدهای اقتصادی برای افزایش تاب‌آوری ضروری است

صیادان میانکاله در خط مقدم حفاظت از فوک خزری هستند
سیاسی و اجتماعی2 ساعت پیش

صیادان میانکاله در خط مقدم حفاظت از فوک خزری هستند

آتش‌سوزی واحد تولید روغن شهرضا اطفا شد؛ مصدومیت ۲ نفر
سیاسی و اجتماعی2 ساعت پیش

آتش‌سوزی واحد تولید روغن شهرضا اطفا شد؛ مصدومیت ۲ نفر

۷ هزار بازرسی از بازار آذربایجان غربی در جنگ رمضان انجام شد
سیاسی و اجتماعی2 ساعت پیش

۷ هزار بازرسی از بازار آذربایجان غربی در جنگ رمضان انجام شد

پیشکسوت فوتبال خوزستان و پرسپولیس تهران درگذشت
سیاسی و اجتماعی2 ساعت پیش

پیشکسوت فوتبال خوزستان و پرسپولیس تهران درگذشت

فرماندار بوشهر: روند جبران خسارت‌های جنگ با تمام توان در حال انجام است
سیاسی و اجتماعی2 ساعت پیش

فرماندار بوشهر: روند جبران خسارت‌های جنگ با تمام توان در حال انجام است

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.