با ما همراه باشید

تکنولوژی

مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد

مطالعه‌ای جدید نشان می‌دهد که اکثر مدل‌های زبانی هوش مصنوعی در تشخیص اولیه بیماری‌ها عملکرد خوبی ندارند.

منتشر شده

در

مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد

مطالعه‌ای جدید نشان داده است که مدل‌های هوش مصنوعی هنوز برای استفاده پزشکی آماده نیستند. در این پژوهش مدل‌های زبانی نتوانسته در ۸۰ درصد مواقع تشخیص اولیه مناسبی برای بیماری‌ها داشته باشند. محققان می‌گویند هوش مصنوعی مولد فاقد قابلیت استدلال مناسب برای استفاده بالینی ایمن است.

محققان بیمارستان Mass General Brigham بوستون دریافتند که چت‌بات‌های هوش مصنوعی در مواجهه با اطلاعات بالینی جامع عملکرد خوبی در تشخیص بیماری‌ها پیدا کرده‌اند، اما همچنان در تشخیص افتراقی در بیش از ۸۰ درصد مواقع شکست می‌خورند.

عملکرد ناموفق مدل‌های هوش مصنوعی در تشخیص افتراقی بیماری‌ها

پژوهشگران در این مطالعه ۲۱ مدل زبانی بزرگ ازجمله جدیدترین نسخه‌های جمینای، GPT، گراک، Claude و دیپ‌سیک را آزمایش کردند. آن‌ها این مدل‌ها را از طریق ابزاری موسوم به PrIME-LLM در ۲۹ آزمون بالینی استاندارد تحت ارزیابی قرار دادند. این ابزار توانایی‌های مدل را در مراحل مختلف استدلال بالینی بررسی می‌کند: از تشخیص اولیه و مرتب‌سازی نتایج آزمایشات گرفته، تا رسیدن به تشخیص نهایی و برنامه‌ریزی برای درمان.

مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد
مطالعه جدید:‌ هوش مصنوعی در ۸۰ درصد مواقع در تشخیص اولیه بیماری‌ها شکست می‌خورد

محققان می‌گویند مدل‌های زبانی در رسیدن به تشخیص نهایی دقت بالایی داشتند، اما در تشخیص افتراقی و عبور از تردیدها ضعیف عمل کردند. تشخیص افتراقی مرحله‌ای حیاتی در تشخیص‌های پزشکی است که طی آن متخصصان یک بیماری را شناسایی و آن را از سایر علائم متمایز می‌کنند.

همه مدل‌ها در بیش از ۸۰ درصد مواقع در تشخیص افتراقی ناموفق عمل می‌کردند، اما با دریافت اطلاعات جامع، در تشخیص نهایی نرخ موفقیت حدود ۶۰ تا ۹۰ درصدی داشتند. طبق این تحقیق، مدل‌های گراک ۴، جی‌پی‌تی ۵، جی‌پی‌تی ۴.۵، کلود ۴.۵ اوپوس، جمینای ۳ فلش و جمینای ۳ پرو از بقیه بهتر ظاهر شدند.

پژوهشگران یادآور شده‌اند که مدل‌های عمومی برای استدلال بالینی مهارت‌های کافی ندارند و برای این کاربردها باید به‌سراغ مدل‌های تخصصی‌تر رفت. بنابراین ضروری است که در صورت استفاده از هوش مصنوعی در امور پزشکی، همچنان انسان‌ها در این فرایند حضور داشته باشند تا نتیجه کار را بررسی کنند.

نتایج این تحقیق در ژورنال JAMA Network Open منتشر شده است.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اقتصاد پولی مالی46 دقیقه پیش

راز ارزانی «دلار تراولی»

اقتصاد پولی مالی50 دقیقه پیش

قیمت طلای ۱۸ عیار امروز چهارشنبه ۲ اردیبهشت ۱۴۰۵/ افزایش قیمت؟

اقتصاد پولی مالی51 دقیقه پیش

قیمت سکه، نیم‌سکه و ربع‌سکه امروز چهارشنبه ۲‌‌‌‌‌‌ اردیبهشت ۱۴۰۵/ افزایش قیمت‌ها؟

فوری/ پاکستان تاریخ مذاکرات را اعلام کرد
سیاسی و اجتماعی57 دقیقه پیش

فوری/ پاکستان تاریخ مذاکرات را اعلام کرد

مد و زیبایی2 ساعت پیش

عفونت پوستی ناشی از نیش حشرات: علل ، علائم و درمان

هشدار محققان: هوش مصنوعی می‌تواند اعتماد کاربران به قدرت تفکرشان را از بین ببرد
تکنولوژی2 ساعت پیش

هشدار محققان: هوش مصنوعی می‌تواند اعتماد کاربران به قدرت تفکرشان را از بین ببرد

دیدار محرمانه در کاخ سفید؛ دولت آمریکا به‌دنبال همکاری مجدد با آنتروپیک است
تکنولوژی2 ساعت پیش

دیدار محرمانه در کاخ سفید؛ دولت آمریکا به‌دنبال همکاری مجدد با آنتروپیک است

مدیرعامل انویدیا: ترکیب دیپ‌سیک با تراشه‌های هواوی سلطه آمریکا را به خطر می‌اندازد
تکنولوژی2 ساعت پیش

مدیرعامل انویدیا: ترکیب دیپ‌سیک با تراشه‌های هواوی سلطه آمریکا را به خطر می‌اندازد

قابلیت جدید Character.AI معرفی شد: تبدیل کتاب به تجربه نقش‌آفرینی تعاملی
تکنولوژی2 ساعت پیش

قابلیت جدید Character.AI معرفی شد: تبدیل کتاب به تجربه نقش‌آفرینی تعاملی

پروژه عظیم ترامپ برای ساخت دیتاسنتر هوش مصنوعی با مشکلات متعدد مواجه شد
تکنولوژی2 ساعت پیش

پروژه عظیم ترامپ برای ساخت دیتاسنتر هوش مصنوعی با مشکلات متعدد مواجه شد

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.