دقت بالاتر هوش مصنوعی از پزشکان متخصص در اورژانس

نتایج یک مطالعهی تازه نشان میدهد که هوش مصنوعی در تشخیص بیماریهای پیچیده و حیاتی در محیط اورژانس، عملکردی دقیقتر از پزشکان متخصص دارد. این پژوهش که روی مدل زبانی بزرگ o1 شرکت OpenAI انجام شده، حاکی از برتری نسبی این سامانه در شرایط بحرانی و با اطلاعات محدود است.
مدل o1 در شرایطی که تنها دادههای اولیه و ناقص از بیمار در دسترس بود، در حدود ۶۷ درصد موارد تشخیص درست یا بسیار نزدیک به واقعیت ارائه کرد. این در حالی است که نرخ موفقیت پزشکان انسانی در همین موقعیتها بین ۵۰ تا ۵۵ درصد گزارش شده است.
پژوهشگران برای سنجش توانایی این مدل، پنج آزمون متفاوت شامل تحلیل پروفایلهای پزشکی و پیشبینی تغییرات وضعیت سلامتی بیماران طراحی کردند. نتایج حاکی از آن بود که o1 در تمامی این مراحل، عملکردی مشابه یا برتر نسبت به پزشکان داشته است.
آدام رادمن، یکی از پژوهشگران اصلی این پروژه، اشاره کرد که در یک آزمون خاص، مدل هوش مصنوعی در ۹۸ درصد موارد نمرهی کامل استدلال بالینی را کسب کرد. در مقابل، پزشکان متخصص تنها در ۳۵ درصد موارد به این سطح از دقت دست یافتند.
بحرانیترین بخش این مطالعه، بررسی عملکرد مدل در سه مرحلهی پذیرش بیمار در اورژانس بود. در چنین محیطی، پزشکان معمولاً با فشار کاری بالا و اطلاعات ناقصی از سوی بیماران مواجه هستند که احتمال خطای انسانی را افزایش میدهد.
تیم تحقیقاتی با استفاده از دادههای واقعی بیماران، واکنش مدل را در برابر اطلاعات «نامنظم و ناقص» ارزیابی کردند. نتایج تأیید کرد که حتی با وجود نقص در ورودیها، هوش مصنوعی حدود ۱۰ درصد دقیقتر از پزشکان عمل میکند.
توماس باکلی، دانشمند علوم کامپیوتر در دانشگاه هاروارد، این مرحله را مهمترین بخش آزمایش دانست، زیرا مستقیماً روی دادههای دنیای واقعی متمرکز بود.
با وجود این موفقیتها، متخصصان هشدار میدهند که مدل مذکور هنوز برای جایگزینی کامل با انسان آماده نیست. یکی از محدودیتهای اصلی، ناتوانی آن در تحلیل دادههای طولانیمدت مربوط به بیماران بستریشده است.
همچنین این مطالعه صرفاً روی متون نوشتاری متمرکز بوده و ورودیهای غیرمتنی مانند تصاویر رادیولوژی یا امآرآی که در تشخیص سرطان و لختههای خونی نقشی حیاتی دارند، در نظر گرفته نشده است.
