تفوق نموذج الذكاء الاصطناعي على أطباء الطوارئ في تشخيص المرضى، في دراسة جديدة: NPR

اختبر الباحثون نموذج الذكاء الاصطناعي ضد أطباء الطوارئ ووجدوا أن النموذج تفوق على البشر.

شيبشارج / إي + / جيتي إيماجيس

إخفاء التسمية التوضيحية

تبديل التسمية التوضيحية

شيبشارج / إي + / جيتي إيماجيس

يظهر مريض في المستشفى مصابًا بانسداد رئوي – جلطة دموية انتقلت إلى الرئتين. وبعد التحسن الأولي، تبدأ الأعراض في التفاقم. يشتبه الفريق الطبي في أن الدواء لا يعمل.

في خطوات الذكاء الاصطناعي – بنظريته الخاصة.

لقد قام بفحص السجلات الطبية ويشتبه في أن وجود تاريخ من مرض الذئبة، وهي حالة من أمراض المناعة الذاتية يمكن أن تؤدي إلى التهاب القلب، يمكن أن يفسر سبب مرض المريض حقًا.

وتبين أن نموذج الذكاء الاصطناعي صحيح.

طبيب رقمي على خلفية تصميم مسطحة مجانية. مفهوم الأسئلة والأجوبة الطبية عبر الإنترنت.

وهذا النوع من السيناريوهات يمكن أن يصبح حقيقة في المستقبل غير البعيد، بحسب دراسة نشرت الخميس في المجلة. علوم.

وجد الباحثون المقيمون في كلية الطب بجامعة هارفارد ومركز بيث إسرائيل ديكونيس الطبي أن نموذج الاستدلال للذكاء الاصطناعي، الذي طورته شركة OpenAI، تفوق في تشخيص المرضى واتخاذ القرارات بشأن إدارة رعايتهم. لقد طابق الأطباء وتفوق في كثير من الأحيان على نموذج الذكاء الاصطناعي السابق، Chat GPT-4.

أجرى الباحثون سلسلة من التجارب على نموذج الذكاء الاصطناعي لاختبار فطنته السريرية، بما في ذلك الحالات الفعلية مثل مريض الذئبة الذي عولج سابقًا في قسم الطوارئ في بيث إسرائيل في بوسطن.

قام الفريق بتقييم مدى قدرة نموذج الذكاء الاصطناعي على توفير تشخيص دقيق في ثلاث لحظات زمنية، بدءًا من مرحلة الفرز في غرفة الطوارئ وحتى دخول المستشفى.

بشكل عام، تفوق الذكاء الاصطناعي في الأداء على طبيبين من ذوي الخبرة، وقد فعل ذلك باستخدام السجلات الصحية الإلكترونية والمعلومات المحدودة التي كانت متاحة للأطباء في ذلك الوقت فقط.

وقال الدكتور آدم رودمان، الباحث السريري في بيث إسرائيل وأحد مؤلفي الدراسة: “هذا هو الاستنتاج الكبير بالنسبة لي، فهو يعمل مع بيانات العالم الحقيقي الفوضوية لقسم الطوارئ”. “إنه يعمل على إجراء التشخيص في العالم الحقيقي.”

صورة رقمية تم إنشاؤها لشاب من أصل أمريكي من أصل أفريقي يرتدي بدلة واقفًا على منحدر أرجواني وينظر إلى أيقونات دردشة متعددة الرسائل. مفهوم التواصل بالذكاء الاصطناعي chatbot.

اعتمدت أجزاء أخرى من الدراسة على تقارير حالة صعبة نشرت في مجلة نيو انغلاند جورنال اوف ميديسين ومقالات إكلينيكية لمعرفة ما إذا كان نموذج الذكاء الاصطناعي قادرًا على تلبية “المعايير” الراسخة والإجابة على الأسئلة التشخيصية الشائكة.

وقال راج مانراي، الأستاذ المساعد للمعلوماتية الطبية الحيوية في كلية الطب بجامعة هارفارد والذي كان أيضًا جزءًا من الدراسة: “لقد تفوق النموذج على خط الأساس الطبي الكبير لدينا”.

يؤكد المؤلفون على أن البحث يعتمد على النص وحده، بينما في الحياة الواقعية، يحتاج الأطباء إلى الاهتمام بالعديد من المدخلات الأخرى مثل الصور والأصوات والإشارات غير اللفظية عند تشخيص المريض وعلاجه.

ومع ذلك، فإن هذا العمل يوضح مدى تقدم التكنولوجيا في السنوات القليلة الماضية. تعثرت الأجيال السابقة من نماذج اللغات الكبيرة عند التعامل مع عدم اليقين، وفي إنشاء قائمة من الحالات المحتملة للتحقق، وهو ما يعرف بالتشخيص التفريقي.

يقول الدكتور ديفيد رايش، كبير المسؤولين الطبيين في نظام ماونت سيناي الصحي في نيويورك، والذي لم يشارك في العمل: “إن هذه الورقة هي ملخص جميل لمدى تحسن الأمور”.

يقول: “لديك شيء دقيق تمامًا، وربما يكون جاهزًا للاستخدام في أوقات الذروة”. “والسؤال المطروح الآن هو كيف يمكنك إدخاله في سير العمل السريري بطرق تعمل بالفعل على تحسين الرعاية؟”

بعد كل شيء، فإن الوصول إلى تشخيص نهائي وصعب – وهو ما يتألق فيه نموذج الذكاء الاصطناعي – لا يعكس بالضرورة كيفية سير الأمور “في الطب السريري الحقيقي”، كما يقول رايش، حيث “تكون النتائج أكثر دقة وربما أكثر تنوعًا”.

ولا يمثل قسم الطوارئ سوى جزء صغير من إجمالي الرعاية الطبية للمريض. يعترف رودمان أنه من غير المحتمل أن يقوم الذكاء الاصطناعي بمثل هذا العمل “المثير للإعجاب” لو أن الفريق زوده بسجلات شخص قضى شهرًا في المستشفى.

لا يعتقد أي من المشاركين في الدراسة الجديدة أن النتائج تدعم استبدال الأطباء بالذكاء الاصطناعي، “على الرغم مما من المحتمل أن تقوله بعض الشركات وكيف من المحتمل أن تستخدم هذه النتائج”، كما يقول مانراي.

ويضيف: “أعتقد أن هذا يعني أننا نشهد تغيرًا عميقًا حقًا في التكنولوجيا من شأنه أن يعيد تشكيل الطب”.

لكن النتائج تشير إلى ضرورة اختبار نماذج الذكاء الاصطناعي بطريقة صارمة، ومن الأفضل من خلال تجارب تطلعية يمكن أن تعطي المزيد من اليقين حول كيفية تأثير التكنولوجيا في نهاية المطاف على الممارسة السريرية.

يقول رايخ: “إن تصميم هذه التجارب عملية صعبة للغاية، لكن هذه الدراسة هي دعوة مثالية للعمل”.

إتبعنا