دراسة يؤديها جوجل الأبحاث بالتعاون مع جوجل ديب مايند، يكشف أن عملاق التكنولوجيا قام بتوسيع قدرات نماذج الذكاء الاصطناعي الخاصة به لـ Med-Gemini-2D وMed-Gemini-3D وMed-Gemini Polygenic.
وقالت جوجل إنها قامت بضبط قدرات Med-Gemini باستخدام بيانات التشريح المرضي والأمراض الجلدية والأشعة ثنائية وثلاثية الأبعاد والبيانات الجينومية وطب العيون.
تم تدريب Med-Gemini-2 الخاص بالشركة على الصور الطبية التقليدية المشفرة بتقنية ثنائية الأبعاد، مثل شرائح التصوير المقطعي المحوسب والبقع المرضية والأشعة السينية للصدر.
يقوم Med-Gemini-3D بتحليل البيانات الطبية ثلاثية الأبعاد، وقد قامت Google بتدريب Med-Gemini-Polygenic على ميزات غير متعلقة بالصور مثل علم الجينوم.
كشفت الدراسة أن النموذج المكرر لـ Med-Gemini-2D تجاوز النتائج السابقة لإنشاء تقارير مدعومة بالذكاء الاصطناعي لأشعة الصدر السينية بنسبة 1% إلى 12%، مع كون التقارير “معادلة أو أفضل” من تقارير أخصائيي الأشعة الأصلية.
كما تجاوز النموذج أيضًا أدائه السابق فيما يتعلق بالإجابة على الأسئلة المرئية بالأشعة السينية على الصدر بفضل التحسينات في برنامج التشفير البصري ومكون اللغة في Gemini.
كما كان أداؤها جيدًا أيضًا في تصنيف الأشعة السينية للصدر والإجابة على الأسئلة البصرية للأشعة، متجاوزًا خطوط الأساس السابقة في 17 مهمة من أصل 20؛ ومع ذلك، في طب العيون، وعلم الأنسجة والأمراض الجلدية، تجاوز Med-Gemini-2D خطوط الأساس في 18 من 20 مهمة.
يستطيع Med-Gemini-3D قراءة عمليات المسح ثلاثية الأبعاد، مثل الأشعة المقطعية، والإجابة على الأسئلة المتعلقة بالصور.
أثبت النموذج أنه أول ماجستير في القانون قادر على إنشاء تقارير لعمليات المسح المقطعي ثلاثي الأبعاد. ومع ذلك، فإن 53% فقط من التقارير كانت مقبولة سريريًا. وأقرت الشركة بأن البحث الإضافي ضروري للتكنولوجيا للوصول إلى جودة تقارير أخصائي الأشعة.
Med-Gemini-Polygenic هو النموذج الأول للشركة الذي يستخدم بيانات الجينوم للتنبؤ بالنتائج الصحية.
كتب المؤلفون أن النموذج تفوق في الأداء على “النهج الخطي القائم على درجة المخاطر الجينية المتعددة للتنبؤ بمخاطر الأمراض وتعميمه على الأمراض المرتبطة وراثيا والتي لم يتم تدريبه عليها من قبل”.
الاتجاه الأكبر
أبلغ الباحثون عن قيود في الدراسة، مشيرين إلى أنه من الضروري تحسين النماذج متعددة الوسائط للتطبيقات السريرية المتنوعة ذات الصلة، وتقييمها على نطاق واسع على مجموعات البيانات السريرية المناسبة، واختبارها خارج المعايير الأكاديمية التقليدية لضمان السلامة والموثوقية في مواقف العالم الحقيقي.
وأشار مؤلفو الدراسة أيضًا إلى أن “مجموعة متنوعة بشكل متزايد من المتخصصين في الرعاية الصحية بحاجة إلى المشاركة بعمق في التكرارات المستقبلية لهذه التكنولوجيا، مما يساعد في توجيه النماذج نحو القدرات التي لها فائدة قيمة في العالم الحقيقي”.
وتم ذكر عدد من المجالات التي ينبغي أن تركز عليها التقييمات المستقبلية، بما في ذلك سد الفجوة بين المعيار والجانب السريري، وتقليل تلوث البيانات في النماذج الكبيرة، وتحديد وتخفيف مخاطر السلامة وتحيز البيانات.
“على الرغم من أن القدرات المتقدمة في المهام الطبية الفردية مفيدة في حد ذاتها، إلا أننا نتصور مستقبلًا يتم فيه دمج كل هذه القدرات معًا في أنظمة شاملة لأداء مجموعة من المهام السريرية المعقدة متعددة التخصصات، والعمل جنبًا إلى جنب مع البشر لتحقيق أقصى قدر من الفعالية السريرية وتحسينها.” وكتب الباحثون أن النتائج المقدمة في هذه الدراسة تمثل خطوة نحو تحقيق هذه الرؤية.