Breaking News

أثبت Google Gemini أنه مدرب صحي أفضل من البشر


حان الوقت للاحتفال بالنساء الرائعات الرائدات في مجال الذكاء الاصطناعي! قم بترشيح قادتك الملهمين لجوائز VentureBeat's Ladies in AI اليوم قبل 18 يونيو. يتعلم أكثر


جوجل الجوزاء يبلغ عمره 6 أشهر فقط، ولكنه أظهر بالفعل قدرات رائعة عبره حماية, الترميز, تصحيح الأخطاء وغيرها من المجالات (وبطبيعة الحال، فقد عرضت قيود خطيرة، أيضاً).

الآن، نموذج لغة كبير (LLM) يتفوق على البشر عندما يتعلق الأمر بنصائح النوم واللياقة البدنية.

قدم الباحثون في جوجل نموذج اللغة الكبيرة للصحة الشخصية (PH-LLM)، وهي نسخة من برنامج Gemini تم ضبطها لفهم البيانات الصحية الشخصية المتسلسلة زمنيًا واستدلالها من الأجهزة القابلة للارتداء مثل الساعات الذكية وأجهزة مراقبة معدل ضربات القلب. وفي تجاربهم، أجاب النموذج على الأسئلة وقدم تنبؤات أفضل بشكل ملحوظ من الخبراء الذين لديهم سنوات من الخبرة في مجالات الصحة واللياقة البدنية.

“عملنا… يوظف الذكاء الاصطناعي التوليدي وكتب الباحثون: “لتوسيع فائدة النموذج من التنبؤ بالحالات الصحية فقط إلى توفير مخرجات متماسكة وسياقية وربما توجيهية تعتمد على السلوكيات الصحية المعقدة”.


التسجيل في VB Remodel 2024 مفتوح

انضم إلى قادة المؤسسات في سان فرانسيسكو في الفترة من 9 إلى 11 يوليو لحضور حدث الذكاء الاصطناعي الرائد لدينا. تواصل مع أقرانك، واستكشف الفرص والتحديات التي يواجهها الذكاء الاصطناعي التوليدي، وتعلم كيفية دمج تطبيقات الذكاء الاصطناعي في مجال عملك. سجل الان


الجوزاء كخبير في النوم واللياقة البدنية

يمكن للتكنولوجيا القابلة للارتداء أن تساعد الأشخاص على مراقبة صحتهم، ومن الناحية المثالية، إجراء تغييرات ذات معنى. ويشير باحثو جوجل إلى أن هذه الأجهزة توفر “مصدرًا غنيًا وطوليًا للبيانات” لمراقبة الصحة الشخصية التي يتم الحصول عليها “بشكل سلبي ومستمر” من المدخلات بما في ذلك سجلات التمارين والنظام الغذائي، ومجلات الحالة المزاجية، وأحيانًا حتى نشاط وسائل التواصل الاجتماعي.

ومع ذلك، فإن البيانات التي يجمعونها حول النوم والنشاط البدني وصحة القلب والأوعية الدموية والتوتر نادرًا ما يتم دمجها في الإعدادات السريرية “المتفرقة بطبيعتها”. على الأرجح، يفترض الباحثون أن السبب في ذلك هو أنه يتم التقاط البيانات دون سياق وتتطلب الكثير من العمليات الحسابية لتخزينها وتحليلها. علاوة على ذلك، قد يكون من الصعب تفسيرها.

أيضًا، في حين أن LLMs كان أداؤه جيدًا عندما يتعلق الأمر بـ الإجابة على الأسئلة الطبيةوتحليل السجلات الصحية الإلكترونية، والتشخيص بناءً على الصور الطبية والتقييمات النفسية، غالبًا ما يفتقرون إلى القدرة على التفكير وتقديم توصيات بشأن البيانات من الأجهزة القابلة للارتداء.

ومع ذلك، جوجل حقق الباحثون طفرة في تدريب PH-LLM لتقديم التوصيات والإجابة على أسئلة الفحص المهني والتنبؤ باضطرابات النوم المبلغ عنها ذاتيًا ونتائج ضعف النوم. تم إعطاء النموذج أسئلة متعددة الخيارات، كما أجرى الباحثون أيضًا سلسلة من الأفكار (محاكاة المنطق البشري) وأساليب اللقطة الصفرية (التعرف على الأشياء والمفاهيم دون مواجهتها من قبل).

ومن المثير للإعجاب، أن PH-LLM حققت 79% في اختبارات النوم و88% في اختبار اللياقة البدنية – وكلاهما تجاوز متوسط ​​الدرجات من عينة من الخبراء البشريين، بما في ذلك خمسة مدربين رياضيين محترفين (بمتوسط ​​خبرة 13.8 عامًا) وخمسة خبراء في طب النوم. (بمتوسط ​​خبرة 25 سنة). حقق البشر معدل متوسط ​​قدره 71% في اللياقة البدنية و76% في النوم.

في أحد الأمثلة على توصيات التدريب، طرح الباحثون النموذج التالي: “أنت خبير في طب النوم. يتم إعطاؤك بيانات النوم التالية. المستخدم ذكر، عمره 50 سنة. اذكر أهم الأفكار.”

أجاب PH-LLM: “إنهم يواجهون صعوبة في النوم … النوم العميق الكافي [is] مهم للتعافي الجسدي.” ونصحت العارضة أيضًا: “تأكد من أن غرفة نومك باردة ومظلمة… وتجنب القيلولة وحافظ على جدول نوم ثابت”.

وفي الوقت نفسه، عند طرح سؤال حول نوع التقلص العضلي الذي يحدث في العضلة الصدرية الكبرى “خلال المرحلة الهبوطية البطيئة والمسيطر عليها من تمرين الضغط على المقعد”. بالنظر إلى أربعة خيارات للإجابة، أجاب PH-LLM بشكل صحيح “غريب الأطوار”.

بالنسبة للدخل المسجل للمريض، سأل الباحثون النموذج: “استنادًا إلى هذه البيانات القابلة للارتداء، هل سيبلغ المستخدم عن وجود صعوبة في النوم؟”، فأجاب: “من المرجح أن يذكر هذا الشخص أنه واجه صعوبة في النوم عدة مرات على مدار الساعة”. الشهر الماضي.”

لاحظ الباحثون: «على الرغم من ضرورة إجراء المزيد من التطوير والتقييم في مجال الصحة الشخصية ذات الأهمية الحيوية للسلامة، إلا أن هذه النتائج توضح قاعدة المعرفة الواسعة وقدرات نماذج الجوزاء“.

يمكن أن يقدم الجوزاء رؤى شخصية

ولتحقيق هذه النتائج، أنشأ الباحثون أولاً ونظموا ثلاث مجموعات بيانات اختبرت الرؤى والتوصيات الشخصية من النشاط البدني الذي تم التقاطه، وأنماط النوم والاستجابات الفسيولوجية؛ معرفة مجال الخبراء؛ والتنبؤات حول جودة النوم المبلغ عنها ذاتيا.

لقد أنشأوا 857 دراسة حالة تمثل سيناريوهات العالم الحقيقي حول النوم واللياقة البدنية – 507 للأول و350 للأخير – بالتعاون مع خبراء المجال. استخدمت سيناريوهات النوم مقاييس فردية لتحديد العوامل المسببة المحتملة وتقديم توصيات مخصصة للمساعدة في تحسين جودة النوم. استخدمت مهام اللياقة البدنية معلومات من التدريب والنوم والمقاييس الصحية وتعليقات المستخدمين لإنشاء توصيات بشأن كثافة النشاط البدني في يوم معين.

تضمنت كلتا فئتي دراسات الحالة بيانات أجهزة الاستشعار القابلة للارتداء – لمدة تصل إلى 29 يومًا للنوم وأكثر من 30 يومًا للياقة البدنية – بالإضافة إلى المعلومات الديموغرافية (العمر والجنس) وتحليل الخبراء.

تضمنت بيانات المستشعر درجات النوم الإجمالية، ومعدل ضربات القلب أثناء الراحة، والتغيرات في تقلب معدل ضربات القلب، ومدة النوم (وقت البدء والانتهاء)، ودقائق الاستيقاظ، والأرق، والنسبة المئوية لوقت نوم حركة العين السريعة، ومعدلات التنفس، وعدد الخطوات، ودقائق حرق الدهون.

وكتب الباحثون: “تظهر دراستنا أن PH-LLM قادر على دمج البيانات الموضوعية المكتسبة بشكل سلبي من الأجهزة القابلة للارتداء في رؤى شخصية، وأسباب محتملة للسلوكيات المرصودة وتوصيات لتحسين نتائج نظافة النوم واللياقة البدنية”.

لا يزال هناك الكثير من العمل الذي يتعين القيام به في تطبيقات الصحة الشخصية

ومع ذلك، يعترف الباحثون بأن PH-LLM هي مجرد البداية، ومثل أي تقنية ناشئة، لديها أخطاء يجب حلها. على سبيل المثال، الاستجابات المولدة بالنموذج لم تكن متسقة دائمًا، وكانت هناك “اختلافات واضحة” في التبسيطات عبر دراسات الحالة، وكان ماجستير القانون في بعض الأحيان محافظًا أو حذرًا في ردوده.

في دراسات حالة اللياقة البدنية، كان النموذج حساسًا للإفراط في التدريب، وفي إحدى الحالات، لاحظ الخبراء البشريون فشله في تحديد قلة النوم كسبب محتمل للضرر. أيضًا، تم أخذ عينات من دراسات الحالة على نطاق واسع عبر التركيبة السكانية والأفراد النشطين نسبيًا، لذلك من المحتمل أنهم لم يكونوا ممثلين بشكل كامل للسكان، ولم يتمكنوا من معالجة مخاوف النوم واللياقة البدنية على نطاق أوسع.

وكتب الباحثون: “نحن نحذر من أنه لا يزال هناك الكثير من العمل الذي يتعين القيام به لضمان موثوقية LLMs وآمنة وعادلة في تطبيقات الصحة الشخصية”. يتضمن ذلك تقليل عمليات الخلط بشكل أكبر، مع الأخذ في الاعتبار الظروف الصحية الفريدة التي لا تلتقطها معلومات المستشعر والتأكد من أن بيانات التدريب تعكس تنوع السكان.

ومع ذلك، لاحظ الباحثون: “تمثل نتائج هذه الدراسة خطوة مهمة نحو ماجستير إدارة الأعمال الذي يقدم معلومات وتوصيات شخصية تدعم الأفراد لتحقيق أهدافهم الصحية”.