مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

54 خبر
  • نبض الملاعب
  • فيديوهات
  • هدنة وحصار المضيق
  • نبض الملاعب

    نبض الملاعب

  • فيديوهات

    فيديوهات

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • بالفيديو.. كريستيانو رونالدو يتفاعل مع بنزيما في الحرم المكي (صورة)

    بالفيديو.. كريستيانو رونالدو يتفاعل مع بنزيما في الحرم المكي (صورة)

البيانات غير المفيدة تجعل الذكاء الاصطناعي "أغبى" وأكثر ميلا للأخطاء!

يحذر الباحثون من أن النماذج اللغوية الكبيرة قد تصبح أقل دقة وأكثر عرضة للأخطاء عندما تُدرَّب على كميات ضخمة من المحتوى منخفض الجودة المنتشر على شبكات التواصل الاجتماعي.

البيانات غير المفيدة تجعل الذكاء الاصطناعي "أغبى" وأكثر ميلا للأخطاء!

ووفقا لدراسة نُشرت على خادم ما قبل الطباعة arXiv، نقلا عن مجلة Nature، قام علماء من جامعة تكساس في أوستن بتحليل تأثير البيانات "غير المفيدة" — مثل المنشورات القصيرة السطحية ومواد الإثارة — على سلوك الذكاء الاصطناعي. وركّزت الدراسة على جوانب متعددة تشمل المنطق والاستدلال، واستخراج المعلومات من النصوص الطويلة، والأخلاقيات، وحتى السمات الشخصية للنماذج.

وأظهرت النتائج أنه كلما ارتفعت نسبة البيانات الرديئة في عملية التدريب، زادت أخطاء النماذج اللغوية وتراجع منطقها، بما في ذلك في الاختبارات متعددة الخيارات.

وأعاد الباحث الرئيسي تشانغيانغ وانغ التذكير بالمبدأ الكلاسيكي في علوم الذكاء الاصطناعي:"القمامة في المدخلات تعطي قمامة في المخرجات."

وأكد التحليل الجديد أهمية انتقاء البيانات بعناية عند تدريب النماذج. فقد استخدم الباحثون مليون منشور من منصة تواصل اجتماعي شهيرة لإعادة تدريب النموذجين المفتوحين Llama 3 وQwen — حيث يُعرف الأول باتباع التعليمات، بينما يُصنف الثاني كنموذج استدلالي.

وأظهر التحليل أن نموذج Llama تغيّر سلوكه بعد التدريب على البيانات منخفضة الجودة، إذ انخفضت السمات "الإيجابية" وظهرت سمات "سلبية" مثل النرجسية والاعتلال النفسي.

أما محاولات تصحيح الخلل — مثل إعادة التدريب على بيانات عالية الجودة أو تعديل التعليمات — فقد حسّنت الأداء جزئيًا فقط، بينما استمرت مشكلات التفكير المنطقي وتخطي الخطوات التحليلية.

ويكتسب هذا الموضوع أهمية خاصة في ظل توجه منصات التواصل الاجتماعي إلى توسيع استخدام بيانات المستخدمين لتدريب أنظمة الذكاء الاصطناعي. فعلى سبيل المثال، تخطط شركة LinkedIn اعتبارا من نوفمبر الجاري لاستخدام بيانات المستخدمين الأوروبيين في أنظمتها التوليدية.

المصدر: Naukatv.ru

 

 

التعليقات

إيران تتهم دول الخليج والأردن بالمشاركة في الحرب الأمريكية عليها

مسؤولو الجيش والاستخبارات الأمريكية يلغون إجازاتهم وسط استعداد لاحتمال استئناف الحرب على إيران 

القناة 12 العبرية: تحسّب لتصعيد إيراني وحالة التأهب "قصوى"

ترامب يجري بعد قليل اتصالا جماعيا مع قادة عرب لبحث المفاوضات مع إيران

حادث خطير يشعل الحدود.. إسرائيليون يتسللون إلى لبنان لالتقاط الصور والجيش يعتقلهم فورا

سوريا.. القبض على ضابط رفيع في عهد الأسد

الجيش الإيراني: مستعدون للتضحية.. العالم سيشهد قريبا الخلاص من شر الولايات المتحدة والكيان الصهيوني

نيبينزيا حول مواقف أوروبية بشأن مجزرة لوغانسك: مقززة ويؤسفني أن أكتشف لؤمكم البغيض.. نشعر بالخذلان

ترامب: تم التفاوض بشأن اتفاق مع إيران إلى حد كبير.. التفاصيل قيد الإعداد وسيتم الإعلان عنها قريبا

لبنان لحظة بلحظة.. خسائر متبادلة جراء التصعيد و"حزب الله" يتمسك بسلاحه لمنع تثبيت الاحتلال

رسالة غامضة جديدة.. ترامب "يغطي" إيران بالعلم الأمريكي (صورة)

حصيلة ضخمة لسفن إيرانية اعترضتها قوات "سنتكوم" الأمريكية

بوتين يعقد اجتماعا لمجلس الأمن الروسي لبحث الهجوم الأوكراني الإرهابي على لوغانسك

الدفاع الإيرانية: عدم الامتثال لمطالب شعبنا سيكبد ترامب وإسرائيل خسائر أكبر

السلام في الشرق الأوسط يسابق الزمن.. منير يغادر طهران بعد ثاني لقاء مع عراقجي في 24 ساعة

"حزب الله" يعلن تدمير منصتي صواريخ في القبّة الحديدية الإسرائيلية

سوريا.. إلزام أئمة المساجد بـ"ميثاق الوسطية" ونبذ النعرات المذهبية

"بلومبيرغ": إيران دمرت 20% من أخطر مسيرات واشنطن

الخارجية الإيرانية: الاتفاق مع الولايات المتحدة ليس وشيكا الخلافات عميقة وكثيرة