
أطلق مجمع الملك سلمان العالمي للغة العربية، تقرير النصف الأول من عام 2025 لمؤشر نضج تقنيات الذكاء الاصطناعي للغة العربية "بلسم"، الذي يهدف إلى تقييم أداء النماذج اللغوية الضخمة (LLMs) في مهام معالجة اللغة الطبيعية، عبر منصة موحدة تُسهّل على المطورين والباحثين تحليل الأداء في مختلف المجالات اللغوية.
وأكد الأمين العام للمجمع، الدكتور عبدالله بن صالح الوشمي، أن التقرير يُجسد التزام المجمع بدعم المحتوى العربي الرقمي، وتقديم أدوات موثوقة لتقييم وتحليل وتطوير أداء النماذج اللغوية بما يتماشى مع الخصائص الفريدة للغة العربية. وأضاف أن التقرير بُني وفق منهجية تقييم متقدمة، تجمع بين التحكيم البشري والتقييم الآلي عالي الدقة، ما يمنح المؤشر موثوقية تصل إلى 0.88% مقارنة بالتحكيم البشري.
وقد شارك في إعداد التقرير عدد من الجهات المختصة، من بينها الهيئة السعودية للبيانات والذكاء الاصطناعي (سدايا)، وجامعات سعودية وعربية، ومعاهد بحثية وشركات متخصصة، أبرزها جامعة الملك سعود، جامعة محمد بن زايد للذكاء الاصطناعي، ومعهد قطر لبحوث الحوسبة.
ويستعرض التقرير تقييمًا شاملًا لـ22 نموذجًا لغويًا بناءً على أكثر من 12 ألف سؤال تغطي 54 مهمة في 13 فئة لغوية، تشمل الترجمة، التلخيص، الفهم القرائي، الكتابة الإبداعية، البرمجة، والتصنيف.
ويعد مؤشر "بلسم" أحد مشاريع المجمع الرامية إلى تمكين الحوسبة اللغوية بالعربية، ويمثل خطوة نحو تعزيز الابتكار التقني ودعم التحول الرقمي الوطني، من خلال تطوير معايير دقيقة تسهم في بناء تطبيقات موثوقة باللغة العربية.