أصدرت الهيئة السعودية للبيانات والذكاء الاصطناعي "سدايا" تقريراً عن الذكاء الاصطناعي التوليدي والنماذج اللغوية الكبيرة في خطوة تستهدف فيها رفع مستوى الوعي بهذه التقنيات التي باتت عنصرًا مهمًا في عالم التقنيات المتقدمة في عصرنا الحالي والمساهمة في مستقبل أكثر استدامة وفائدة للمجتمعات والأفراد على حد سواء.
وتفصيلاً، تأتي هذه الخطوة في إطار اهتمام سدايا بتعزيز الوعي المجتمعي تجاه تقنيات البيانات والذكاء الاصطناعي بوصفها المرجع الوطني لهما في المملكة من تنظيم وتطوير علاوة على أهمية هذه التقنيات في رسم مستقبل العالم بطريقة غير تقليدية.
ويُعرّف النموذج اللغوي بأنه نموذج ذكاء اصطناعي يحدد احتمالية وجود سلسلة معينة من الكلمات في جملة ما وعندما يتكون النموذج من عدد كبير من المعاملات يطلق عليه نموذج لغوي كبير، وتندرج هذه النماذج الكبيرة تحت مجموعة من النماذج تُعرف بالنماذج التأسيسية وهي نماذج مدربة على بيانات مختلفة ويمكن تكييفها بأداء مجموعة واسعة من المهام.
وتختلف النماذج اللغوية الكبيرة عن نماذج اللغات الطبيعية التقليدية من جانبين وهما حجم بيانات التدريب وعدد المعاملات في حين يتضمن تطوير النماذج اللغوية الكبيرة ثلاث خطوات رئيسة هي : جمع مجموعة بيانات من مستندات نصية وتدريب الخوارزميات لفهم العلاقة بين الكلمات وتقييم النماذج بصورة متكررة وضبطها.
ويهدف هذا التقرير إلى تقديم لمحة مختصرة عن النماذج اللغوية الكبيرة وحالات استخدامها واستعراض أبرز النماذج من شركات ومؤسسات أكاديمية، إضافة إلى ذكر بعض التحديات والمخاطر التي قد تنشئ مع اندثار هذه النماذج بصورة عامة والإشارة إلى أفضل الممارسات في تطوير تلك النماذج والتطرق إلى بعض التوقعات المستقبلية.
وتتميز النماذج اللغوية الكبيرة في قدرتها على القيام بعدة مهام مقارنة بالنماذج المتخصصة التي تقوم بمهمة معينة ومن أبرز حالات استخدامها : كتابة النصوص والمقالات، وتلخيص وتبسيط النصوص، والترجمة من لغة إلى لغة أخرى، والإجابة عن الأسئلة، وتحليل المشاعر، وتصنيف العناصر إلى فئات، وكتابة الأكواد البرمجية، واستخراج الكلمات الافتتاحية، وكتابة الإعلانات التجارية، والتدقيق النحوي.
يُذكر أنه زاد الاهتمام بالنماذج اللغوية الكبيرة بعد أن أطلقت شركة Open AI خدمة لتجربة نموذج Chat GBT مجانًا عام 2022م وبلغ عدد مستخدمي الخدمة وقتها أكثر من مليون مستخدم في أول خمسة أيام من إطلاقها، وتعد هذه النماذج فاعلة جدًا وقادرة على تنفيذ أنواع مختلفة من المهام مثل : إنشاء النصوص، والترجمة والتلخيص بلغات متعددة، ومن المتوقع أن تشكل حالات استخدام النماذج التأسيسية بشكل عام 50 % من حالات استخدام معالجة اللغات الطبيعية في عام 2026م بينما كانت تمثل أقل من 5 % من حالات الاستخدام في عام 2021م.
ويمكن الاطلاع على التقرير من خلال الرابط التالي :