كشفت شركة التكنولوجيا الصينية العملاقة "علي بابا" النقاب عن نموذجيْن للذكاء الاصطناعي الخاصة بها، يمكنهما التعرُّف على الصور وإجراء المحادثات.
ونظراً للطلب المتزايد على الوصول إلى خوارزميات الذكاء الاصطناعي المتقدمة، فإن نماذج اللغة التي تقدّمها شركة علي بابا قد تأتي في الوقت المناسب تماماً.
نماذج اللغة المقدّمة لا تقتصر على فهم الرسائل النصية، بل قادرة على إدراك وفهم الصور والنصوص والامتثال للقيود.
ويمكن للخوارزمية معالجة طلبات الصور المختلفة وإنشاء استجابات لها، وتم تصميمها للتفاعلات الأكثر تعقيداً.
على سبيل المثال، يمكنها مقارنة صور متعدّدة، والإجابة عن سلسلة من الأسئلة، وكتابة قصص بناءً على الصور المقدمة من المستخدم.. على سبيل المثال، يمكن للمستخدم أن يسأل الذكاء الاصطناعي عن موقع المستشفى باستخدام صورة اللافتة الخاصة به، والحصول على إجابة دقيقة عن هذا السؤال.
ومن مميزات نماذج اللغة المقدمة أنها تعمل بدقة عالية، بحسب ما أوضحته "علي بابا".
وتدعم الخوارزمية أيضاً ميزة جديدة "الاتصال المتداخل مع صور متعددة" التي تفترض أن المستخدم يزوّد الذكاء الاصطناعي بعدة صور ثم يطرح أسئلة حولها.
وباستخدام معايير قياسية، قام خبراء "علي بابا"، بتقييم قدرات الخوارزميات الجديدة لمهام تتراوح بين إنشاء التعليقات التوضيحية على الصور والإجابة عن الأسئلة المتعلقة بالصور التي تم تحميلها.