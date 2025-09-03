أطلقت شركة "جوجل" الأمريكية الإصدار الجديد من نموذجها للذكاء الاصطناعي "جيميني 2.5"، والذي يتضمن ميزات متقدمة لتحرير الصور.
وأوضحت "جوجل" أن برنامج "جيميني 2.5 فلاش إيمدج" تم تلقيبه بـ"نانو بانانا"، وهو أحدث نموذج لتوليد وتحرير الصور بالذكاء الاصطناعي.
ويشمل التحديث الجديد إمكانية دمج الصور المتعددة والتحرير الدقيق القائم على المطالبات ودمج المعرفة العالمية لفهم المعنى الدلالي للصور.
وتشير "جوجل" إلى أن إصدار "جيميني 2.5" يوسع نطاق نماذج "فلاش" ليتجاوز النصوص ويصل إلى توليد الصور بسرعة وكفاءة من حيث الجودة ودقة التحرير.
وأحد الجوانب التقنية التي يركز عليها النموذج هو اتساق الأحرف، التي باتت صعوبة شائعة في النماذج التوليدية، ولكن تم تصميم هذا النموذج للحفاظ على وضوح الموضوع نفسه عبر مطالبات أو تعديلات متعددة، بالأخص عند نقل شخصية بين المشاهد، أو عرض منتج من وجهات نظر مختلفة، أو إنتاج أصول بصرية موحدة.
ويدعم النموذج أيضًا تحرير الصور بناءً على مطالبات، حيث يمكن للمستخدمين وصف تغييرات محددة بلغة طبيعية، وتشمل العمليات النموذجية تعديلات الخلفية، وإزالة الكائنات أو استبدالها، أو تعديل تفاصيل مثل وضعية الموضوع.
بالإضافة إلى ذلك، تتيح خاصية دمج الصور المتعددة دمج ميزات من عدة مدخلات في نتيجة واحدة.
ويستفيد النموذج كذلك من تكامل المعرفة العالمية، مما يمنحه ميزة في السيناريوهات التي تتطلب التفكير الدلالي، حيث عرضت جوجل أمثلة مثل قراءة وتفسير المخططات المرسومة يدويًا، وتكييف القوالب لقوائم العقارات، والمساعدة في المهام التعليمية التي تجمع بين الفهم البصري والنصي.
وشارك المصمم الصناعي توماس بروين انطباعاته الأولى بعد اختبار النموذج، قائلا: "لقد وجدتُ أنه من المثير للاهتمام مدى براعته في تحرير صورك الخاصة، مثل إضافة ميزات، وتعديل الخلفية أو المقدمة، وما إلى ذلك".
وتابع بقوله "لكن أيضًا، كان بإمكانه العودة إلى الصورة الأصلية عند الطلب. وهو أمر أجد أن شات جي بي تي يواجه صعوبة في بعض الأحيان".