النماذج اللغوية الكبيرةأخبار الذكاء الاصطناعي
رائج حاليا

أحدث نماذج “تشات جي بي تي” يقترب من القمة، لكن “Nano Banana” لا يزال يتفوق.. وهذه هي الأسباب

مترجم:

في عالم توليد الصور بالذكاء الاصطناعي الذي يشهد تطوراً متسارعاً، يُعد نموذج “GPT Image 1.5” ثالث إصدار جديد تطرحه شركة OpenAI خلال شهر واحد تقريباً. يأتي هذا الإطلاق في أعقاب السيطرة القوية لنموذج Nano Banana Pro.

بعد قضاء وقت طويل في اختبار نموذج ChatGPT الجديد، وجدت أنه يقدم تحسينات ملموسة وأفضل بشكل ملحوظ من سابقه. نحن لسنا هنا أمام حالة تحديث هامشي مثل “GPT-5.2” حيث لم يلاحظ أحد الفرق؛ بل إن تقنية توليد الصور بالذكاء الاصطناعي في هذا الإصدار تنتج صوراً بأخطاء أقل وتشوهات أخف، وتميل لأن تكون أكثر واقعية وحيوية.

ومع ذلك، ورغم هذه القفزة، لا يزال “GPT Image 1.5” يخسر الرهان أمام نموذج Gemini الرائد في بعض السيناريوهات المعقدة. وإليك التفاصيل الكاملة.

ما هو GPT Image 1.5، وما الذي يمكنه فعله؟

يُمثل “GPT Image 1.5” أحدث وأقوى محاولات ChatGPT في مجال توليد الصور بالذكاء الاصطناعي. سواء كنت مستخدماً للباقة المجانية أو مدفوعاً، فإن أي صورة تقوم بإنشائها الآن تعتمد على هذا النموذج المطور.

تعد OpenAI المستخدمين بمجموعة تحسينات جذرية تهدف إلى سد الفجوة مع المنافسين، وتشمل هذه التحسينات: قدرة فائقة على دمج نصوص واضحة ومقروءة داخل الصور، التزاماً أدق بالتفاصيل الواردة في التعليمات (Prompts)، وإمكانيات تحرير الصور مع الحفاظ على العناصر الأصلية سليمة، بالإضافة إلى أداء أسرع وجودة بصرية أعلى مع تقليل التشوهات الغريبة التي كانت تظهر سابقاً.

وبالتزامن مع طرح النموذج، أطلقت OpenAI تبويب “الصور” (Images)، وهو واجهة مركزية مخصصة لعرض أرشيف ما أنشأته وتوليد الجديد. ورغم أنه تغيير في الواجهة أكثر منه وظيفة جديدة، إلا أنه يوفر وصولاً سهلاً لأنماط فنية مختلفة ونماذج للمطالبات، مما يسهل عملية توليد الصور بالذكاء الاصطناعي للمبتدئين والمحترفين على حد سواء.

تحسن مؤكد في نموذج الصور الجديد

بالنظر إلى الإصدارات الأخيرة التي وصفت بأنها “غير مثيرة للاهتمام” من OpenAI، لم تكن توقعاتي مرتفعة بشأن “GPT Image 1.5”. ومع ذلك، يسعدني القول إنني كنت مخطئاً. قد لا تكون هذه النسخة ثورة تقنية تقلب الموازين، لكن ترقياتها واضحة للعيان.

عملية تعديل الصور أصبحت تنتج تشوهات أقل بكثير، وعملية الإنشاء من الصفر باتت أسرع وأكثر سلاسة. النتائج بحد ذاتها تبدو أكثر واقعية، مما يعزز مكانة OpenAI في سوق توليد الصور بالذكاء الاصطناعي.

اختبارات الأداء: الصور تبدو أكثر حيوية وواقعية

المقارنة الأهم ليست مع النموذج القديم، بل مع الرائد الحالي “Nano Banana Pro” من Gemini.

اختبار التصميم الداخلي: طلبت صورة لمنزل بضواحي المدينة بتصميم مفتوح وأثاث بسيط.

النتيجة: كان التحسن في “GPT Image 1.5” (الشريحة الأولى) هائلاً؛ فتفاصيله غنية وواقعية للغاية مقارنة بالنموذج القديم “GPT Image 1” الذي بدت صورته كصور الأرشيف المجانية (Stock photos) وخالية من الروح والأثاث.

النتيجة الجديدة كانت مقاربة جداً لجودة “Nano Banana Pro”، رغم وجود بعض الأخطاء الخلفية البسيطة (مثل دمج بعض الكراسي ببعضها)، وهي مشكلة شائعة في توليد الصور بالذكاء الاصطناعي.

اختبار القصص المصورة (Comics): طلبت قصة من 6 لوحات لعالم خيالي (High Fantasy) يستبدل العصا السحرية ببنادق هجومية، مع حبكة مفاجئة في النهاية.

النتيجة: تفوق “GPT Image 1.5” بتفاصيل ممتازة وتقديم حبكة حقيقية. لكن “Nano Banana Pro” كان الأفضل إجمالاً، حيث أخطأ ChatGPT بإنشاء 7 لوحات (بدل 6) وقص اللوحة الأخيرة بشكل سيء.

اختبار المخططات التوضيحية (Diagrams):

تعد المخططات كابوساً لتقنيات توليد الصور بالذكاء الاصطناعي بسبب تعقيد النصوص والخطوط. طلبت مخططاً لشبكة منزلية يربط أجهزة متعددة عبر سويتش ومودم.

النتيجة: قدم “GPT Image 1.5” تفاصيل أفضل وخالية من الأخطاء الإملائية مقارنة بسابقه. لكن “Nano Banana Pro” فاز مجدداً لأنه لم يغفل أي توصيلات (عكس ChatGPT الذي فصل السويتش عن الكمبيوتر) وحافظ على اتساق الخطوط.

التعديل أصبح أكثر موثوقية (لكنه ليس مثالياً)

يعد التحرير (In-painting) ركيزة أساسية لأي أداة توليد صور بالذكاء الاصطناعي. اختبرت قدرة النماذج على إزالة “يد” ظهرت بالخطأ في لقطة طبيعية:

• قدم “GPT Image 1.5” أفضل تباين وألوان مشبعة وحدة تفاصيل، متفوقاً في الجودة البصرية على المنافس.

• ومع ذلك، فإن المنطقة التي تم تعديلها (مكان اليد المحذوفة) لم تندمج تماماً مع بقية المشهد كما فعل “Nano Banana Pro”. كما أضاف نموذج ChatGPT تأثيراً يشبه الفسيفساء (Tessellation) على التفاصيل الدقيقة ولم ينجح في الحفاظ على نسبة العرض إلى الارتفاع (Aspect Ratio) للصورة الأصلية.

دمج الصور

عند طلب دمج صور كراسي وطاولة داخل مطبخ:

• نجح “GPT Image 1.5” في عدم تشويه العناصر المحيطة بشكل أفضل من سابقه، لكن الإضاءة لم تكن متطابقة.

• في المقابل، بدت الكراسي والطاولة في صورة “Nano Banana Pro” وكأنها تنتمي للمطبخ فعلاً.

الخلاصة: ترقية ممتازة إذا كنت تفضل ChatGPT

لا تغطي هذه الاختبارات كل حالات الاستخدام الممكنة، وبالنظر إلى التباين المتأصل في أدوات الذكاء الاصطناعي، من المؤكد أن “GPT Image 1.5” قد يتفوق أحياناً حينما يتعثر “Nano Banana Pro”. ومع ذلك، في المتوسط، يبدو أن “Nano Banana Pro” يقوم بعمل أفضل قليلاً وأكثر اتساقاً في التحرير والتوليد.

إذا كنت تفضل ChatGPT: ابدأ باستخدام نموذج توليد الصور بالذكاء الاصطناعي الجديد فوراً، فالفرق في الجودة واضح بمجرد إعادة توليد صورك القديمة.

إذا كنت من مستخدمي Gemini: لا داعي للقلق الكبير، فالمنافسة قوية لكن “Nano Banana Pro” لا يزال يحافظ على تاجه. ومع ذلك، يعد “GPT Image 1.5” خياراً احتياطياً ممتازاً يستحق التجربة عندما تواجه صعوبة في الحصول على نتيجة معينة من أداتك المعتادة.

مترجم عن PC MAG

زر الذهاب إلى الأعلى