أصدرت Openai أحدث تحديث ومحرك على نطاق واسع لمحرك توليد صور Chatgpt يوم الثلاثاء ، وسرعان ما كانت الإنترنت oohing و aahing ، وطلب من الذكاء الاصطناعى صنع كل شيء من الميمات على طراز ساوث بارك إلى صور لدمى باربي في المكتب البيضاوي.
لكن أحدهما الفذ من طراز GPT-4O الجديد من Chatgpt ترك مراقبو الذكاء الاصطناعى في حالة من الرهبة المتدلية.
النبيذ الأحمر ، أي شخص؟
ها ، يمكن أن تشاتغبت الآن-بشكل موثوق-صورة كوب من النبيذ الأحمر المملوءة إلى أعلى tippity.
اِسْتَدْعَى: render an image of a wine glass filled to the very top with red wine
يبدو وكأنه مهمة بسيطة ، أليس كذلك؟ من المثير للدهشة أن اختبار “الزجاج الكامل للنبيذ” قد أدى إلى تأثر الكثير من AIS ذات الأسماء الكبيرة ، بما في ذلك-حتى الآن ، على أي حال ، Chatgpt ومحرك Dall-E الأقدم.
هنا ، على سبيل المثال ، هو Imogen 3 من Google الذي يطفئ الاختبار عند استخدام نفس الموجه:

و Grok 3 لا أفضل بكثير:

استغرق Microsoft's Copilot أيضًا طعنة:

لقد حاولت حتى مع Flux ، واحدة من أحدث نماذج الانتشار المستقرة ، وحصلت على هذا:

يصيح.
خدعة “كوب من النبيذ” ليست معيارًا رسميًا لقدرات تقديم صور منظمة العفو الدولية ؛ بدلاً من ذلك ، إنه اختبار غير رسمي ، مثل سؤال LLM عن عدد “R's” في كلمة “Strawberry”. إنهم يميلون إلى الخطأ ، وأحيانًا بفرح.
لماذا يعتبر كوب كامل من النبيذ تحديًا ل AIS المولدة للصور؟ الحكمة السائدة هي أن النماذج التي تعمل بالنيابة التي تعمل بشكل أفضل مع الصور التي تم تدريبها عليها-وعندما يتعلق الأمر بصور أكواب النبيذ الأحمر ، فإنها عادة ما تملأ في منتصف الطريق ، وهذا هو السبب في أن هناك مطالبة بـ “كوب كامل من النبيذ ، على طول الطريق إلى الحافة” ، تميل إلى الحصول على نصف كوب ممتلئ.
الآن ، حقا جيد يجب أن يتمكن مولد صورة AI (كما أوضح أحد رديتور بشكل مفيد) من “استقراء” فكرة وجود كوب كامل تمامًا من النبيذ حتى لو لم يكن هناك أي شيء في بيانات التدريب. إما ذلك ، أو شخص ما في Openai أطعم العشرات الجديدة من صور أكواب النبيذ المملوءة إلى الحافة.
بالطبع ، هناك اختبار حمض آخر لمولدات صور الذكاء الاصطناعى: ساعة تمثيلية تم ضبطها على وقت محدد. Betcha chatgpt ومولد الصور الجديد يمكن أن يجعل العمل القصير لذلك ، أليس كذلك؟ لنرى:
اِسْتَدْعَى: render an image of a clock, with the hands showing 3:15

موجه التالي: good, but the clock hands MUST be at 3:15

أم ، ترحيل سام التمان؟