قدمت Openai طراز 4O في ChatGPT لتمكين توليد الصور الأصلي في جو chatbot. هذه الترقية تجعلها حتى لا تضطر إلى استخدام نموذج توليد صور Dall-E من Openai ككيان منفصل ، على الرغم من أن Dall-E لا يزال متاحًا لأولئك كتفضيل. مكّنت علامة AI أيضًا مولد فيديو Sora AI داخل ChatGPT.
تتوفر الميزات الجديدة حاليًا للمستخدمين المجانيين ChatGpt ، وكذلك لمستخدمي ChatGpt Plus و Team و Pro. سيأتي توفر مستخدمي المؤسسة والتعليم الأسبوع المقبل.
في السابق ، كان Dall-E 3 هو المكون الإضافي لتوليد الصور لمشتركي ChatGPT المدفوعين. وفي الوقت نفسه ، يمكن لأولئك الذين أرادوا تجربة المولد مجانًا القيام بذلك من خلال الطبقة الأساسية لـ Microsoft CoPilot.
تم الإشادة بالنموذج كواحد من أفضل مولدات الصور المتاحة ، خاصة في نسخته المدفوعة. على الرغم من الاستفادة من جميع مستخدمي ChatGPT الذين قادرون على استخدام توليد الصور أصلاً باستخدام طراز 4O ، يجب أن يكون أولئك الذين يستخدمون الطبقة المجانية من chatgpt للوصول إلى بعض القيود ، مثل الحد الأقصى لتحميل الملفات وتحليل البيانات ، كما أشار CNET.
ومع ذلك ، ستستفيد ChatGPT من الحصول على صور أكثر واقعية مع نص أكثر وضوحًا بعد أن أمضى Openai عامًا في الحصول على GPT-4O من خلال جهد تدريبي بعد إطلاقه يسمى “التعلم التعزيز من التعليقات البشرية” (RLHF) ، وفقًا لصحيفة وول ستريت جورنال.
بعد الإعلان عن GPT-4O في مايو 2024 ، كان لدى Openai فريقًا من أكثر من 100 “مدربين بشريين” يتجولون في نموذج الأخطاء المطبعية ، وكذلك الأخطاء الشائعة في اليدين والوجوه ، حسبما صرح غابرييل غوه الباحث الرئيسي للمشروع.
سيحضر طراز GPT-4O أيضًا إلى chatgpt القدرة على إنشاء خلفيات شفافة. يجب أن تكون هذه فائدة كبيرة لمستخدمي الأعمال والإبداع ، حيث سيسمح لهم بإنشاء شعارات أو أيقونات أخرى ، أو ChatGpt MultimDal Product Lead ، كما أشار Jackie Shannon إلى WSJ.
على الرغم من التحسينات التي أجراها Openai ، فإن طراز GPT-4O المحدث ككل لا يزال لديه أوجه القصور. لا يزال لديه ميل نحو الهلوسة ، وهي ميزة منظمة العفو الدولية الشائعة التي لم يتم حلها بعد. لا يزال الحفاظ على اتساق التحرير يمثل تحديًا في جو ChatGpt ؛ ومع ذلك ، وعد Openai بالتحديثات السريعة ، في وقت مبكر من الأسبوع المقبل.
قضية أخرى مستمرة لـ Openai هي مسألة الأخلاق والشرعية. تصر العلامة التجارية على أن نموذجها قد تم تدريبه على “البيانات المتاحة للجمهور” ، ومن خلال البيانات الملكية التي يمتلكها عبر شراكات مع العلامات التجارية بما في ذلك Shutterstock.
الصور التي تم إنشاؤها من خلال ChatGPT استنادًا إلى طراز 4O لن تحتوي على علامات مائية AI. ومع ذلك ، أشارت العلامة التجارية إلى أن الصور ستشمل بيانات التعريف C2PA التي تشير إليها على أنها تم إنشاؤها. هذا لا يزال معيار الصناعة.