أعلنت شركة OpenAI أن نموذج GPT-4 Turbo القوي مع Vision أصبح الآن متاحًا بشكل عام من خلال واجهة برمجة التطبيقات الخاصة بالشركة، مما يفتح فرصًا جديدة للمؤسسات والمطورين لدمج قدرات اللغة والرؤية المتقدمة في تطبيقاتهم.
يأتي إطلاق GPT-4 Turbo مع Vision على واجهة برمجة التطبيقات بعد الإصدار الأولي لميزات تحميل الرؤية والصوت لـ GPT-4 في سبتمبر الماضي والكشف عن نموذج GPT-4 Turbo المزود بشاحن توربيني في مؤتمر مطوري OpenAI في نوفمبر.
يعد GPT-4 Turbo بتحسينات كبيرة في السرعة، ونوافذ أكبر لسياق الإدخال تصل إلى 128000 رمزًا مميزًا (أي ما يعادل حوالي 300 صفحة)، وزيادة القدرة على تحمل التكاليف للمطورين.
أحد التحسينات الرئيسية هو قدرة طلبات واجهة برمجة التطبيقات (API) على الاستفادة من إمكانات التعرف على رؤية النموذج وتحليلها من خلال تنسيق النص JSON واستدعاء الوظائف. يتيح ذلك للمطورين إنشاء مقتطفات كود JSON التي يمكنها أتمتة الإجراءات داخل التطبيقات المتصلة، مثل إرسال رسائل البريد الإلكتروني أو إجراء عمليات شراء أو النشر عبر الإنترنت. ومع ذلك، توصي OpenAI بشدة ببناء تدفقات تأكيد المستخدم قبل اتخاذ الإجراءات التي تؤثر على العالم الحقيقي.
تستفيد العديد من الشركات الناشئة بالفعل من GPT-4 Turbo مع Vision، بما في ذلك Cognition، الذي يعتمد وكيل ترميز الذكاء الاصطناعي Devin الخاص به على النموذج لإنشاء التعليمات البرمجية الكاملة تلقائيًا:
ديفين، بناه @cognition_labs، هو مساعد هندسة برمجيات الذكاء الاصطناعي مدعوم بواسطة GPT-4 Turbo والذي يستخدم الرؤية لمجموعة متنوعة من مهام البرمجة. pic.twitter.com/E1Svxe5fBu
— مطورو OpenAI (@OpenAIDevs) 9 أبريل 2024
يستخدم تطبيق Healthify، وهو تطبيق للصحة واللياقة البدنية، النموذج لتقديم التحليلات والتوصيات الغذائية بناءً على صور الوجبات:
ال @healthifyme قام فريق العمل بتصميم Snap باستخدام GPT-4 Turbo with Vision لمنح المستخدمين رؤى غذائية من خلال التعرف على صور الأطعمة من جميع أنحاء العالم. pic.twitter.com/jWFLuBgEoA
— مطورو OpenAI (@OpenAIDevs) 9 أبريل 2024
تستخدم TLDraw، وهي شركة ناشئة مقرها المملكة المتحدة، GPT-4 Turbo مع Vision لتشغيل السبورة البيضاء الافتراضية الخاصة بها وتحويل رسومات المستخدم إلى مواقع ويب وظيفية:
جعل حقيقي، بنيت من قبل @tldraw، يتيح للمستخدمين رسم واجهة المستخدم على السبورة البيضاء ويستخدم GPT-4 Turbo مع Vision لإنشاء موقع ويب عامل مدعوم بكود حقيقي. pic.twitter.com/RYlbmfeNRZ
— مطورو OpenAI (@OpenAIDevs) 9 أبريل 2024
على الرغم من مواجهة منافسة شديدة من النماذج الأحدث مثل Anthropic's Claude 3 Opus وGoogle's Gemini Advanced، فإن إطلاق واجهة برمجة التطبيقات (API) من شأنه أن يساعد في ترسيخ مكانة OpenAI في سوق المؤسسات حيث ينتظر المطورون نموذج اللغة الكبير التالي للشركة.
(الصورة بواسطة v2osk)
أنظر أيضا: يكشف Stability AI عن نموذج Stable LM 2 ذو المعلمة 12B ومتغير 1.6B المحدث
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في مكان مشترك مع الأحداث الرائدة الأخرى بما في ذلك BlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.
استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.