يبدو أن المنافسة بين الشركات لإنتاج نموذج الذكاء الاصطناعي الأفضل لن تتوقف قريباً؛ فمنذ أسابيع أطلقت غوغل جيميناي 1.5 والبارحة أطلقت أنثروبك المدعومة من غوغل وأمازون كلود 3 (Claude 3)- ثالث إصدار من كلود. وقد بينت الشركة أنه يتفوق على جيميناي 1.0 وعلى تشات جي بي تي وذلك باختباره على مجموعة اختيار معيارية.
مجموعة الاختبار المعيارية التي تستخدم في مقارنة هذه النماذج تتضمن اختبارات متعلقة بفهم اللغة والصور والرياضيات والأكواد البرمجية والقدرة على الاستدلال. لكن تعد مجموعة الاختبار مقياساً أولياً لإمكانيات النموذج و ليست حكماً نهائياً فقد ينجح النموذج بتحقيق نتائج جيدة فيها لكنه قد يفشل في اختبارات عملية؛ تماماً مثل الطالب الذي ينجج في الامتحانات النظرية ويفشل في التطبيق العملي.
يمكن لهذا النموذج أن يفهم الصور أيضاً ويحللها والإجاية على أي سؤال عنها؛ ولكنه لا يقوم بتوليدها مثل جيميناي الذي قامت غوغل يإيقاف توليد الصور فيه بسبب تحيزه ضد البيض ورفضه توليد صور أشخاص بيض.
يبدو أن شركات الذكاء الاصطناعي مستمرة في السعي لتقديم منتجات أفضل ليس فقط لكي تجذب المستخدمين بل لكي تعلن أنها مازالت لاعب أساسي في المجال. فاليوم لم يعد الكثيرون يهتمون بالمقدرات الإضافية التي تقدمها هذه النماذج وأصبح عدد قليل من الأشخاص يحتاجون نماذج متقدمة أكثر كتلك التي تعالج البيانات المالية وغيرها من البيانات المتخصصة.