شركة OpenAI تطلق o3-pro أقوى نموذج ذكاء اصطناعي طورته حتى الآن

أطلقت شركة OpenAI نموذجا جديدا يُدعى o3-pro، وتقول الشركة إنه أقوى نموذج ذكاء اصطناعي طورته حتى الآن.
يُعد o3-pro إصدارا مطورا من نموذج o3 الذي أطلقته الشركة في وقت سابق من هذا العام، وهو نموذج للاستدلال المنطقي يختلف عن النماذج التقليدية من حيث أنه يعالج المشكلات خطوة بخطوة، مما يجعله أكثر موثوقية في مجالات مثل الفيزياء والرياضيات والبرمجة.
بدءًا من يوم الثلاثاء، أصبح o3-pro متاحا لمشتركي ChatGPT Pro وTeam، ليحل محل النموذج السابق o1-pro.
وسيحصل مستخدمو النسخ المخصصة للمؤسسات والجامعات (Enterprise وEdu) على إمكانية الوصول إليه في الأسبوع التالي، بحسب OpenAI.
كما أصبح النموذج متاحًا أيضًا عبر واجهة برمجة التطبيقات (API) الخاصة بالشركة اعتبارًا من هذا اليوم.
أما عن الأسعار، فتكلفة o3-pro في واجهة API هي 20 دولارا لكل مليون “رمز إدخال” و80 دولارا لكل مليون “رمز إخراج”.
وتشير رموز الإدخال إلى البيانات التي تُدخل إلى النموذج، بينما رموز الإخراج هي ما يولده النموذج كرد على تلك البيانات.
للتقريب، فإن مليون رمز إدخال يعادل تقريبًا 750,000 كلمة، أي أطول قليلًا من رواية “الحرب والسلام”. ووفقًا لـ OpenAI، فإن “التقييمات المتخصصة أظهرت تفوق o3-pro على o3 في جميع الفئات التي خضع للاختبار فيها، وخاصة في المجالات الرئيسية مثل: العلوم، التعليم، البرمجة، الأعمال، والمساعدة في الكتابة”. كما حصل o3-pro على تقييمات أعلى في جوانب الوضوح، الشمولية، اتباع التعليمات، والدقة.
وبحسب الشركة، فإن o3-pro يمتلك القدرة على استخدام أدوات متعددة، مثل البحث عبر الإنترنت، تحليل الملفات، معالجة الصور، البرمجة بلغة Python، تخصيص الردود باستخدام الذاكرة، وغير ذلك. ومع ذلك، فإن من سلبياته أن استجاباته أبطأ من o1-pro.
كما توجد قيود أخرى على o3-pro، من أبرزها:
- إيقاف الدردشات المؤقتة في ChatGPT أثناء حل “مشكلة تقنية”.
- عدم قدرة o3-pro على توليد الصور.
- عدم توافقه مع ميزة Canvas، وهي مساحة العمل المدعومة بالذكاء الاصطناعي من OpenAI.
لكن على الجانب الإيجابي، تقول الشركة إن o3-pro حقق نتائج مبهرة في اختبارات الذكاء الاصطناعي القياسية. ففي اختبار AIME 2024 المخصص لتقييم المهارات الرياضية، تفوق o3-pro على أقوى نماذج Google، وهو Gemini 2.5 Pro. كما تفوق أيضًا على نموذج Claude 4 Opus من Anthropic في اختبار GPQA Diamond الذي يقيس المعرفة العلمية على مستوى الدكتوراه.
Source link