نماذج ٢٣ أبريل ٢٠٢٦ 6 دقائق قراءة

GPT-5.5: النموذج الأذكى من OpenAI يُعيد تعريف العمل الوكيلي

OpenAI تُطلق GPT-5.5 في 23 أبريل 2026 بنموذجين قياسي وPro. يتفوق في البرمجة الوكيلية واستخدام الحاسوب والبحث العلمي مع كفاءة رمزية غير مسبوقة.

فريق AI DayaHimour

٢٣ أبريل ٢٠٢٦

GPT-5.5: النموذج الأذكى من OpenAI يُعيد تعريف العمل الوكيلي

أطلقت OpenAI في 23 أبريل 2026 نموذجها الأحدث GPT-5.5، ووصفته بأنه الأذكى والأكثر بديهية في الاستخدام حتى الآن. يأتي الإصدار ليُجسد تحولا حقيقيا في فكرة العمل الوكيلي، حيث يستطيع النموذج فهم المهام المعقدة وتخطيطها وتنفيذها عبر أدوات متعددة دون تدخل مستمر من المستخدم. يتجاوز GPT-5.5 مجرد الرد على الأسئلة ليصبح شريكا فعليا في إنجاز العمل على الحاسوب، بدءا من كتابة الأكواد وصولا إلى تحليل البيانات وإدارة الوثائق.

يقدم الإصدار نسختين: GPT-5.5 القياسي، وGPT-5.5 Pro الموجهة للمهام الأكثر تطلبا. كلاهما يعملان ضمن ChatGPT وCodex، مع خطط لإتاحتهما عبر واجهة البرمجة في وقت لاحق. ما يميز هذا الإصدار ليس فقط ارتفاع درجات الذكاء، بل القدرة على الحفاظ على سرعة الاستجابة المطابقة لـ GPT-5.4 رغم الزيادة الكبيرة في القدرات.

بنية تقنية مُحسّنة للعمل الوكيلي

يأتي GPT-5.5 بنافذة سياق تصل إلى مليون رمز، مما يتيح استيعاب مشاريع برمجية ضخمة أو وثائق مالية مطولة في جلسة واحدة. في Codex، تبلغ نافذة السياق 400 ألف رمز، وهو ما يغطي معظم قواعد الأكواد الكبيرة. رغم هذه الزيادة في الحجم، يُسجّل النموذج زمن استجابة لكل رمز مطابقا لسابقه GPT-5.4 في ظروف الخدمة الفعلية.

الكفاءة الرمزية تمثل نقلة ملحوظة أخرى. تشير بيانات OpenAI إلى أن GPT-5.5 يستخدم كمية أقل من الرموز بنسبة تصل إلى 40% لإنجاز نفس مهام Codex مقارنة بـ GPT-5.4. هذا الانخفاض في استهلاك الرموز يترجم إلى تكلفة تشغيلية أقل للمستخدمين رغم ارتفاع سعر الرمز الواحد في واجهة البرمجة.

تم تصميم النموذج وتدريبه بالتعاون مع أنظمة NVIDIA GB200 وGB300 NVL72. يعكس هذا التكامل العميق بين البرمجيات والعتاد جهود OpenAI لبناء بنية تحتية عالمية للذكاء الاصطناعي الوكيلي. بلغ الأمر حدودا مثيرة حين ساعد GPT-5.5 وCodex فريق OpenAI نفسه في تحسين البنية التحتية للاستدلال، حيث قام Codex بتحليل أنماط حركة المرور الإنتاجية وكتابة خوارزميات توازن حمل مخصصة رفعت سرعة توليد الرموز بنسبة تتجاوز 20%.

أداء المعايير المرجعية

سجّل GPT-5.5 أرقاما قياسية في فئات البرمجة الوكيلية والعمل المعرفي واستخدام الحاسوب. تستند الأرقام التالية إلى بيانات OpenAI الرسمية وجداول المقارنة الصادرة عن الشركة.

المعايير المرجعية — أبريل 2026

GPQA Diamond 93.6%

SWE-Bench Pro 58.6%

MMMU Pro 81.2%

ARC-AGI-2 (Verified) 85.0%

Terminal-Bench 2.0 82.7%

FrontierMath Tier 4 35.4%

CyberGym 81.8%

GDPval 84.9%

رياضيات / معرفة عامة / استنتاج

علوم

برمجة / أمن سيبراني

متعدد الوسائط

يظهر الجدول تفوقا واضحا في معيار Terminal-Bench 2.0 الذي يختبر سير عمل سطر الأوامر المعقدة، حيث يبلغ الفارق 7.6 نقطة مئوية عن GPT-5.4 و13.3 نقطة عن Claude Opus 4.7. في المقابل، يتأخر النموذج قليلا في SWE-Bench Pro الذي يقيس حل مشاكل GitHub الواقعية، إذ لا يزال Claude Opus 4.7 يحتفظ بالصدارة بنسبة 64.3% مقابل 58.6%.

في مجال استخدام الحاسوب، يحقق GPT-5.5 نتيجة 78.7% في OSWorld-Verified، متجاوزا Claude Opus 4.7 بنسبة 78.0%. أما في اختبار FrontierMath Tier 4 للرياضيات المتقدمة فيصل إلى 35.4%، وهو رقم يتجاوز منافسيه بفارق كبير. النسخة Pro ترفع هذا المعدل إلى 39.6%.

مقارنة مع المنافسين

تتنافس أقوى نماذج السوق حاليا في فئة الذكاء الوكيلي، ويبرز GPT-5.5 كمنافس مباشر لـ Claude Opus 4.7 من Anthropic وGemini 3.1 Pro من Google. يتفوق النموذج الجديد في معظم معايير البرمجة الوكيلية والرياضيات المتقدمة، لكن المنافسة تبقى حادة في بعض المجالات.

المعيار	GPT-5.5	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0	82.7%	69.4%	68.5%
SWE-Bench Pro	58.6%	64.3%	54.2%
GDPval	84.9%	80.3%	67.3%
OSWorld-Verified	78.7%	78.0%	—
FrontierMath Tier 4	35.4%	22.9%	16.7%
CyberGym	81.8%	73.1%	—

في معيار BrowseComp الخاص بالبحث متعدد المراحل على الويب، تتقدم Gemini 3.1 Pro بنسبة 85.9% مقابل 84.4% للنسخة القياسية من GPT-5.5، لكن النسخة Pro تقلب الموازين بنسبة 90.1%. في MCP Atlas الذي تديره Scale AI، يحقق Claude Opus 4.7 نسبة 79.1% متقدما على GPT-5.5 بنسبة 75.3%.

من ناحية التكلفة، تشير بيانات Artificial Analysis إلى أن GPT-5.5 يقدم ذكاء前沿ي في مؤشر البرمجة بتكلفة نصف تكلفة النماذج المنافسة. هذا المزيج بين الأداء العالي والكفاءة الرمزية يمنحه ميزة تنافسية في سوق واجهات البرمجة.

حالات الاستخدام المثلى

البرمجة الوكيلية والهندسة البرمجية

يبرز GPT-5.5 في المهام البرمجية الطويلة الأمد التي تتطلب تخطيطا وتنفيذا عبر ساعات. في اختبار Expert-SWE الداخلي لـ OpenAI، تبلغ المدة المتوسطة لإنجاز المهام 20 ساعة عمل بشري. يتجاوز النموذج سابقه في هذا المعيار بنسبة 73.1% مقابل 68.5%، ويستخدم رموزا أقل لتحقيق النتيجة.

شهادات المهندسين الذين اختبروا النموذج تؤكد هذه النقلة. وصفه دان شيبر، المؤسس والرئيس التنفيذي لـ Every، بأنه “أول نموذج برمجة يمتاز بوضوح مفاهيمي جدي”. في تجربة عملية، نجح النموذج في إعادة هيكلة نظام تعليقات ضمن محرر markdown تعاوني، وعاد بـ 12 تعديلا برمجيا شبه مكتملة دون تدخل يذكر.

العمل المعرفي والبحث العلمي

يتجاوز GPT-5.5 مجال البرمجة ليشمل البحث العلمي المبكر. في معيار GeneBench الجديد الذي يركز على تحليل البيانات العلمية متعددة المراحل في علم الوراثة والبيولوجيا الكمية، يظهر النموذج تحسنا واضحا على سابقه. كما حقق أداء متقدما في BixBench الخاص بالمعلوماتية الحيوية.

أبرز الإنجازات العلمية ظهر حين ساعدت نسخة داخلية من GPT-5.5 مع نظام مخصص في اكتشاف برهان جديد حول أعداد رامزي في علم التوافقيات، وهو فرع من الرياضيات يدرس كيف تترابط الأشياء المنفصلة. تم التحقق من البرهان لاحقا باستخدام Lean، مما يجعله مثالا ملموسا على مساهمة النموذج في إنتاج حجج رياضية أصيلة وليس مجرد أكواد أو شروحات.

استخدام الحاسوب والمهام الإدارية

في Codex، يستطيع GPT-5.5 رؤية ما على الشاشة والنقر والكتابة والتنقل عبر الواجهات بدقة. تستخدم فرق OpenAI هذه القدرات فعليا: فريق المالية استعان بـ Codex لمراجعة 24,771 نموذج ضريبي K-1 بمجموع 71,637 صفحة، مما ساعد على تسريع المهمة بأسبوعين مقارنة بالعام السابق. في فريق الاتصالات، حلل النموذج ستة أشهر من بيانات طلبات التحدث وبنى إطارا للتقييم والمخاطر.

التوفر والتسعير

يتوفر GPT-5.5 حاليا لمشتركي Plus وPro وBusiness وEnterprise في ChatGPT وCodex. النسخة Pro تقتصر على مستويات Pro وBusiness وEnterprise. في Codex، يأتي النموذج مع نافذة سياق 400 ألف رمز، مع خيار Fast Mode الذي يولد رموزا أسرع بـ 1.5 مرة بتكلفة أعلى 2.5 ضعف.

بالنسبة للمطورين، ستتوفر واجهة البرمجة قريبا بسعر 5 دولارات لكل مليون رمز داخل و30 دولارا لكل مليون رمز خارج. النسخة Pro ستُ定价 بـ 30 دولارا للدخل و180 دولارا للخرج لكل مليون رمز. يتوفر التسعير المخفض Batch وFlex بنصف السعر، بينما الأولوية Priority تتطلب 2.5 ضعف السعر القياسي.

ضمانات السلامة والاستعداد

صنفت OpenAI قدرات GPT-5.5 في مجال الأمن السيبراني والبيولوجيا على أنها “عالية” ضمن إطار الاستعداد الخاص بها. رغم أن النموذج لم يصل إلى المستوى “حرج” في الأمن السيبراني، إلا أن القدرات تخطت ما كان عليه GPT-5.4. لمواجهة ذلك، نشرت الشركة حواجز حماية هي الأشد حتى الآن، تشمل مرشحات أضيق للنشاط عالي المخاطر وحمايات ضد الاستخدام المتكرر الضار.

توسعت OpenAI في آن واحد في الوصول الموثوق للأمن الدفاعي عبر برنامج Trusted Access for Cyber، حيث يمكن للمنظمات المسؤولة عن حماية البنية التحتية الحرجة التقدم بطلب للوصول إلى نماذج أقل تقييدا بعد استيفاء متطلبات أمنية صارمة.

خاتمة

يُمثّل GPT-5.5 تحولا في استراتيجية OpenAI من نماذج المحادثة إلى أنظمة العمل الوكيلي الفعلي. النموذج لا يكتفي بتقديم إجابات أذكى، بل يتولى مسؤولية تنفيذ المهام عبر أدوات متعددة مع الحفاظ على الكفاءة والسرعة. تتجلى هذه النقلة في الأرقام: تفوق في Terminal-Bench 2.0 وFrontierMath وGDPval، إلى جانب كفاءة رمزية تقلل التكلفة رغم ارتفاع سعر الوحدة.

لكن المنافسة تبقى شرسة. يحتفظ Claude Opus 4.7 بصدارة SWE-Bench Pro، وتتقدم Gemini 3.1 Pro في بعض مهام البحث على الويب. ما يمنح GPT-5.5 ميزته الحقيقية هو المزيج بين الذكاء العالي والكفاءة التشغيلية والتكامل العميق مع البنية التحتية لـ NVIDIA. مع إتاحة واجهة البرمجة قريبا، سيتحدد مدى قدرة هذا النموذج على ترجمة أرقام المعايير إلى تأثير حقيقي في سير العمل البرمجي والعلمي.

GPT-5.5OpenAIنماذج لغويةذكاء اصطناعي وكيلي2026

شارك المقال: