أخبار
MiMo-V2.5-Pro: شاومي تُطلق نموذجها الأقوى لمهام الوكيل الطويلة بكفاءة رموز تفوق Opus 4.6— Xiaomi OpenAI تطلق ChatGPT Images 2.0 بنمط تفكير متقدم— OpenAI xAI تطلق واجهات API صوتية جديدة لـ Grok بتكلفة أقل 10 مرات— xAI Cerebras تقدم طلب إدراج رسمي في البورصة— Cerebras Anthropic تطلق أداة Claude Design لإنشاء التصاميم والصور— Anthropic Google تجري محادثات متقدمة مع Marvell لبناء رقائق استدلال AI— Google OpenAI تحسن Agents SDK بميزات sandbox للأمان— OpenAI Anthropic تناقش نموذج Mythos مع إدارة ترامب والوكالات الأمريكية— Anthropic Mistral AI تكشف عن تحديث كبير لنموذج Large 2— Mistral AI NVIDIA تطلق أدوات جديدة لتدريب النماذج على Blackwell Ultra— NVIDIA Moonshot AI تطلق Kimi K2.6: نموذج مفتوح المصدر يتفوق على GPT-5.4 وClaude Opus 4.6 في البرمجة الطويلة والوكلاء— Moonshot AI Claude Opus 4.7 من Anthropic رسمياً: قفزة في البرمجة الوكيلة ورؤية 3.75MP— Anthropic OpenAI تحدث Codex لمنافسة Claude Code على سطح المكتب— OpenAI Anthropic تخطط لتوسعة مكتب لندن لاستيعاب 800 موظف— Anthropic Anthropic تؤكد أن Claude Opus 4.7 أقل قدرة من Mythos Preview— Anthropic MiMo-V2.5-Pro: شاومي تُطلق نموذجها الأقوى لمهام الوكيل الطويلة بكفاءة رموز تفوق Opus 4.6— Xiaomi OpenAI تطلق ChatGPT Images 2.0 بنمط تفكير متقدم— OpenAI xAI تطلق واجهات API صوتية جديدة لـ Grok بتكلفة أقل 10 مرات— xAI Cerebras تقدم طلب إدراج رسمي في البورصة— Cerebras Anthropic تطلق أداة Claude Design لإنشاء التصاميم والصور— Anthropic Google تجري محادثات متقدمة مع Marvell لبناء رقائق استدلال AI— Google OpenAI تحسن Agents SDK بميزات sandbox للأمان— OpenAI Anthropic تناقش نموذج Mythos مع إدارة ترامب والوكالات الأمريكية— Anthropic Mistral AI تكشف عن تحديث كبير لنموذج Large 2— Mistral AI NVIDIA تطلق أدوات جديدة لتدريب النماذج على Blackwell Ultra— NVIDIA Moonshot AI تطلق Kimi K2.6: نموذج مفتوح المصدر يتفوق على GPT-5.4 وClaude Opus 4.6 في البرمجة الطويلة والوكلاء— Moonshot AI Claude Opus 4.7 من Anthropic رسمياً: قفزة في البرمجة الوكيلة ورؤية 3.75MP— Anthropic OpenAI تحدث Codex لمنافسة Claude Code على سطح المكتب— OpenAI Anthropic تخطط لتوسعة مكتب لندن لاستيعاب 800 موظف— Anthropic Anthropic تؤكد أن Claude Opus 4.7 أقل قدرة من Mythos Preview— Anthropic
نماذج ٢٢ أبريل ٢٠٢٦ 5 دقائق قراءة

MiMo V2.5 Pro: نموذج شاومي الجديد يُسيطر على المهام الوكيلة الطويلة ويكسر حاجز الألف أداة

أطلقت شاومي في 22 أبريل 2026 نموذج MiMo-V2.5-Pro، أقوى نماذجها حتى الآن، يُنجز مهام هندسية تستغرق أسابيع في ساعات، ويتفوق على Claude Opus 4.6 في كفاءة الرموز بنسبة 40–60%.

ف

فريق AI DayaHimour

٢٢ أبريل ٢٠٢٦

MiMo V2.5 Pro: نموذج شاومي الجديد يُسيطر على المهام الوكيلة الطويلة ويكسر حاجز الألف أداة

في الثاني والعشرين من أبريل 2026، وبينما كان المجتمع التقني منشغلاً بإعلانات Google Cloud Next في لاس فيغاس، أطلقت شاومي بهدوء نموذجها الأكثر طموحاً: MiMo-V2.5-Pro، المرحلة الأحدث من سلسلة نماذج MiMo التي صعدت خلال أشهر قليلة إلى الصفوف الأمامية في تصنيفات الذكاء الاصطناعي العالمية.

الإعلان لم يأتِ مصحوباً بضجة تسويقية معهودة. صفحة رسمية مقتضبة، وجملة واحدة تلخص الرهان: “قفزة في التماسك الوكيلي والمهام المفتوحة الأفق”. غير أن التفاصيل التقنية التي كُشف عنها تحكي قصة مختلفة تماماً.

من مليون رمز إلى ألف أداة

الميزة التي يعتد بها فريق MiMo في هذا الإصدار ليست حجم النموذج ولا النتائج على المعايير التقليدية — بل قدرته على الاستدامة. فبينما تتعثر معظم النماذج في تسلسلات العمل الطويلة، يُثبت MiMo-V2.5-Pro قدرته على تجاوز حاجز الألف استدعاء أداة في مهمة واحدة متواصلة، مع الحفاظ على تماسك السياق وتتبع الأهداف الفرعية دون انجراف.

النموذج يرث نافذة سياق بمليون رمز من سلفه MiMo-V2-Pro، لكنه يُضيف إليها ما يصفه الفريق بـ”الوعي بالإطار المحيط”: قدرة غير عادية على إدارة الذاكرة داخل تسلسل العمل، وتشكيل السياق الخاص به بما يخدم الهدف النهائي بدلاً من الاكتفاء بالاستجابة الآنية.

مهام حقيقية بدلاً من اختبارات مصطنعة

اختار فريق شاومي طريقة غير مألوفة لإثبات قدرات النموذج: بدلاً من الاقتصار على معايير المقارنة المعتادة، نشر ثلاثة أمثلة من مهام العالم الحقيقي تجاوز فيها MiMo-V2.5-Pro حدوداً يعدّها الباحثون مؤشراً حقيقياً على مستوى الذكاء.

المثال الأول كان مُترجِعاً كاملاً للغة SysY مكتوباً في Rust من الصفر، مستوحىً من مشروع مادة مبادئ المُترجِعات في جامعة بيكينغ — وهي مهمة تستغرق طالب دكتوراه متمرساً أسابيع. استغرق MiMo-V2.5-Pro 4.3 ساعة عبر 672 استدعاء أداة، وأنجز المشروع بنتيجة مثالية: 233 من 233 اختباراً مخفياً. ما يلفت الانتباه ليس السرعة فحسب، بل أسلوب العمل: إذ بنى المُترجِع طبقة طبقة بدءاً من معالج Koopa IR إلى خلفية RISC-V، وحين أحدث إعادة هيكلة في التسلسل 512 تراجعاً في بعض الاختبارات، شخّص الخطأ وأصلحه دون تدخل خارجي.

المثال الثاني كان محرر فيديو مكتبي كامل المزايا: تتبع متعدد المسارات، قص المقاطع، مزج الصوت، وخط تصدير. بلغت قاعدة الكود 8,192 سطراً، أُنتجت في 11.5 ساعة عبر 1,868 استدعاء أداة. المثال الثالث تجاوز البرمجة نحو تصميم دوائر كهربية: تصميم وتحسين دائرة FVF-LDO في تقنية TSMC 180nm، وهي مهمة تتطلب مهندس إلكترونيات متمرساً لعدة أيام. النموذج أنجزها في ساعة واحدة داخل حلقة محاكاة ngspice، محققاً جميع معايير الأداء الستة المستهدفة.

أرقام المقارنة: تفوق محدد وفجوات واضحة

المعايير المرجعية الرئيسية — أبريل 2026 (MiMo-V2.5-Pro)

SWE-bench Pro 57.2%
Terminal-Bench 2.0 68.4%
ClawEval (pass^3) 63.8%
τ3-bench 72.9%
GDPVal-AA (Elo) 1581
Humanity's Last Exam (بدون أدوات) 48.0%
برمجة
سطر أوامر
وكيل عام
وكيل متعدد الخطوات
مهام واقعية

صورة المقارنة الرسمية التي نشرها الفريق تضع MiMo-V2.5-Pro في موقع دقيق بين المنافسين. على معيار SWE-bench Pro يسجل 57.2 نقطة، متقدماً على نسخته السابقة MiMo-V2-Pro بنسبة ملحوظة، ومتجاوزاً Gemini 3.1 Pro، لكنه يبقى على مسافة ضيقة من GPT-5.4 الذي يسجل 57.7 ومن Claude Opus 4.6 عند 57.3. في Terminal-Bench 2.0 المتعلق بأداء سطر الأوامر، يرتفع التقدم: 68.4 نقطة مقابل 65.4 لـ Claude Opus 4.6 و65.8 للإصدار غير Pro من V2.5.

على معيار GDPVal-AA المخصص لتقييم المهام الواقعية الوكيلية، يتراجع النموذج إلى 1581 Elo مقابل 1606 لـ MiMo-V2-Pro و1674 لـ GPT-5.4 — تراجع يبدو مفاجئاً مع نموذج أحدث، ويشير إلى أن التحسينات تتركز في قدرات الاستدلال طويل الأفق والبرمجة بدلاً من الأداء العام. معيار Humanity’s Last Exam كاشف بدوره: 48.0 نقطة بدون أدوات مقابل 53.0 لـ Claude Opus 4.6 و58.7 لـ GPT-5.4، فجوة في الاستدلال العلمي البحت تبقى قائمة رغم التحسينات البرمجية.

الميزة الحقيقية: كفاءة الرموز

ربما لا تكون الأرقام المطلقة هي القصة الحقيقية لـ MiMo-V2.5-Pro. الفريق يُركز على ما يسميه “كفاءة الذكاء”: تحقيق أداء طليعي مع إنفاق رموز أقل بكثير. على معيار ClawEval، يُسجل النموذج 63.8% pass^3 مستهلكاً نحو 70 ألف رمز لكل مسار — أي ما بين 40% و60% أقل مما تستهلكه نماذج Claude Opus 4.6 وGemini 3.1 Pro وGPT-5.4 عند مستويات أداء مقارنة. في بيئات الإنتاج التي تُعالج آلاف المهام يومياً، هذا الفارق يتحول إلى وفورات مالية جوهرية.

التسعير يعزز هذه الحجة: دولار واحد لكل مليون رمز مدخل وثلاثة دولارات للمخرج، دون أي تغيير عن الإصدار السابق رغم التحسينات المعلنة. للمقارنة، Claude Opus 4.6 يُكلف 5 دولارات للمدخل و25 للمخرج.

مسار الحياد والمصدر المفتوح

ما قبل MiMo-V2.5-Pro ببضعة أسابيع، أطلق فريق شاومي MiMo-V2-Flash كنموذج مفتوح المصدر بمعمارية MoE تضم 309 مليار معامل إجمالي و15 ملياراً نشطة فحسب. المسار ذاته مُتوقَّع لـ V2.5: أعلن الفريق أن سلسلة MiMo-V2.5 ستُفتح مصادرها قريباً، مما سيُتيح للباحثين والمطورين تكييفها وتشغيلها محلياً.

النموذج متاح حالياً في النسخة التجريبية العامة عبر Xiaomi AI Studio ومنصة API، كما وصل إلى OpenRouter الذي يُدرجه بتسعير موحد: دولار للمدخل وثلاثة للمخرج مع نافذة سياق 1,048,576 رمز وحد أقصى للمخرج يبلغ 131,072 رمز. المستخدمون الذين اشتروا خطة الرموز قبل 14:00 UTC في 21 أبريل حصلوا على إعادة تعيين لرصيد الاستهلاك.

شاومي والسباق الأوسع

صعود شاومي في خريطة الذكاء الاصطناعي يحمل رمزية تتخطى حدود البنشمارك. الشركة المعروفة تاريخياً بصناعة الهاتف المحمول دخلت عالم النماذج الكبيرة بمنهجية مختلفة: إطلاق نموذج مجهول الهوية تحت اسم “Hunter Alpha” على OpenRouter جمع أكثر من تريليون ونصف استدعاء في سبعة أيام قبل الكشف عن هويته، ثم الانطلاق نحو نماذج تنافس في الصفوف الأمامية عالمياً.

MiMo-V2.5-Pro ليس النموذج الأعلى كفاءة في العالم على كل معيار، لكنه يُمثل اختياراً مُحسوباً: تركيز حاد على مهام البرمجة والأتمتة الطويلة الأفق، مع سعر يجعل النشر واسع النطاق خياراً عملياً لفرق الهندسة التي تُشغّل أنظمة وكيلية في الإنتاج. صعود شاومي في خريطة الذكاء الاصطناعي يحمل رمزية تتخطى حدود البنشمارك — الشركة المعروفة تاريخياً بصناعة الهاتف المحمول دخلت عالم النماذج الكبيرة بمنهجية مختلفة، ويبدو أنها مصممة على مواصلة المسار.

MiMo V2.5 Proشاومينماذج الذكاء الاصطناعيالوكلاء الذاتيين2026
شارك المقال:

مقالات ذات صلة

Seedream 5.0 من ByteDance: جيل جديد من توليد الصور بالبحث الحي والاستدلال البصري
نماذج

Seedream 5.0 من ByteDance: جيل جديد من توليد الصور بالبحث الحي والاستدلال البصري

دليل شامل: تحليل شامل لنموذج Seedream 5.0 من ByteDance، الذي يدمج الاستدلال البصري متعدد الخطوات والبحث الحي عبر الإنترنت، مع مقارنات تفصيلية بأبرز نماذج التوليد العالمية. - اكتشف أهم التفاصيل والمقارنات التي تحتاجها.

٩ أبريل ٢٠٢٦ اقرأ المزيد
GPT-5.4: النموذج الأقوى من OpenAI الذي يدمج التفكير المنطقي والوكلاء الذاتيين — تحليل شامل
نماذج

GPT-5.4: النموذج الأقوى من OpenAI الذي يدمج التفكير المنطقي والوكلاء الذاتيين — تحليل شامل

دليل شامل: OpenAI تطلق GPT-5.4 في مارس 2026 بنموذج هجين يدمج التفكير المنطقي المطول والوكلاء الذاتيين. يتفوق في البرمجة والتحليل المعقد بتكلفة 2/8 دولارات. هل يستحق الضجة؟ - اكتشف أهم التفاصيل والمقارنات التي تحتاجها.

٢ أبريل ٢٠٢٦ اقرأ المزيد
MiMo-V2-Pro: نموذج شاومي الرائد الذي يفتح عصر الوكلاء الذكيين.. تحليل شامل
نماذج

MiMo-V2-Pro: نموذج شاومي الرائد الذي يفتح عصر الوكلاء الذكيين.. تحليل شامل

دليل شامل: شاومي تطلق MiMo-V2-Pro، نموذج ذكاء اصطناعي عملاق بأكثر من تريليون معاملة ونافذة سياق مليون رمز، مصمم خصيصاً للمهام الوكيلية المعقدة. ينافس كلود أوبوس 4.6 في الأداء الوكيلي بتكلفة أقل بكثير. يحتل المركز الأول في تصنيف OpenRouter بدرجة 4.65 تريليون توكن. - اكتشف أهم التفاصيل والمقارنات التي تحتاجها.

٢ أبريل ٢٠٢٦ اقرأ المزيد