Step 3.5 Flash من Stepfun: النموذج الصيني السريع الذي يتحدى النماذج الغربية بكفاءة غير مسبوقة
نموذج مفتوح المصدر بـ196 مليار معامل يفعّل 11 مليار فقط لكل توكن، يحقق أداءً متقدماً في الاستدلال والمهام الوكيلة بسرعة تصل إلى 350 توكن في الثانية، ويُقدّم تكلفة API منخفضة تجعله منافساً مباشراً لنماذج الـFlash الغربية.
فريق AI DayaHimour
٥ أبريل ٢٠٢٦
في 12 فبراير 2026 أطلقت شركة Stepfun الصينية Step 3.5 Flash، نموذجاً مفتوح المصدر يُعدّ الأكثر كفاءة في فئة نماذج الـMoE الكبيرة. لم يكن الإطلاق مجرد إضافة إلى قائمة النماذج الصينية المتزايدة؛ بل جاء ليُثبت أن الذكاء الاصطناعي المتقدم يمكن أن يُقدّم بتكلفة حسابية منخفضة وبسرعة تفوق توقعات السوق. النموذج، الذي يحمل 196 مليار معامل إجمالياً ويفعّل 11 ملياراً فقط لكل توكن، يستهدف المهام الوكيلة (agentic) والاستدلال العميق بأداء ينافس النماذج الملكية الغربية مع ميزة السرعة والتكلفة.
Stepfun ليست شركة ناشئة عادية. تأسست في 6 أبريل 2023 في شنغهاي على يد ثلاثة مهندسين سابقين في مايكروسوفت: جيانغ داكسين (الرئيس التنفيذي ونائب الرئيس السابق في مركز أبحاث مايكروسوفت آسيا)، وتشو ييبو، وجياو بينكسينغ. انضم إليها لاحقاً يين تشي، المؤسس المشارك لشركة Megvii، كرئيس لمجلس الإدارة في يناير 2026، مصحوباً بجولة تمويل Series B+ تجاوزت 700 مليون دولار. تُعدّ Stepfun واحدة من «نمور الذكاء الاصطناعي» الستة في الصين، وتركز استراتيجيتها على دمج الذكاء الاصطناعي متعدد الوسائط مع التطبيقات الحقيقية، بما في ذلك النماذج المخصصة للأجهزة المادية مثل السيارات والروبوتات. قبل Step 3.5 Flash أصدرت الشركة نماذج مثل Step-2 (تريليون معامل) وStep-Video-T2V وStep-Audio، مما يجعلها لاعباً رئيسياً في سباق النماذج متعددة الوسائط.
بنية تقنية مصممة للكفاءة المتطرفة
يعتمد Step 3.5 Flash على معمارية Sparse Mixture-of-Experts (MoE) متقدمة. يحتوي النموذج على 196.81 مليار معامل إجمالي (196 مليار في الـbackbone و0.81 مليار في الـhead)، لكنه يفعّل 11 مليار معامل فقط لكل توكن. هذه «كثافة الذكاء» تسمح له بمنافسة نماذج أكبر حجماً دون استهلاك موارد هائلة أثناء الاستدلال. يعزز النظام ذلك بتقنية 3-way Multi-Token Prediction (MTP-3) التي تتنبأ بثلاثة توكنات في وقت واحد، مما يرفع السرعة إلى 100-300 توكن في الثانية في الاستخدام العادي، ويصل إلى 350 توكن في الثانية في مهام البرمجة أحادية التدفق.
للتعامل مع السياق الطويل استخدمت Stepfun نسبة 3:1 من Sliding Window Attention (SWA) إلى Full Attention: ثلاث طبقات SWA مقابل طبقة واحدة كاملة. هذا يقلل التكلفة الحسابية للسياقات الكبيرة دون فقدان كبير في الجودة. نافذة السياق الرسمية 256 ألف توكن، مما يجعله مناسباً لتطبيقات الـagents التي تتعامل مع مستندات طويلة أو محادثات ممتدة. كما يدعم النموذج tool calling متقدم وتنفيذ كود بايثون داخلياً، مع إطار عمل RL قابل للتوسع يعتمد على إشارات قابلة للتحقق وتغذية راجعة تفضيلية.
النموذج مفتوح المصدر تحت رخصة Apache 2.0، ويتوفر بصيغ متعددة (BF16، FP8، INT4) على Hugging Face، مما يتيح نشره محلياً على أجهزة عالية الأداء مثل NVIDIA DGX Spark أو حتى Mac Studio M4 Max باستخدام llama.cpp.
الأداء في البنشماركس: قوة في الاستدلال والـagentic
يبرز Step 3.5 Flash في البنشماركس التي تختبر الاستدلال العميق والمهام الوكيلة. حسب بيانات Stepfun الرسمية (فبراير 2026):
- AIME 2025: 97.3% (يصل إلى 99.8% مع تنفيذ كود بايثون).
- IMOAnswerBench: 85.4%.
- HMMT 2025: 96.2%.
- SWE-bench Verified: 74.4%.
- LiveCodeBench-V6: 86.4%.
- τ²-Bench (agentic): 88.2%.
- BrowseComp: 69.0%.
يصل متوسط أدائه عبر ثمانية بنشماركس رئيسية إلى 81.0، متفوقاً أو منافساً لنماذج أكبر مثل GLM-4.7 (355B) وDeepSeek V3.2 (671B) وKimi K2.5 (1T). في المهام الوكيلة يتفوق على العديد من النماذج الملكية في السرعة والاستقرار عبر سلاسل التفكير الطويلة.
مقارنة بالنماذج الغربية السريعة: Gemini Flash وGPT-4o Mini وClaude Haiku
يُصمم Step 3.5 Flash ليكون «Flash» بمعنى سريع وفعّال، تماماً مثل Gemini Flash أو GPT-4o Mini أو Claude Haiku. لكنه يختلف جذرياً في الحجم والكفاءة. النماذج الغربية الصغيرة (التي تتراوح عادة بين 8-100B فعالة) تركز على التوازن بين السرعة والتكلفة، بينما يعتمد Step 3.5 Flash على MoE ليحقق «ذكاء frontier» بتكلفة تشغيلية منخفضة.
في السرعة يتفوق Step 3.5 Flash بوضوح: 100-350 توكن/ثانية مقابل 50-150 توكن/ثانية تقريباً للنماذج الغربية المماثلة في الفئة. أما في التكلفة عبر API فيصل سعره إلى 0.10 دولار لكل مليون توكن دخل و0.30 دولار لكل مليون توكن خروج (عبر StepFun أو OpenRouter)، وهو أرخص بكثير من GPT-4o Mini أو Claude Haiku في الاستخدام الكثيف. في الاستدلال الرياضي والبرمجي يتفوق على معظم النماذج «الصغيرة» الغربية، خاصة في SWE-bench وAIME، بينما تظل Gemini Flash أقوى في السياقات الطويلة جداً (1M+) والوسائط المتعددة.
الضعف الرئيسي لـ Step 3.5 Flash هو تركيزه على النص والـagentic حالياً؛ فهو لا يدعم الإدخال متعدد الوسائط (صور أو فيديو) بشكل أصلي، على عكس Gemini Flash أو GPT-4o Mini. كذلك، أداؤه في بعض المهام العامة مثل SimpleQA أو MMLU-Pro قد يكون أقل من النماذج الغربية الأكثر شمولاً، رغم تفوقه في المهام المتخصصة.
دعم اللغة العربية والوصول المتاح
كون النموذج صيني الأصل، يركز تدريبه الأساسي على الإنجليزية والصينية، لكنه يدعم اللغات المتعددة بدرجة جيدة بفضل مرحلة التدريب المتوسطة على بيانات متنوعة. لا توجد بيانات رسمية مفصلة عن أدائه في العربية حتى أبريل 2026، لكن المستخدمون في المنتديات التقنية يشيرون إلى أداء مقبول في المهام النصية والبرمجية بالعربية، مع بعض التحسينات المطلوبة في اللهجات أو السياقات الثقافية المعقدة. هذا يجعله خياراً عملياً للتطبيقات العربية التي تحتاج سرعة وتكلفة منخفضة، خاصة في الـagents والأتمتة.
طرق الوصول متعددة ومرنة:
- API الرسمي: عبر platform.stepfun.ai (دولي) أو platform.stepfun.com (الصين)، مع model ID step-3.5-flash.
- OpenRouter: يدعم tier مجاني ومدفوع.
- نشر محلي: Hugging Face، vLLM، SGLang، llama.cpp.
- منصات أخرى: NVIDIA NIM، DeepInfra، وتكامل مع OpenClaw لتجربة agentic كاملة.
- تطبيقات: ويب وتطبيقات iOS/Android من Stepfun.
نقاط التفوق والضعف الحقيقية
نقاط التفوق:
- كفاءة استثنائية: أعلى «ذكاء لكل واط» في فئة النماذج الكبيرة المفتوحة.
- أداء agentic حقيقي: يتفوق في المهام الطويلة الأفق مثل البحث، التنفيذ، والتحقق.
- تكلفة منخفضة تجعل الـscaling الإنتاجي ممكناً.
- دعم محلي كامل يحافظ على الخصوصية.
الضعف:
- محدودية الوسائط (text-only حالياً).
- أداء أقل في بعض المهام العامة مقارنة بنماذج غربية متخصصة في الشمولية.
- الاعتماد على أجهزة قوية للنشر المحلي الكامل (رغم دعم الـquantization).
التأثير على السوق والمستقبل
يُمثّل Step 3.5 Flash تحولاً في ديناميكية السوق: نموذج صيني مفتوح يفرض معايير جديدة للكفاءة والسرعة. في وقت تتنافس فيه OpenAI وGoogle وAnthropic على النماذج الملكية باهظة التكلفة، يفتح Stepfun الباب أمام المطورين والشركات الصغيرة لنشر agents متقدمة بتكلفة معقولة. هذا النهج «الصيني» — تركيز على الكفاءة والـopen-source — قد يُسرّع تبني الذكاء الاصطناعي الوكيل عالمياً، خاصة في الأسواق الناشئة والتطبيقات الصناعية.
مع ذلك، لا يزال الطريق طويلاً. المنافسة من Qwen وDeepSeek وMiniMax ستدفع Stepfun لتحسين الدعم متعدد الوسائط واللغات. أما في الغرب، فإن رد الفعل سيكون مزيجاً من الإعجاب بالكفاءة والقلق من المنافسة غير المتكافئة في الوصول إلى البيانات والحوسبة.
في النهاية، Step 3.5 Flash ليس مجرد نموذج آخر؛ بل دليل على أن الابتكار في الذكاء الاصطناعي لم يعد محصوراً في كاليفورنيا. إنه يُعيد تعريف ما يعنيه «Flash»: ليس فقط سرعة، بل ذكاء يعمل فعلياً داخل التدفقات اليومية بتكلفة تسمح بالانتشار الحقيقي. للمطورين الذين يبنون agents أو تطبيقات إنتاجية عالية الحجم، يُعدّ هذا النموذج خياراً لا يمكن تجاهله في 2026.
عدد القراءات
... قارئ