نماذج ٤ أبريل ٢٠٢٦ 4 دقائق قراءة

GPT Image 1.5: النموذج الذي غير قواعد إنتاج وتحرير الصور من OpenAI

استعراض شامل لـGPT Image 1.5 الصادر في 16 ديسمبر 2025: سرعة توليد أعلى 4 أضعاف، تحرير دقيق يحافظ على التفاصيل، وتكلفة أقل بنسبة 20%.

ف

فريق AI DayaHimour

٤ أبريل ٢٠٢٦

GPT Image 1.5: النموذج الذي غير قواعد إنتاج وتحرير الصور من OpenAI

مقدمة

في 16 ديسمبر 2025، أطلقت OpenAI نموذج GPT Image 1.5، النموذج الذي غير قواعد إنتاج وتحرير الصور الرقمية. لم يكن هذا تحديثاً روتينياً، بل نقلة نوعية جعلت عملية توليد الصور أسرع بأربع مرات، وأكثر دقة في الالتزام بالتعليمات، وأقدر على الحفاظ على التفاصيل أثناء التعديلات.

يأتي GPT Image 1.5 مدمجاً كجزء أصلي من عائلة GPT كـنموذج multimodal، مما يعني فهماً أعمق للنص والصور معاً. النتيجة: صور عالية الجودة تتبع التعليمات بدقة غير مسبوقة، وتعديلات جراحية لا تغير العناصر الأصلية إلا حسب الطلب.

في هذا المقال سنستعرض المواصفات الفنية الدقيقة، الأداء المقارن، التطبيقات العملية، وطرق الوصول بناءً على البيانات الرسمية من OpenAI فقط.

ما هو GPT Image 1.5؟

GPT Image 1.5 هو النموذج الرائد الجديد في عائلة GPT Image من OpenAI. صدر رسمياً في 16 ديسمبر 2025، وأصبح متاحاً فوراً في ChatGPT لجميع المستخدمين، وفي API تحت اسم gpt-image-1.5.

يُبنى النموذج كـنموذج لغة multimodal أصلي، خلافاً لنماذج الانتشار التقليدية المنفصلة. يركز على الإنتاجية العالية: توليد صور بجودة احترافية مع التزام قوي بالتعليمات، وتحرير طبيعي يحافظ على التركيب والإضاءة والوجوه والشعارات.

يحل GPT Image 1.5 محل الاعتماد التدريجي على DALL·E 3 (التي سيتم إيقاف دعمها في 12 مايو 2026)، ويُعد الأقوى في سلسلة GPT Image التي تشمل GPT Image 1 وGPT Image 1-mini.

المواصفات الفنية الرئيسية لـGPT Image 1.5

  • المدخلات: نص + صور (حتى 5-10 صور مرجعية).
  • المخرجات: صور (PNG، JPEG، WebP).
  • الدقة المدعومة: 1024x1024، 1024x1536، 1536x1024 (مع خيار auto).
  • إعدادات الجودة: low، medium، high، auto.
  • السرعة: أعلى 4 أضعاف من GPT Image 1.
  • التكلفة: أقل بنسبة 20% للصور المدخلة والمخرجة.
  • القدرات الرئيسية: توليد من نص (text-to-image)، تحرير بالتعليمات الطبيعية، حفظ الوجوه والشعارات والإضاءة والتركيب، عرض نص كثيف بدقة عالية، خلفيات شفافة، وتدفق جزئي أثناء التوليد.

يدعم النموذج وضع input_fidelity: high للحفاظ على أعلى دقة للصور المدخلة، ويتيح تعديلات متعددة الدورات دون فقدان الاتساق.

الأداء والمقارنات

يُصنف GPT Image 1.5 كأفضل نموذج عام لتوليد الصور من OpenAI حتى الآن، مع تفوق واضح في الالتزام بالتعليمات، دقة النص، والتحرير الدقيق. حسب OpenAI، يحقق نتائج أكثر موثوقية وطبيعية، خاصة في الحفاظ على التفاصيل عبر التعديلات المتكررة.

إليك جدول مقارنة داخل عائلة GPT Image بناءً على وثائق OpenAI الرسمية:

النموذجالسرعة النسبيةالتكلفة النسبيةقوة الالتزام بالتعليماتحفظ التفاصيل أثناء التحرير
GPT Image 1.54x أسرعأقل 20%الأعلىممتاز (جراحي)
GPT Image 1أبطأأعلىجيدجيد
GPT Image 1-miniأسرعالأقلجيدمحدود
DALL·E 3 (مهمل)متوسطة-متوسطمحدود

يبرز GPT Image 1.5 في دقة النص الكثيف (مثل الجرائد أو الملصقات)، الحفاظ على الوجوه والشعارات أثناء التحرير، والمنطق الواقعي في السياقات المعقدة.

تطبيقات عملية حقيقية لـGPT Image 1.5

  1. تعديل صور منتجات: أدخل صورة منتج واحدة واطلب “غيّر الخلفية إلى شاطئ غروب شمس مع إضافة شعار الشركة باللون الأزرق hex #007BFF دون تغيير المنتج نفسه”. يحافظ النموذج على الإضاءة والتركيب والتفاصيل الدقيقة.

  2. تصميم واجهات تطبيقات: “أنشئ واجهة تطبيق جوال لتسوق بالعربية مع أزرار واضحة ونصوص كثيفة”. يدعم النص المعقد والتخطيطات بدقة فائقة.

  3. تعديلات متتالية: حمّل صورة شخصية واطلب “غيّر الملابس إلى بدلة رسمية مع الحفاظ على الوجه والإضاءة” ثم “أضف خلفية مكتب حديث”. يبقي الاتساق عبر الدورات دون إعادة توليد كامل.

  4. إنشاء محتوى تسويقي: “حوّل هذه الصورة إلى إعلان كامل مع نصوص عربية واضحة وخلفية احترافية”. ينتج نتائج جاهزة للاستخدام التجاري بسرعة عالية.

  5. إنشاء كتالوجات منتجات: من صورة مصدر واحدة، يولد متغيرات وزوايا ومشاهد مختلفة مع الحفاظ على الهوية البصرية.

عائلة GPT Image: اختيار النموذج المناسب

  • GPT Image 1.5: الخيار الأمثل للإنتاج الاحترافي بفضل السرعة والدقة والتحرير المتقدم.
  • GPT Image 1: خيار متوازن للاستخدام العام.
  • GPT Image 1-mini: مناسب عندما تكون التكلفة الأولوية والجودة أقل أهمية.
    DALL·E 2 و3 أصبحا مهملين تدريجياً.

كيفية الوصول والنشر

  • في ChatGPT: متاح للجميع عبر https://chatgpt.com/images مع تجربة جديدة تشمل فلاتر جاهزة ورفع صور مرجعية.
  • عبر API: استخدم gpt-image-1.5 في endpoints generations أو edits. متوافق مع Responses API لتدفق محادثي.
    روابط رسمية: https://platform.openai.com/docs/guides/image-generation
    Playground: https://platform.openai.com/playground/images
  • منصات خارجية: Replicate، Adobe Firefly، Microsoft Foundry وغيرها.
  • التكلفة التقريبية: Low (~0.009-0.013 دولار/صورة)، Medium (~0.034-0.05 دولار)، High (~0.133-0.20 دولار) حسب الدقة.
  • الترخيص: الاستخدام التجاري مسموح عبر API.

الخاتمة ورسالة نهائية

GPT Image 1.5 يمثل تحولاً حقيقياً في عالم الذكاء الاصطناعي البصري. بفضل السرعة الأعلى أربع مرات، الالتزام الأقوى بالتعليمات، وحفظ التفاصيل أثناء التحرير، أصبح إنتاج الصور الرقمية عملية تلقائية موثوقة ومنخفضة التكلفة.

النموذج متوفر الآن ويتفوق في التوازن بين الأداء والكفاءة. جربوه مباشرة على https://chatgpt.com/images أو الـPlayground وقارنوا النتائج بأنفسكم.

الروابط الرسمية الدقيقة:

GPT Image 1.5 ليس مجرد أداة جديدة؛ إنه بداية عصر جديد لإنتاج المحتوى البصري بكفاءة واحترافية غير محدودة. ابدأوا به اليوم لترفعوا جودة عملكم البصري إلى مستوى غير مسبوق.

GPT Image 1.5OpenAIتوليد صور AIتحرير صور بالذكاء الاصطناعيGPT Imageنماذج multimodal

عدد القراءات

... قارئ

شارك المقال:

مقالات ذات صلة

Midjourney v8 — الإصدار الذي حسم جدل 'هل الصور الاصطناعية وصلت للسينما؟'
نماذج

Midjourney v8 — الإصدار الذي حسم جدل 'هل الصور الاصطناعية وصلت للسينما؟'

تحليل معمق لإصدار Midjourney v8 Alpha الذي أُطلق في مارس 2026، مع التركيز على التغييرات التقنية مقارنة بـv7، أدائه مقابل المنافسين، والجدل القانوني والفني حول استخدامه في الإنتاج السينمائي.

٥ أبريل ٢٠٢٦ اقرأ المزيد
Seedream 5.0 Lite من ByteDance: نموذج توليد الصور الذي يجمع الذكاء العميق بالبحث الحي ويستهدف الاستخدام التجاري
نماذج

Seedream 5.0 Lite من ByteDance: نموذج توليد الصور الذي يجمع الذكاء العميق بالبحث الحي ويستهدف الاستخدام التجاري

النسخة Lite من Seedream 5.0 تقدم توليد صور موحد متعدد الوسائط مع استدلال بصري متعدد الخطوات وبحث إنترنت فوري، وتتفوق في التوافق مع النصوص والتحرير الدقيق بتكلفة منخفضة تجعلها خياراً عملياً للعلامات التجارية.

٥ أبريل ٢٠٢٦ اقرأ المزيد
Step 3.5 Flash من Stepfun: النموذج الصيني السريع الذي يتحدى النماذج الغربية بكفاءة غير مسبوقة
نماذج

Step 3.5 Flash من Stepfun: النموذج الصيني السريع الذي يتحدى النماذج الغربية بكفاءة غير مسبوقة

نموذج مفتوح المصدر بـ196 مليار معامل يفعّل 11 مليار فقط لكل توكن، يحقق أداءً متقدماً في الاستدلال والمهام الوكيلة بسرعة تصل إلى 350 توكن في الثانية، ويُقدّم تكلفة API منخفضة تجعله منافساً مباشراً لنماذج الـFlash الغربية.

٥ أبريل ٢٠٢٦ اقرأ المزيد