22 يونيو 2026: شهدت أسهم شركات الرقائق الأمريكية ارتفاعاً جماعياً—حيث قفز مؤشر فيلادلفيا لأشباه الموصلات بنسبة %6.42 في يوم واحد. وارتفعت أسهم إنتل بأكثر من %10 بعد الإعلان عن شراكة تصنيع رقائق مع Apple. كما صعدت شهادات الإيداع الأمريكية لشركة TSMC بنسبة %6.94 لتغلق عند $462.12، وارتفعت Nvidia بنحو %3. يعكس هذا الانتعاش في السوق تحولاً متسارعاً في الصناعة: حيث ينتقل الطلب على الحوسبة في الذكاء الاصطناعي من التركيز على التدريب إلى التركيز على الاستدلال.

تشير تحليلات الصناعة إلى أن الاستدلال يشكل الآن ثلثي إجمالي الطلب على الحوسبة في الذكاء الاصطناعي، مرتفعاً من حوالي الثلث في عام 2023، ومن المتوقع أن يصل إلى %70–%85 بحلول 2028–2030. هذا التحول الهيكلي يعيد تعريف ساحة المنافسة الرئيسية في سوق الرقائق—من "من يمتلك أسرع وحدة معالجة رسومات (GPU) للتدريب" إلى "أي شريحة تقدم أقل تكلفة إجمالية للاستدلال وأعلى إنتاجية".

تُقدّر قيمة سوق رقائق الاستدلال في الذكاء الاصطناعي عالمياً بـ $85.4 مليار في 2024، ومن المتوقع أن ينمو من $105.47 مليار في 2025 إلى $570.77 مليار بحلول 2033، بمعدل نمو سنوي مركب (CAGR) يبلغ %23.5 خلال فترة التوقعات. ويُقدّر حجم سوق رقائق الاستدلال السحابي فقط بـ $102.19 مليار في 2025، مع توقع وصوله إلى $118.9 مليار في 2026، وقد يبلغ $320.98 مليار بحلول 2032. في الوقت نفسه، من المتوقع أن يتوسع سوق شرائح الذكاء الاصطناعي الطرفية (بما يشمل الاستدلال والتدريب) من $34.4 مليار في 2026 إلى $96 مليار بحلول 2031.

خلال دورة التوسع هذه، يتغير ميزان القوى بين أنواع الرقائق بطرق دقيقة ولكن عميقة. تظل وحدات معالجة الرسومات (GPU) اللاعب المهيمن في السوق، مدعومة بالطلب على كل من التدريب والاستدلال، ومن المتوقع أن تحافظ على معدل نمو سنوي مركب يبلغ %20 حتى 2031. ومع ذلك، تُعتبر شرائح ASIC الخاصة بالذكاء الاصطناعي أسرع القطاعات نمواً بحسب العديد من المؤسسات. حيث يقدّر محللو JPMorgan أن سوق شرائح ASIC الرقمية للذكاء الاصطناعي سيصل إلى $60–$70 مليار بحلول 2026، مع معدل نمو سنوي مركب يتجاوز %40–%50 في السنوات القادمة.

الأكثر لفتاً للنظر هو عودة وحدات المعالجة المركزية (CPU) إلى الواجهة. فعلى مدى السنوات الثلاث الماضية، لعبت وحدات المعالجة المركزية دوراً هامشياً في سرديات الذكاء الاصطناعي، لكن الانفجار في الطلب على الاستدلال يعيد رسم هذا المشهد.

لماذا تعود وحدات المعالجة المركزية إلى مركز الاهتمام

يختلف الاستدلال والتدريب في الذكاء الاصطناعي اختلافاً جوهرياً في منطق الحوسبة. فالتدريب يتطلب عمليات مصفوفات متوازية هائلة—تريليونات من العمليات الحسابية العائمة تُنفذ في وقت واحد عبر آلاف أنوية GPU، وهي البيئة التي تتفوق فيها وحدات معالجة الرسومات. أما الاستدلال، خاصة في الذكاء الاصطناعي القائم على الوكلاء، فيتضمن تنظيم المهام، واستدعاء الأدوات، والتفكير المنطقي متعدد الخطوات، واتخاذ القرارات التسلسلية. وتعتمد هذه الأحمال بشكل كبير على التحكم المنطقي المعقد والمعالجة التسلسلية، وهي مجالات تتألق فيها وحدات المعالجة المركزية.

وجدت دراسة مشتركة بين Georgia Tech وIntel أن %50–%90 من زمن التأخير في سيناريوهات الذكاء الاصطناعي القائم على الوكلاء يأتي من وحدة المعالجة المركزية، وليس من المسرّع الحوسبي—لأن النماذج الكبيرة يجب أن تستدعي الإضافات، وتنفذ عمليات بحث عبر الإنترنت، وتتعامل مع منطق متعدد الخطوات، وكل ذلك تديره وحدة المعالجة المركزية. وأقرت Nvidia نفسها بهذا الواقع في مارس 2026: حيث صرّح المدير التنفيذي Dion Harris علناً بأن "وحدة المعالجة المركزية أصبحت عنق الزجاجة في سير عمل الذكاء الاصطناعي"—وهو اعتراف لافت من شركة بُنيت على الاعتقاد بأن "وحدات معالجة الرسومات هي الشرائح الوحيدة التي يحتاجها الذكاء الاصطناعي".

توضح نسب التكوين المتغيرة هذا الاتجاه بوضوح. ففي التدريب على الذكاء الاصطناعي، تكون نسبة وحدة المعالجة المركزية إلى وحدة معالجة الرسومات عادة 1:8، حيث تتحمل وحدات معالجة الرسومات معظم عبء الحوسبة. أما في عصر الاستدلال، فتشير TrendForce إلى أن هذه النسبة تضيق بسرعة لتتراوح بين 1:1 و1:2. وأشار الرئيس التنفيذي لشركة Intel، Pat Gelsinger، في مكالمة أرباح الربع الأول لعام 2026 إلى أن أحمال التدريب تتطلب عادة 7–8 وحدات GPU لكل وحدة CPU، بينما تقلصت أحمال الاستدلال إلى 3–4 وحدات GPU لكل وحدة CPU، مع إمكانية الوصول إلى توازن 1:1.

وبالاستناد إلى تقديرات الرئيس التنفيذي لشركة Nvidia، Jensen Huang: يحتاج كل مركز بيانات بقدرة جيجاوات إلى حوالي 300,000 وحدة GPU من نوع Rubin، وبناءً على 136 نواة لكل وحدة CPU من نوع ARM، حوالي 221,000 وحدة CPU لكل جيجاوات. وهذا يحدد نسبة CPU إلى GPU الجديدة عند حوالي 1:1.4. وبالمقارنة مع عصر هيمنة GPU، ارتفعت مكانة وحدة المعالجة المركزية بشكل ملحوظ.

خندق GPU وتحديات أحمال الاستدلال

على الرغم من استعادة وحدات المعالجة المركزية لبعض مكانتها، تظل وحدات معالجة الرسومات تحتل موقعاً لا يمكن استبداله في استدلال الذكاء الاصطناعي، بفضل ميزاتها في عرض النطاق الترددي للذاكرة والإنتاجية المتوازية.

فعند استدلال النماذج اللغوية الكبيرة (LLM)، يتطلب توليد كل رمز قراءة مئات الملايين إلى عشرات المليارات من المعاملات—وهي مهمة تقليدية كثيفة الذاكرة. تعتمد وحدات المعالجة المركزية على ذاكرة DDR النظامية، والتي توفر عادة عرض نطاق ترددي يتراوح بين 50–100 جيجابايت/ثانية. بينما تستخدم وحدات معالجة الرسومات ذاكرة GDDR6X أو HBM، مع عرض نطاق يتجاوز 800 جيجابايت/ثانية؛ ويمكن لوحدات GPU المتقدمة مع HBM2e أن تصل إلى 1.5 تيرابايت/ثانية، أي 20 ضعف قدرة وحدات المعالجة المركزية. ففي استدلال نموذج Llama 3.1 8B، تحقق حلول CPU فقط 819 رمز/ثانية لكل مهمة، بينما يحقق عنقود مكون من 8 وحدات GPU ما يصل إلى 46,841 رمز/ثانية. ومع زيادة الطلبات المتزامنة، ينخفض أداء CPU بشكل حاد من 819 رمز/ثانية إلى 257 رمز/ثانية، بينما لا يكاد يتأثر أداء عنقود الـ8 GPU.

أما من حيث كثافة الحوسبة، تقدم وحدات معالجة الرسومات آلاف أنوية CUDA للتوازي، وتدعم صيغ الدقة المنخفضة مثل FP4/FP8، وتوفر مئات التيرافلوبس. بينما توفر وحدات المعالجة المركزية عادة حوسبة FP32 في نطاق 1–10 تيرافلوبس.

تظهر هذه الأرقام أنه في سيناريوهات الاستدلال ذات الإنتاجية العالية والتزامن الكبير—مثل خدمات الذكاء الاصطناعي السحابية واسعة النطاق—تظل وحدات معالجة الرسومات هي الحل الأمثل. وتبقى هيمنة Nvidia في هذا المجال بلا منازع. فوفقاً لـ SemiAnalysis، استحوذت Nvidia على %92 من سوق رقائق التدريب للذكاء الاصطناعي و%78 من سوق رقائق الاستدلال في الربع الأول من 2026. وتقدّر IDC أن Nvidia تسيطر على حوالي %81 من سوق رقائق الذكاء الاصطناعي. ومن المتوقع أن يصل سوق مسرّعات الذكاء الاصطناعي إلى $160 مليار في 2025 وأكثر من $200 مليار في 2026، مع استحواذ الاستدلال على ثلثي الإنفاق.

ومع ذلك، تواجه حصة GPU في سوق الاستدلال ضغوطاً متعددة—من عودة CPU، ومنافسة ASIC المتخصصة، واعتبارات التكلفة العملية.

هجوم مضاد من موردي وحدات المعالجة المركزية في الاستدلال

أدى إعادة تقييم دور وحدات المعالجة المركزية في الاستدلال إلى زخم ملحوظ في السوق.

يشهد سوق معالجات مراكز البيانات نمواً سريعاً، مدفوعاً بالطلب المتزايد على أحمال الذكاء الاصطناعي التوليدي. ومن المتوقع أن يتوسع حجم السوق من $215 مليار في 2025 إلى $656 مليار بحلول 2031. وتشير Guohai Securities إلى أن مراكز البيانات الضخمة تدخل "دورة ترقية"، مع توقع نمو شحنات وحدات CPU للخوادم بنسبة %25 في 2026.

وتبرز AMD كمستفيد رئيسي من هذا الاتجاه. فقد أدى الطلب على خوادم الذكاء الاصطناعي إلى زيادة شحنات وحدات EPYC CPU، حيث استحوذ الجيل الخامس Turin على حصة كبيرة من سوق وحدات CPU للخوادم. ومن المتوقع أن ينمو نشاط وحدات CPU للخوادم لدى AMD بنسبة لا تقل عن %50 في 2026. ويتوقع محللو Bernstein أن تقفز مبيعات معالجات EPYC الرائدة بنسبة %30 في 2026. واعتباراً من أوائل 2026، تسيطر Intel على حوالي %60 من سوق CPU لمراكز البيانات، وAMD على حوالي %24، وNvidia على حوالي %6. كما تنافس AMD في سوق GPU للذكاء الاصطناعي من خلال مسرّعات Instinct، ما يمنحها موقعاً مزدوجاً فريداً في عصر الاستدلال.

وتعمل Intel أيضاً على تعديل استراتيجيتها بنشاط. ففي معرض Computex في يونيو 2026، أعلن الرئيس التنفيذي الجديد Pat Gelsinger عن عودة وحدات المعالجة المركزية إلى الصدارة في عصر الاستدلال، مستفيداً من تقنية التصنيع 18A وهياكل الفصل على مستوى الرفوف. تنتقل بنية الذكاء الاصطناعي من "التسوق الشامل" إلى "تجميع بنمط الليغو". وتتميز معالجات Xeon من Intel بامتدادات المصفوفة المتقدمة (AMX)، التي تسرّع الاستدلال للنماذج اللغوية الكبيرة ذات الأحجام الصغيرة إلى المتوسطة من المعاملات، حتى بدون وحدات GPU أو مسرّعات ذكاء اصطناعي أخرى.

أما التحول الأكثر رمزية فيأتي من Nvidia نفسها. فالشركة التي عرّفت عصر الذكاء الاصطناعي بوحدات GPU أطلقت خطوط منتجات CPU Grace وVera في 2026، مع تصميم Vera خصيصاً لأحمال الاستدلال والذكاء الاصطناعي القائم على الوكلاء. وتتوقع Nvidia أن تصل إيرادات أعمال CPU لديها إلى $20 مليار في 2026. كما أطلقت Nvidia وArm منتجات CPU مستقلة في 2026، ما يمثل دخول عملاق GPU رسمياً إلى ساحة CPU.

شرائح ASIC والرقائق المخصصة: صعود المسار الثالث

بعيداً عن ثنائية GPU-CPU، تظهر شرائح ASIC (الدوائر المتكاملة الخاصة بالتطبيقات) كأسرع متغير نمواً في سوق الاستدلال.

وتتوقع TD Cowen أن تنخفض حصة السوق لمسرّعات الذكاء الاصطناعي التجارية من حوالي %91 في 2025 إلى %75 في 2030، بينما سترتفع حصة ASIC المخصصة من %9 إلى %25. ومن المتوقع أن تنمو شحنات خوادم ASIC بنسبة %44.6 في 2026، مقارنة بنمو شحنات خوادم GPU بنسبة %16.1—أي ثلث معدل نمو ASIC فقط.

وتسرّع مزودو الخدمات السحابية الضخمة تطوير رقائق الاستدلال المخصصة. فكل من Google TPU، وAWS Inferentia، وMeta MTIA، وLPU من Groq (وحدة معالجة اللغة) هي شرائح ASIC محسّنة للاستدلال. وبلغت إيرادات الذكاء الاصطناعي لشركة Broadcom $10.8 مليار في الربع الثاني من 2026، بزيادة %143 على أساس سنوي، مع توجيه سنوي كامل يبلغ $56 مليار، بارتفاع %180. ومن المتوقع أن تستحوذ Broadcom على حوالي %60 من سوق رقائق الذكاء الاصطناعي المخصصة.

تشير هذه الاتجاهات إلى تحول سوق رقائق الاستدلال من "هيمنة وحدات GPU العامة" إلى مشهد متنوع من "GPU + CPU + ASIC". حيث تتولى وحدات GPU التدريب المكثف والاستدلال واسع النطاق، وتدير وحدات CPU تنظيم المهام والتحكم في النظام، وتوفر شرائح ASIC كفاءة طاقة قصوى لأحمال الاستدلال المحددة.

هيكل التكلفة وإعادة تشكيل اقتصاديات الاستدلال

في النهاية، يتوقف اختيار الرقائق للاستدلال على سؤال محوري: تكلفة كل مليون رمز.

خلال التدريب، تكون دقة النموذج ووقت التدريب هما المعياران الأساسيان، وتكون القدرة على تحمل التكلفة أعلى. أما الاستدلال، فهو نشاط إنتاجي مستمر وعالي التكرار—حيث كل استدعاء لواجهة برمجة التطبيقات (API) وكل طلب مستخدم يترتب عليه تكلفة مباشرة. وهذا ينقل المنافسة بين الرقائق من "الأداء المطلق" إلى "الإنتاجية الفعالة لكل وحدة تكلفة".

تتطلب حلول GPU استثماراً أولياً أعلى في الأجهزة. فعلى سبيل المثال، تُباع وحدة AMD MI300X بسعر يتراوح بين $10,000–$15,000، بينما تتراوح أسعار H100 من Nvidia بين $25,000–$40,000. ومع ذلك، تقدم وحدات GPU تكاليف حوسبة أقل لكل وحدة—حيث تولد مثيلات GPU حسب الطلب من مزودي الخدمات السحابية الرموز بتكلفة أقل بنسبة %40–%60 لكل ثانية مقارنة بمثيلات CPU. وتكون وحدات CPU مناسبة لسيناريوهات المهام الفردية، والتزامن المنخفض، وزمن الاستجابة المنخفض، إذ لا تتطلب استثماراً إضافياً في الأجهزة.

لكن مع توسع نطاق الاستدلال، تواجه حلول CPU ارتفاعاً سريعاً في التكلفة الحدية. فعندما تزداد الطلبات المتزامنة، يجب على وحدات CPU جدولة المهام عبر تدوير الفترات الزمنية، مع زيادة عبء تبديل السياق بشكل أسي. وهذا يعني أنه بالنسبة لنشر الاستدلال على نطاق واسع، غالباً ما يوفر الاستثمار الأولي المرتفع في حلول GPU أو ASIC عائداً أفضل طويل الأمد من خلال إنتاجية أعلى وتكلفة أقل لكل وحدة.

الخلاصة

يعكس ارتفاع الطلب على الاستدلال من الثلث إلى الثلثين من إجمالي حوسبة الذكاء الاصطناعي تحولاً جوهرياً في المنافسة ضمن صناعة الرقائق.

بالنسبة لشركة Nvidia، من غير المرجح أن تتعرض هيمنتها شبه المطلقة في سوق التدريب (بحصة تقارب %90) لتحديات على المدى القصير، لكن معركة حصة السوق الإضافية في الاستدلال ستزداد حدة. وتقدم New Street Research التوقع الأكثر جرأة: إذ قد تنخفض حصة Nvidia في الاستدلال إلى %20–%30 بحلول 2028. حتى توقع Bloomberg Intelligence الأكثر تحفظاً—بأن Nvidia ستحتفظ بحصة %70–%75 بحلول 2030—يقر بأن نمو شحنات ASIC يتفوق بكثير على نمو GPU.

أما بالنسبة لـ AMD وIntel، فإن عودة الطلب على وحدات المعالجة المركزية في عصر الاستدلال تمثل فرصة هيكلية. حيث تهدف استراتيجية AMD المزدوجة مع وحدات EPYC CPU ووحدات Instinct GPU، وتكرارات معالجات Xeon من Intel بتقنية 18A، إلى اقتناص هذه الفرصة.

وبالنسبة لمزودي الخدمات السحابية ومطوري تطبيقات الذكاء الاصطناعي، تعني الخيارات المتعددة للرقائق فرصاً أكبر لتحسين التكلفة. فمن وحدات GPU العامة إلى شرائح ASIC المخصصة، ومن الاستدلال عبر CPU إلى التسريع عبر GPU، سيعتمد اختيار الأجهزة بشكل متزايد على خصوصية كل عبء عمل—حجم النموذج، ومتطلبات زمن الاستجابة، والتزامن، والميزانية.

ينمو الطلب على الحوسبة للاستدلال في الذكاء الاصطناعي بوتيرة أسرع من التدريب. وهذا التحول من التدريب إلى الاستدلال يعيد تشكيل سلسلة الصناعة بأكملها، من تصميم الرقائق إلى بنية مراكز البيانات. لن تفقد وحدات معالجة الرسومات مكانتها، لكنها لم تعد الحل الوحيد.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement

أَعجِب المحتوى