مما قلل بشكل كبير من معدل الخمول لقوة حوسبة GPU ، تلقى Enfabrica جولة تمويل بقيمة 125 مليون دولار من NVIDIA

المصدر الأصلي: ألفا كومونة

مصدر الصورة: تم إنشاؤه بواسطة الذكاء الاصطناعي غير محدود

يعد نقص قوة الحوسبة حاليا مشكلة تواجهها صناعة الذكاء الاصطناعي بأكملها ، في الأسبوع الماضي فقط ، بعد Devday من OpenAI ، بسبب سلسلة من الميزات الجديدة التي جذبت عددا كبيرا من المستخدمين لتجربتها ، شهدت واجهات برمجة تطبيقات ChatGPT و GPT مجموعة واسعة من فترات التوقف على المدى الطويل ، وأعلن Sam Altman أيضا تعليق تسجيل أعضاء Plus الجدد.

في الوقت الحاضر ، في مجال قوة الحوسبة الذكاء الاصطناعي ، تحتل وحدة معالجة الرسومات من NVIDIA موقعا شبه احتكاري ، سواء كانت A100 أو H100 أو H200 التي تم إصدارها للتو ، فهي معيار رقائق الحوسبة الذكاء الاصطناعي ، لكن وحدة معالجة الرسومات الخاصة بها تواجه مشكلة: لن تتمكن مجموعة طاقة حوسبة بطاقة الرسومات المنتشرة في مركز البيانات من توفير البيانات بسرعة كافية لأن شبكة الاتصال لا يمكنها توفير البيانات بسرعة ، ولا يمكن تشغيلها عند التحميل الكامل جزء من الوقت ، مما يؤدي إلى إهدار قوة الحوسبة ، مما يؤدي بدوره إلى رفع التكلفة الإجمالية للملكية (TCO).

تستخدم شركة ناشئة تسمى Enfabrica شرائح الشبكة المطورة خصيصا لمراكز البيانات الذكاء الاصطناعي لزيادة استخدام طاقة الحوسبة لعقد أداء GPU بنسبة 50٪ وتقليل تكلفة طاقة الحوسبة للاستدلال والتدريب الذكاء الاصطناعي.

أغلقت Enfabrica جولة تمويل من السلسلة B بقيمة 125 مليون دولار بقيادة Atreides Management مع NVIDIA كمستثمر استراتيجي ، إلى جانب مشاركة من IAG Capital Partners و Liberty Global Ventures و Valor Equity Partners و Infinitum Partners و Alumni كما تواصل Ventures ، مستثمرها المبكر ، Sutter Hill Ventures ، إضافة أوزان.

أدت هذه الجولة من التمويل إلى زيادة تقييم الشركة بأكثر من 5 أضعاف عن الجولة السابقة ، ليصل تمويلها التراكمي إلى 148 مليون دولار. ينضم جافين بيكر ، مؤسس Atreides Management ، إلى مجلس الإدارة للمساعدة في نمو الشركة وتوجهها الاستراتيجي.

**بهدف مواجهة التحديات الرئيسية في مجال قوة الحوسبة الذكاء الاصطناعي ، يوحد اثنان من قدامى المحاربين في مجال الرقائق قواهم لبدء عمل تجاري **

وفقا لأحدث أبحاث السوق من 650 Group ، وهو معهد أبحاث يركز على سلاسل توريد الحوسبة السحابية ، من المرجح أن ينمو حجم الطلب على الحوسبة الذكاء الاصطناعي / ML من 8 إلى 275 مرة كل 24 شهرا ، وستنمو الخوادم القائمة على الذكاء الاصطناعي / ML من 1٪ من السوق إلى ما يقرب من 20٪ في العقد المقبل.

ومع ذلك ، نظرا لخصائص الحوسبة الذكاء الاصطناعي ، شكلت الحركة الكبيرة للبيانات والبيانات الوصفية بين عناصر الحوسبة الموزعة عنق الزجاجة. يشير ديلان باتيل ، المحلل في SemiAnalysis ، إلى أن قوة الحوسبة الفاصلة العائمة (FLOPs) لكل جيل من الرقائق / الحزم تنمو بشكل أسرع من سرعة إدخال البيانات وإخراجها. وهذا عدم التطابق يزداد سوءا.

تم إنشاء Enfabrica بواسطة روشان سانكار وشريجيت موخيرجي. روشان سانكار هو مدير سابق للهندسة في شركة Broadcom العملاقة للرقائق ، وكان Shrijeet Mukherjee مسؤولا عن منصة الشبكة والهندسة المعمارية في Google ، ولديهم فهم عميق وخبرة في الرقائق وبنية الشبكة.

من حيث الهيكل التنظيمي ، فإن Sankar هو الرئيس التنفيذي ، و Mukherjee هو الرئيس التنفيذي للتطوير ، ويضم الفريق الأساسي لشركة Enfabrica كبار المهندسين من Cisco و Meta و Intel وشركات أخرى في مجالات الذكاء الاصطناعي والشبكات والرقائق.

تستهدف Enfabrica الطلب المتزايد على البنية التحتية للحوسبة "المتوازية والمتسارعة وغير المتجانسة" (أي وحدات معالجة الرسومات) في صناعة الذكاء الاصطناعي.

"يتمثل التحدي الأكبر الذي تفرضه ثورة الذكاء الاصطناعي الحالية في توسيع البنية التحتية الذكاء الاصطناعي - سواء من حيث التكلفة الحسابية أو الاستدامة الحاسوبية.

تواجه شرائح الشبكة التقليدية ، مثل المحولات ، صعوبة في مواكبة متطلبات حركة البيانات لأحمال عمل الذكاء الاصطناعي الحديثة ، والتي يمكن أن تخلق اختناقات للمتطلبات الحسابية مثل التدريب الذكاء الاصطناعي أو الضبط الدقيق الذكاء الاصطناعي الذي يتطلب مجموعات بيانات كبيرة أثناء عملية التدريب.

هناك حاجة ملحة في مساحة الحوسبة الذكاء الاصطناعي لسد الفجوة بين الطلبات المتزايدة لأعباء العمل الذكاء الاصطناعي والتكلفة الإجمالية والكفاءة والاستدامة وسهولة توسيع نطاق مجموعات الحوسبة. "

تقدم Enfabrica أجهزة وحلول Scale Fabric Switch (ACF-S) المسرعة التي تكمل وحدات معالجة الرسومات ووحدات المعالجة المركزية والمسرعات لمعالجة مشكلات الشبكات الحرجة والإدخال / الإخراج وتوسيع نطاق الذاكرة في الذكاء الاصطناعي مركز البيانات ومجموعات الحوسبة عالية الأداء. إنه يقلل من تكلفة الحوسبة لوحدات معالجة الرسومات لمركز البيانات ومجموعات الحوسبة المتسارعة بنسبة 50٪ ، ويوسع الذاكرة بمقدار 50 مرة ، ويقلل من تكلفة الحوسبة لاستدلال النموذج الكبير بحوالي 50٪ في نفس نقطة الأداء ، مما يحقق انخفاضا في التكلفة الإجمالية للملكية (TCO).

وفقا لمجموعة Dell'Oro Group ، ستمكن استثمارات البنية التحتية الذكاء الاصطناعي النفقات الرأسمالية لمركز البيانات من تجاوز 500 مليار دولار بحلول عام 2027. في الوقت نفسه ، وفقا لتوقعات IDC ، من المتوقع أن ينمو الاستثمار في الأجهزة في الذكاء الاصطناعي بالمعنى الواسع بمعدل نمو سنوي مركب قدره 20.5٪ خلال السنوات الخمس المقبلة.

من المتوقع أن يتضاعف سوق أشباه الموصلات المتصلة لمراكز البيانات من حوالي 12.5 مليار دولار في عام 2022 إلى ما يقرب من 25 مليار دولار بحلول عام 2027.

غافن بيكر ، الذي ينضم إلى مجلس إدارة Enfabrica ، هو رئيس قسم المعلومات والشريك الإداري لشركة Atreides Management ، حيث استثمر وعمل في مجالس إدارة شركات مثل Nutanix و Jet.com و AppNexus و Dataminr و Cloudflare و SpaceX.

عندما يتعلق الأمر بالبنية التحتية للحوسبة في الذكاء الاصطناعي ، يتحدث عن العديد من مجالات التحسين المهمة: "إن الجمع بين التخزين الأسرع ، والشبكات الخلفية الأفضل (خاصة Enfabrica) ، والبصريات الخطية القابلة للتوصيل / المعبأة الآن وتكامل وحدة المعالجة المركزية / وحدة معالجة الرسومات المحسنة (GraceHopper من NVIDIA ، و MI300 من AMD ، و Tesla's Dojo) قد كسر جدار الذاكرة ، مما سيزيد من تحسين عائد الاستثمار للتدريب - مما يقلل بشكل مباشر من تكلفة التدريب ويزيد هامش الربح بشكل غير مباشر ويقلل من تكلفة الاستدلال بالطرق التالية.

باختصار ، ستفوز البنى التي تتمتع بميزة في "الحوسبة المفيدة لكل وحدة طاقة" ، ونحن نتحرك بسرعة نحو حوسبة أكثر فائدة لكل وحدة طاقة. "

**مساعدة مجموعات حوسبة وحدة معالجة الرسومات NVIDIA على كسر "جدار الذاكرة" **

في مجال الحوسبة المعجلة الذكاء الاصطناعي ، يمثل "حاجز الذاكرة" مشكلة حقيقية ، في إشارة إلى الفجوة الآخذة في الاتساع بين أداء المعالجة وعرض النطاق الترددي للذاكرة المطلوب لتقديم هذا الأداء.

بالمقارنة مع حوسبة وحدة المعالجة المركزية التقليدية ، فإن حوسبة GPU ، التي يشيع استخدامها في الذكاء الاصطناعي ، أكثر خطورة في هذا الصدد ، لأن وحدات معالجة الرسومات لديها المزيد من النوى ، وإنتاجية معالجة أعلى ، وطلب كبير على البيانات.

يجب أولا تنظيم البيانات المستخدمة من قبل الذكاء الاصطناعي وتخزينها في الذاكرة قبل أن تتم معالجتها بواسطة وحدة معالجة الرسومات. يعد توفير الذاكرة وعرض النطاق الترددي والسعة اللازمة الذكاء الاصطناعي مشكلة ملحة.

لمعالجة هذه المشكلة ، يمكن بالفعل الاستفادة من العديد من التقنيات الرئيسية: أداء / طبقات سعة الذاكرة ومعماريات التخزين المؤقت التي تم استخدامها سابقا في وحدات المعالجة المركزية والحوسبة العنقودية الموزعة ، وتقنية شبكات الوصول المباشر إلى الذاكرة عن بعد (RDMA) التي تتيح أنظمة الذكاء الاصطناعي الموسعة ، ومعيار واجهة Compute Express Link (CXL) المعترف به والمعتمد على نطاق واسع في الصناعة.

يشتمل حل Enfabrica على تقنيات رئيسية مثل فصل CXL.mem ، وطبقات الأداء / السعة ، وشبكات RDMA لتحقيق تسلسل هرمي للذاكرة قابل للتطوير وعالي النطاق وعالي السعة ومحدود بالكمون لخدمة أي مجموعة حوسبة الذكاء الاصطناعي واسعة النطاق.

تتيح الشريحة الأولى ، التي تسمى محول ACF (Accelerated Compute Fabric) ، توصيل تجمعات طاقة حوسبة GPU مباشرة بعشرات التيرابايت من تجمعات CXL.mem DRAM المحلية بزمن انتقال منخفض للغاية.

وعلى وجه التحديد، تعمل ACF على دفع طبقات الذاكرة لتمكين الوصول إلى النطاق الترددي العالي إلى بيتابايت من ذاكرة DRAM الموزعة عبر مجموعات الحوسبة وبقية مركز البيانات من خلال منافذ شبكة إيثرنت بسرعة 800 جيجابت. بعد ذلك ، يتم إنشاء مخزن بيانات هرمي مع ذاكرة قريبة وذاكرة قريبة وبعيدة وذاكرة بعيدة للشبكة للحوسبة المتسارعة ، وهناك حدود صارمة لزمن الوصول عند كل مستوى ذاكرة. بمساعدة ACF ، يمكن لوحدات معالجة الرسومات NVIDIA التي تقوم بمعالجة البيانات سحب البيانات من أماكن مختلفة متعددة دون مواجهة حواجز السرعة.

يتكون حل Enfabrica ، المسمى ACF-S ، من شرائح ACF متعددة مع عقد شبكة بنية تحتية الذكاء الاصطناعي بسرعة 8 تيرابت في الثانية مع واجهات 800G Ethernet و PCIe Gen 5 و CXL 2.0+ ، والتي يمكن أن تقلل من استهلاك طاقة الإدخال / الإخراج بنسبة تصل إلى 50٪ (توفير 2 كيلووات لكل رف) مقارنة بأنظمة NVIDIA DGX-H100 وأنظمة Meta Grand Teton مع ثمانية وحدات معالجة رسومات NVIDIA H100.

"ACF-S هو حل متقارب يلغي الحاجة إلى إدخال/إخراج الخادم التقليدي والمتباين وشرائح الشبكة مثل محولات الشبكة على مستوى الحامل ووحدات التحكم في واجهة شبكة الخادم ومحولات PCIe. وأوضح روشان سانكار.

تمكن أجهزة ACF-S الشركات التي تتعامل مع مهام الاستدلال الذكاء الاصطناعي من استخدام أقل عدد ممكن من وحدات معالجة الرسومات ووحدات المعالجة المركزية ومسرعات الذكاء الاصطناعي الأخرى. وذلك لأن ACF-S قادر على الاستفادة بشكل أكثر كفاءة من الأجهزة الموجودة عن طريق نقل كميات كبيرة من البيانات بسرعة.

علاوة على ذلك ، يمكن استخدام حلول Enfabrica ليس فقط للاستدلال الذكاء الاصطناعي على نطاق واسع ، ولكن أيضا للتدريب الذكاء الاصطناعي ، وكذلك حالات الاستخدام غير الذكاء الاصطناعي مثل قواعد البيانات والحوسبة الشبكية.

تخطط Enfabrica لبيع الرقائق والحلول لبناة النظام (بائعي السحابة ومشغلي مراكز البيانات) بدلا من بناء النظام نفسه. كشف سانكار أن Enfabrica لديها توافق عميق مع نظام NVIDIA البيئي ، لكنهم يخططون أيضا للعمل مع شركات حوسبة الذكاء الاصطناعي مختلفة.

وقال: "إن ACF-S محايدة بشأن نوع وعلامة المعالجات الذكاء الاصطناعي المستخدمة في الحوسبة الذكاء الاصطناعي ، بالإضافة إلى النموذج الدقيق المنشور ، والذي يسمح ببناء بنية تحتية الذكاء الاصطناعي عبر حالات استخدام مختلفة متعددة ويدعم بائعي المعالجات المتعددين دون قفل التكنولوجيا الخاصة". "

** استهلاك أسرع وأقل للطاقة ، جيل جديد من نظام طاقة الحوسبة الذكاء الاصطناعي يتشكل **

بعد عام واحد فقط من شحن H100 ، أطلقت NVIDIA H200 ، مما يدل على إلحاحها للحفاظ على مكانتها الرائدة في مجال قوة الحوسبة الذكاء الاصطناعي. بسبب انفجار الذكاء الاصطناعي التوليدية في العام الماضي ، أطلق منافسوها أيضا منتجات حوسبة الذكاء الاصطناعي قوية ، سواء كانت رقائق سلسلة MI300 من AMD أو رقائق Maia من Microsoft التي تقارن ب H100.

الذكاء الاصطناعي كانت قوة الحوسبة صناعة كثيفة التكنولوجيا ومركزة على رأس المال ، في مواجهة "المعركة الخيالية" للعمالقة ، كيف يمكن للشركات الناشئة الذكاء الاصطناعي الحوسبة البقاء على قيد الحياة؟

يركز نهج d-Matrix على الاستدلال الذكاء الاصطناعي ، ورقائق الاستدلال الذكاء الاصطناعي التي تم إطلاقها أسرع وأكثر كفاءة في استخدام الطاقة من المنتجات المماثلة من NVIDIA. كجزء مهم من نظام الحوسبة الذكاء الاصطناعي ، يساعد Enfabrica وحدات معالجة الرسومات من NVIDIA (ورقائق الحوسبة الذكاء الاصطناعي الأخرى) على كسر "جدار الذاكرة" وتقليل قوة الحوسبة الخاملة وتحسين معدل استخدام نظام الحوسبة ككل.

الذكاء الاصطناعي أنظمة الحوسبة ، مثل جميع أنظمة الحوسبة ، لها عاملان مهمان ، السرعة واستهلاك الطاقة. على الرغم من أن الحوسبة الذكاء الاصطناعي واسعة النطاق (سواء التدريب أو الاستدلال) يتم تشغيلها بواسطة مجموعات طاقة الحوسبة ، إلا أن سرعة الحوسبة الأسرع وانخفاض استهلاك الطاقة لا يزالان اتجاه الصناعة ككل.

تتمتع وحدات معالجة الرسومات من NVIDIA بميزة واضحة في اتجاه سرعات الحوسبة الأسرع ، بينما تضغط شركات مثل Enfabrica من أجل استهلاك أقل للطاقة.

وكما يقول روشان سانكار، مؤسس شركة إنفابريسكا: "لكي تكون الحوسبة الذكاء الاصطناعي في كل مكان حقا، يجب أن ينخفض منحنى التكلفة". المفتاح هو ما إذا كانت قوة الحوسبة لوحدة معالجة الرسومات أفضل وأكثر كفاءة. "

من الواضح أن استثمار NVIDIA في Enfabrica يعتمد أيضا على هذا المنطق ، وبما أن تقنية Enfabrica تعمل على تحسين استخدام طاقة وحدة معالجة الرسومات من NVIDIA ، فمن المتوقع أن يتم تعزيز مكانتها الرائدة في الصناعة.

ومع ذلك ، في مواجهة هذه الحاجة الواضحة والملحة ، فإن Enfabrica ليست الوحيدة في الصناعة ، فقد أطلقت شركة Cisco العملاقة أيضا سلسلة Silicon One G200 و G202 من أجهزة الشبكة الذكاء الاصطناعي ، وتعمل Broadcom أيضا في هذا المجال. يريد Enfabrica أن ينمو أكثر ولا يزال يواجه المنافسة.

إذا كانت صناعة الذكاء الاصطناعي في الخارج تواجه نقصا مؤقتا في قوة الحوسبة ، فيجب أن تواجه صناعة الذكاء الاصطناعي في الصين نقصا طويل الأجل في قوة الحوسبة الذكاء الاصطناعي ، ومع تقييد وحدة معالجة الرسومات الخاصة ب NIVDIA بشكل أكبر ، فإن الصناعة لديها طلب قوي على منتجات الحوسبة الذكاء الاصطناعي المحلية. في الوقت الحاضر ، تطورت Huawei و Alibaba و Baidu و Moore Threads و Cambrian وغيرها من الشركات في مجال قوة الحوسبة الذكاء الاصطناعي ، وآمل أن يتمكنوا ، بالإضافة إلى المزيد من الشركات ، من المساعدة في بناء نظام طاقة الحوسبة الذكاء الاصطناعي الخاص بالصين.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت