ما هي التحسينات والاختراقات التي ستحدث عندما يقاتل النموذج الكبير إلى 2.0

النص الأصلي: The Paper ، المؤلف: Che Xingyun

مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI‌

في يونيو من هذا العام ، قامت كبرى الشركات المصنعة بترقية منتجاتها الشبيهة بـ ChatGPT. في 9 يونيو ، أطلقت Xunfei نسخة مطورة من Xinghuo Cognitive Big Model ؛ في 13 يونيو ، بعد إطلاق منتج شبيه بـ ChatGPT ، عقد 360 مؤتمر تطبيق نموذج الدماغ الكبير 360 Smart Brain مرة أخرى.

بخلاف النماذج الكبيرة التي تم إصدارها في شهر فبراير تقريبًا ، فإن المنتجات التي تمت ترقيتها التي أصدرتها العديد من الشركات مؤخرًا أكثر انحيازًا نحو طبقة التطبيق ، والغرض من ذلك هو تسهيل الأمر على آلاف الأسر.

انطلاقا من الإصدار الحالي ، يمتلك 360 إنتل برين في البداية قدرات توليد متعددة الوسائط. بالإضافة إلى إنشاء نص وجداول وصور من النص ؛ إنشاء نصوص وصور من الصور ، وإنشاء نص من مقاطع الفيديو ، وقطع مقاطع الفيديو من النصوص و إبداعات أساسية أخرى بالإضافة إلى ذلك ، فإنه يعيد تعريف "الإنسان الرقمي" لمنح المستخدمين "ذكاء اصطناعيًا" قابلًا للتخصيص وحصريًا "يتمتع بروح وتصميم بشري وذاكرة".

في الوقت الحالي ، سيناريو التطبيق الأقرب بين 360 Smart Brain والمستخدمين هو دلو عائلة 360 الحالي.وقال Zhou Hongyi في المؤتمر الصحفي إن "360 Smart Brain 4.0" سيتم توصيله بـ 360 Security Guard و 360 Browser و 360 Search و إلخ. التعاون بين الإنسان والآلة.

في المؤتمر الصحفي ، غيّر Zhou Hongyi وجهة نظره السابقة ، "لقد قلت ذات مرة أن الفجوة بين النموذج المحلي واسع النطاق و ChatGPT تبلغ عامين ، والآن أريد استعادة هذه الجملة." المستوى على قدم المساواة مع GPT3.5 ، وإذا تطور بهذه السرعة ، فسوف يلحق بـ GPT4 أو حتى يتجاوزه في غمضة عين.

في غضون أربعة أشهر من إصدار الإصدار الأولي إلى الإصدار الرسمي لـ 360 Smart Brain ، هل رأى Zhou Hongyi مثل هذا التغيير الهائل؟

** عملاق العلم والتكنولوجيا يصيد نموذج كبير **

يُظهر "تقرير بحث خرائط النموذج واسع النطاق للذكاء الاصطناعي الصيني" الصادر في منتدى Zhongguancun 2023 أنه في الوقت الحالي ، تُظهر نماذج الذكاء الاصطناعي واسعة النطاق في الصين اتجاهًا نحو التطور القوي. وفقًا للإحصاءات غير المكتملة ، حتى الآن ، تم إصدار 79 نموذجًا واسع النطاق بمعلمات تزيد عن مليار شخص في جميع أنحاء البلاد.

ومع ذلك ، فإن معلمات النماذج واسعة النطاق لشركات التكنولوجيا الكبرى كبيرة نسبيًا: معلمات نموذج Alibaba Tongyi Qianwen الكبير أعلى من 10 تريليون ، ومعايير نموذج Tencent Hunyuan الكبير ونموذج Huawei الكبير Pangu كلها أعلى من تريليون. ، ونموذج Baidu Wenxin الكبير يحتوي على معلمات تزيد عن تريليون. حجم المعلمات للنموذج واسع النطاق أكثر من 200 مليار ، وحجم المعلمات لنموذج JD Yanxi الكبير هو 100 مليار ؛ حجم المعلمات لشركات التكنولوجيا في الصناعات الرأسية بشكل عام أكثر من 100 مليار ؛ وحجم المعلمات للنموذج الكبير لمؤسسات البحث العلمي عند مستوى المائة مليار وما دونه.

من منظور نظام التخطيط للنموذج الكبير ، نفذت شركات التكنولوجيا الكبرى تخطيطًا شاملاً أربعة في واحد في طبقة طاقة الحوسبة وطبقة النظام الأساسي وطبقة النموذج وطبقة التطبيق. تمتلك كل من Baidu و Ali و Huawei تخطيطًا شاملاً للبحث والتطوير المستقل من الرقائق إلى التطبيقات ، مثل "Kunlun core + منصة مجداف الطيران + نموذج Wenxin الكبير + تطبيق الصناعة" ، و "Hanguang 800 chip + M6-OFA base" من شركة Baidu + نموذج Tongyi الكبير + تطبيق الصناعة "،" رقاقة Shengteng + إطار MindSpore + نموذج Pangu الكبير + تطبيق الصناعة "من Huawei.

بالإضافة إلى ذلك ، أصدر Kingsoft Office أيضًا WPS AI في 31 مايو. في الوقت الحالي ، تم ربط WPSAI بمكونات مكتب Kingsoft مثل المستندات الخفيفة والنص والجداول والعروض التقديمية وملفات PDF. في المستقبل ، سوف يرسخ AIGC وفهم القراءة ، السؤال والجواب ، والتفاعل بين الإنسان والحاسوب.التطوير في اتجاه استراتيجي ، والوصول إلى مجموعة كاملة من منتجات Kingsoft Office.

يرجع التدفق السريع للعديد من الشركات المصنعة الكبرى إلى هذا المسار بشكل أساسي إلى المتابعة السريعة وإدخال التدابير من قبل السلطات التنظيمية لتنظيم تطور الصناعة. مع مرافقة هيكل المستوى الأعلى ، يمكن لكل مصنع رئيسي بشكل طبيعي الاستثمار في البحث والتطوير وإطلاق المنتجات بثقة.

منذ إطلاق النموذج واسع النطاق على دفعات في مارس من هذا العام ، أصبحت السياسات التنظيمية للذكاء الاصطناعي واضحة تدريجياً ، والتي أشارت أيضًا إلى اتجاه تطبيقات الصناعة.

بالنظر إلى تطور الصناعة بأكملها ، في 11 أبريل ، تم إصدار "طريقة إدارة خدمة الذكاء الاصطناعي التوليدي" للتعليق ؛ في 30 مايو ، يعد معهد تكنولوجيا المعلومات والاتصالات بشكل مشترك نموذج الذكاء الاصطناعي المفتوح "Kite" الترخيص ، وستكون الخطوة التالية هي إصدار "رخصة نموذج Zhikite المفتوح للذكاء الاصطناعي (مسودة للتعليقات).

في وقت لاحق ، أصدرت مدن الدرجة الأولى بالاشتراك "خطة التنفيذ لبكين لتسريع بناء مصدر ابتكار ذكاء اصطناعي مؤثر عالميًا (2023-2025)" ؛ السنة) ".

في هذا السياق ، يعتقد Zhou Hongyi أن النموذج المحلي الكبير سيضيق الفجوة بسرعة مع ChatGPT ، والذي يبدو أنه سهل الفهم.

** ما الفرق بين 360 Smart Brain **

وفقًا لخطة Zhou Hongyi ، سيعتمد النموذج الكبير 360 على التحديث المستمر للنموذج الكبير ، مع مراعاة المشهد ، والإنتاجية ، والتسطيح والعمودية.

في إطار استراتيجية التطوير هذه ، يمكن لـ 360 Intel الفكري تحقيق المستهلك (مساعد AI الشخصي للمستخدم) ، والمؤسسات الصغيرة والمتوسطة (التطبيق الرأسي SaaS) ، والمؤسسة / الحكومة / المدينة (نموذج النشر المخصخص) ، والصناعة (النموذج الرأسي للصناعة) وأربعة أخرى سيناريوهات التطبيق الرئيسية.

من أجل تلبية احتياجات السيناريوهات المختلفة المذكورة أعلاه بشكل أفضل ، يحتاج النموذج العام واسع النطاق إلى إكمال التحول من إدخال النص إلى إخراج النص ، إلى فهم الصور ومقاطع الفيديو ، والقدرة على إنتاج الصور ومقاطع الفيديو على القائمة الأساس ، وهو ما يعادل صنع نموذج واسع النطاق بـ "آذان" و "عيون" ، فإنه يضع الأساس لخلق "إنسان رقمي".

يحتاج البشر الرقميون التقليديون فقط إلى الإخراج وفقًا للنص المعمول به ، ولكن في عصر النماذج الكبيرة ، يمكن تخصيص 360 شخصًا رقميًا ، بحيث يتم تصميم الأشخاص ، ولديهم ذكريات ، وخبرة. حاليًا ، هناك أكثر من 200 حرف في 360 منصة رقمية بشرية مربعة ، مقسمة إلى فئتين: المشاهير الرقميين والموظفين الرقميين. يأمل 360 أن يحصل كل فرد في المستقبل على مساعد الذكاء الاصطناعي الخاص به وأن تتاح له الفرصة للتواصل مع القدامى في الفضاء الافتراضي ، عبر الزمان والمكان.

في الاجتماع التوضيحي ، سأل Zhou Hongyi "Zhuge Liang" كيف يعتقد أنه أصبح مادة للأشباح والحيوانات اليوم ، وأجاب الرجل الرقمي بنبرة Zhuge Liang: مصير الماضي والحاضر أمر لا مفر منه. في وضع اليوم ، العالم في حالة اضطراب. على الرغم من أنني كبير في السن ، إلا أنني ما زلت أهدف إلى العالم. يستخدمني شباب اليوم كمواد للأشباح والحيوانات ، وأنا أتقبل هذا التغيير بسهولة. وأتمنى للأصدقاء الشباب المضي قدمًا بشجاعة في الطريق إلى الأمام وخلق مستقبل أفضل.

في الوقت نفسه ، أكد Zhou Hongyi أيضًا أن شكل البشر الرقميين في المستقبل سيكون له أيضًا أهدافه الخاصة وقدرات التخطيط والتحليل ، بحيث يمكن استدعاء نماذج رأسية مختلفة لإكمال المهام.

ومع ذلك ، فإن هذه الوظائف هي في الواقع تحسينات تستند إلى تطبيقات النماذج واسعة النطاق الحالية ، ولم تفتح مجالًا جديدًا. ولكن في الواقع ، عندما يكون النموذج الكبير قد حقق طفرة ، فإن سيناريو التطبيق الأكثر إبداعًا هو القيادة بدون طيار.

** تتمتع القيادة بدون سائق بفرصة دخول المسار السريع **

إذا نظرنا إلى الوراء في مجال القيادة بدون طيار ، فمنذ عام 2016 ، كانت الشركات المصنعة الكبرى تنتشر في هذا المجال ، ولكن حتى هذا العام ، لا يمكن لأي منهم تحقيق القيادة الحقيقية بدون طيار.

في الوقت الحالي ، يحتاج نظام القيادة بدون طيار من مستوى L2 + إلى أكثر من 10 كاميرات ؛ أو 1-2 ليدار ؛ أو 3-5 رادارات بموجة مليمترية لتوفير بيانات متعددة الأبعاد ، والتي يمكن استخدامها لتدريب النموذج بعد وضع العلامات اليدوية. بعد ظهور النماذج الكبيرة التي يمكنها التعرف على الصور ، ستنخفض بشكل حاد تكلفة الوقت ونفقات المواد المطلوبة لوضع العلامات اليدوية.

وفقًا للمؤتمر الصحفي Momo Zhixing DriveGPT في أبريل 2023 ، للحصول على معلومات مثل خطوط الممرات والمشاركين في حركة المرور وإشارات المرور وما إلى ذلك ، تبلغ تكلفة وضع العلامات اليدوية في الصناعة حوالي 5 يوانات لكل صورة ، وتكلفة Momo DriveGPT 0.5 يوان. نعتقد أنه بعد نضوج التدريب على النماذج على نطاق واسع لشركات التكنولوجيا ، فإن التكلفة الحدية لوضع العلامات التلقائي لصورة واحدة ستقترب من الصفر ، ومن المتوقع أن ينخفض متوسط التكلفة بشكل أكبر.

وفقًا لـ Zhang Peng ، نائب رئيس Kaiwang Data Products Project ، في فبراير 2023 ، في الوقت الحالي ، يعد وضع العلامات اليدوية الطريقة الرئيسية لتصنيف البيانات ، مع استكمالها بعلامات الآلة ، ولا يزال 95٪ من توسيم البيانات يدويًا بشكل أساسي. يمكن أن يؤدي تدخل النماذج الكبيرة إلى تحسين كفاءة هذه الصناعة بشكل كبير. بأخذ تسلا كمثال ، سيضم فريق وضع العلامات اليدوي أكثر من 1000 شخص في عام 2021 ، وسيقوم الفريق بتسريح أكثر من 200 شخص في عام 2022.

بالإضافة إلى ذلك ، في عصر النماذج الكبيرة ، من المتوقع أن يساعد عمالقة التكنولوجيا من الأطراف الثالثة مصنعي المعدات الأصلية على بناء خوارزميات القيادة المستقلة وأنظمة الحلقة المغلقة للبيانات من خلال توفير سلسلة أدوات كاملة ، مع الاعتماد على قدرات توليد البيانات للنماذج الكبيرة تضييق الفجوة في مجال البيانات ، من المتوقع أن يأتي عصر Android للقيادة الذاتية.

في الوقت الحاضر ، تم استخدام نماذج كبيرة لتمكين البيانات المغلقة ، والمحاكاة ، وخوارزميات الإدراك ، وخوارزميات التنظيم والتحكم وغيرها من المجالات. وتتنافس الشركات العملاقة مثل Microsoft و Nvidia على التخطيط في الطرازات الكبيرة والقيادة الذاتية ، أو ستطلق شرارات جديدة.

بالإضافة إلى ذلك ، فإن ظهور النماذج الكبيرة يعزز أيضًا تقسيم العمل في الصناعة ، ويتجنب "إعادة اختراع العجلة" ، ويسرع من تكرار أجهزة الاستشعار والرقائق ، ومن المتوقع أن تنخفض تكلفة النظام بشكل كبير. من المتوقع أن يستفيد مطورو النماذج على نطاق واسع واللاعبون في سلسلة صناعة القيادة الذاتية بطريقة شاملة.

بأخذ Baidu Apollo كمثال ، فإنه يستخدم أولاً المعلومات الرسومية لتدريب نموذج أصلي مسبقًا ، ويستخدم خوارزميات لتحديد بيانات صورة التجوّل الافتراضي وتحديد موقعها وتقسيمها ، ويضعها في المشفر لتشكيل مكتبة أساسية ، أي ، ينشئ المراسلات بين الصور والمعلومات النصية بناءً على تجمع بيانات التجوّل الافتراضي.

ثانيًا ، يمكنك البحث عن مشاهد محددة (مثل المركبات السريعة ، والكراسي المتحركة ، والأطفال ، وما إلى ذلك) من خلال النصوص والصور ، وإجراء تدريب مخصص على طراز جانب السيارة ، مما يحسن بشكل كبير من استخدام بيانات المخزون.

تستخدم بايدو طريقة شبه خاضعة للإشراف للاستفادة الكاملة من البيانات ثنائية وثلاثية الأبعاد لتدريب نموذج إدراك كبير. من خلال تقطير النموذج الصغير في خطوات متعددة ، يتم تحسين أداء النموذج الصغير ، وفي الوقت نفسه ، يتم تخصيص النموذج الصغير للتدريب من خلال وضع العلامات التلقائي ، والذي يستخدم لتعزيز قدرة الإدراك البصري ثلاثي الأبعاد لمسافات طويلة وتحسين تأثير الإدراك لنموذج الإدراك متعدد الوسائط.

كما صرح لاعب رائد آخر ، SenseTime ، علنًا أنه يمكن استخدام AIGC لإنشاء مشاهد حركة مرور حقيقية وعينات صعبة لتدريب نظام القيادة التلقائي ، ويمكن استخدام البيانات متعددة الوسائط كمدخلات للنموذج الكبير لتحسين الحد الأعلى لـ تصور النظام لمشاهد الزاوية.

في الوقت نفسه ، يمكن للنموذج الكبير متعدد الوسائط للقيادة الذاتية أن يحقق التكامل المتكامل للإدراك واتخاذ القرار ، ويمكن إعادة بناء البيئة ثلاثية الأبعاد من خلال وحدة فك ترميز البيئة في نهاية الإخراج لتحقيق الفهم البصري للبيئة ؛ يمكن لوحدة فك ترميز السلوك إنشاء تخطيط كامل للمسار ؛ يمكن استخدام مفكك تشفير التحفيز.تصف اللغة الطبيعية عملية التفكير ، مما يجعل نظام القيادة المستقلة أكثر أمانًا وموثوقية.

بعد أن يدرك النموذج الكبير الوظائف المذكورة أعلاه ، ستصبح عتبة القيادة بدون طيار أقل وأقل في المستقبل. بينما تسرع الشركات المصنعة الرائدة تقدم مشاريع القيادة غير المأهولة ، يمكنها أيضًا السماح لمزيد من اللاعبين الجدد بالانضمام إلى هذا المجال وتطوير الطرق التي تتطلب الطرق بالإضافة إلى الملاحة على الطرق مسار وظيفة التخطيط ، مثل زيادة تحسين تخطيط المسار للروبوت الكاسح.

بالنظر إليها الآن ، بعد فترة الإصدار المركزي للنماذج واسعة النطاق من فبراير إلى مارس ، وفترة تطوير المنتج من أبريل إلى مايو وتم توضيح اتجاه السياسة تدريجيًا ، دخل يونيو فترة الإصدار المركزي للذكاء الاصطناعي الكبير- منتجات وتطبيقات النماذج ذات الحجم الصغير: يؤدي هذا أيضًا بشكل مباشر إلى خفض سعر OpenAI API.

في المستقبل المنظور ، ستستمر تكنولوجيا الذكاء الاصطناعي في التكرار ، وستستمر التطبيقات في التقدم. وفي الوقت نفسه ، ستطلق المزيد والمزيد من شركات التكنولوجيا الكبرى منتجات لتقتطع في هذا المسار ، والذي سيستمر في تعزيز ازدهار الصناعة وجلب المزيد الفوائد للمستخدمين. المنتجات الشبيهة بـ GPT التي تلبي طلب السوق ، مثل Tencent ، التي لديها قاعدة مستخدمين ضخمة ، أصدرت أيضًا حلاً تقنيًا في مجال الطرز الكبيرة في 19 يونيو.

عندما تلتقي هذه الشركات معًا ، فإن تطوير الصناعة سيدخل المسار السريع ، وهذا يعني أيضًا أن المستخدمين النهائيين C سيتمكنون قريبًا من استخدام هذا المنتج. أما بالنسبة لمن سيدفع مقابل ذلك ، يحتاج كل مصنع إلى الاعتماد عليه القدرة الخاصة.

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت
تداول العملات الرقمية في أي مكان وفي أي وقت
qrCode
امسح لتنزيل تطبيق Gate.io
المنتدى
بالعربية
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)