نشر باحثون من كلية تاندون للهندسة بجامعة نيويورك ورقة بحثية بعنوان "Chip-Chat: التحديات والفرص في تصميم أجهزة المحادثة" ، أجابوا بالتجارب: نعم ، ChatGPT أقوى بالفعل!
مجرد الدردشة مع ChatGPT بلغة طبيعية بسيطة الإنجليزية ، تم صنع شريحة معالج دقيق. الأمر الجدير بالملاحظة هو أنه بمساعدة ChatGPT ، لم يتم تصميم مكون الرقاقة هذا فحسب ، بل يمكن تصنيعه أيضًا بعد الاختبار الأساسي.
وعلقت جامعة نيويورك: "هذا إنجاز غير مسبوق يمكنه تسريع تطوير الرقائق والسماح للأفراد الذين ليس لديهم مهارات تقنية متخصصة بتصميم الرقائق".
إذن ، هل حقًا يأتي حقبة "صنع الجوهر" من قبل كل الناس؟ هنا ، قد نلقي نظرة أيضًا على كيفية قيام الباحثين بذلك.
** تطبيق نماذج الذكاء الاصطناعي الكبيرة ، مجال العتاد يتخلف عن البرمجيات **
في الورقة ، أشار الباحثون إلى أن تصميم الأجهزة الحديثة يبدأ بالمواصفات التي توفرها اللغة الطبيعية ، مثل متطلبات المستند باللغة الإنجليزية ، ومن ثم يستخدم مهندسو الأجهزة لغات وصف الأجهزة (HDL) مثل Verilog لإنشاء المتطلبات مع التعليمات البرمجية لـ أكمل التصميم الداخلي للرقاقة ، وأخيراً تم تصنيعه في مكونات الدائرة.
حسنًا ، عندما يقترب عصر AIGC ، مثل ادعاء OpenAI's ChatGPT و Google Bard بقدرتهما على إنشاء رمز ، وقد استخدمهما العديد من المطورين لإنشاء موقع ويب واحدًا تلو الآخر ، ولكن نطاق التطبيق الحالي يركز بشكل أساسي على مجال البرمجيات . ، ما إذا كانت أدوات AIGC هذه يمكن أن تحل محل عمل "الترجمة" (تحويل متطلبات المستند إلى رمز) لمهندسي الأجهزة.
بناءً على ذلك ، استخدم الباحثون ثمانية معايير تمثيلية للتحقيق في إمكانيات وقيود LLM الحديثة عند إنشاء كتابة لغة وصف الأجهزة نفسها.
## ** مبادئ وقواعد الاختبار **
في التجربة ، استخدم الباحثون ChatGPT كأداة للتعرف على الأنماط (تعمل كإنسان) ، والتي يمكن تحويلها بحرية إلى أنواع مختلفة من اللغات (الشفوية والمكتوبة). وفي الوقت نفسه ، يسمح ChatGPT لمهندسي الأجهزة بتخطي مرحلة HDL.
تظهر عملية التحقق الشاملة في الشكل أدناه:
بالتفصيل ، أولاً ، يقدم مهندس الأجهزة تلميحات أولية للنموذج الكبير ، والسماح له بإنشاء نموذج Verilog ، ثم تقديم معلومات محددة حول الإدخال والإخراج. أخيرًا ، يقوم مهندس الأجهزة بإجراء تقييم مرئي لتصميم الإخراج لتحديد ما إذا كان يفي بمواصفات التصميم الأساسية.
إذا كان التصميم لا يفي بالمواصفات ، فسيتم إنشاؤه خمس مرات أخرى بنفس الموجه. إذا كان لا يزال لا يفي بالمواصفات ، فإنه يفشل.
بمجرد كتابة التصميمات وحالات الاختبار ، يتم تجميعها باستخدام Icarus Verilog (iverilog ، إحدى أدوات التنفيذ للغة وصف أجهزة Verilog). إذا كان التجميع ناجحًا ، يتم إجراء المحاكاة. إذا لم يتم الإبلاغ عن أي أخطاء ، فسينجح التصميم ، ولا توجد ملاحظات مطلوبة (NFN).
إذا تم الإبلاغ عن أخطاء بواسطة أي من هذه العمليات ، يتم إعادة إدخالها في النموذج ويُطلب منها "الرجاء تقديم الإصلاح" ، وهذا ما يُعرف باسم ملاحظات الأداة (TF). في حالة حدوث نفس الخطأ أو نوع الخطأ نفسه ثلاث مرات ، يتم تقديم التعليقات البشرية البسيطة (SHF) من قبل المستخدم ، عادةً عن طريق تحديد نوع المشكلة في Verilog التي تسببت في الخطأ (على سبيل المثال: خطأ نحوي في بيان).
يتم إعطاء ملاحظات بشرية معتدلة (MHF) في حالة استمرار الخطأ ، ويتم توفير معلومات مباشرة أكثر قليلاً للأداة لتحديد الخطأ المحدد.
في حالة استمرار الخطأ ، يتم تقديم تعليقات بشرية متقدمة (AHF) ، والتي تعتمد على التحديد الدقيق لمكان الخطأ وكيفية إصلاحه.
بمجرد تجميع التصميم ومحاكاته ، مع عدم وجود حالات اختبار فاشلة ، يعتبر ناجحًا.
ولكن إذا لم تُصلح التعليقات عالية المستوى الخطأ ، أو إذا احتاج المستخدم إلى كتابة أي كود Verilog لحل الخطأ ، فسيتم اعتبار الاختبار قد فشل. يعتبر الاختبار أيضًا فاشلاً إذا تجاوزت الجلسة 25 رسالة ، بما يلبي حد معدل OpenAI لرسائل ChatGPT-4 لكل 3 ساعات.
** Bard and HuggingChat تعطلت في الجولة الأولى من الاختبار **
يطلبون من النموذج الكبير محاولة إنشاء نموذج Verilog لـ "اسم اختبار" ، ثم تقديم المواصفات وتحديد منافذ الإدخال والإخراج وأي تفاصيل أخرى مطلوبة ، ثم طرح النموذج الكبير "كيف سأكتب تصميمًا لـ تلبية هذه المواصفات؟ "
في الوقت نفسه ، سمح الباحثون أيضًا للنموذج الكبير مباشرة بإنشاء تصميم مقعد الاختبار:
هل يمكنك كتابة طاولة اختبار Verilog لهذا التصميم؟ يجب أن يتمتع منضدة الاختبار بقدرات اختبار ذاتي ويمكن استخدامها مع iverilog للمحاكاة والتحقق. في حالة فشل حالة الاختبار ، يجب أن تكون منصة الاختبار قادرة على توفير معلومات كافية حتى يمكن العثور على الخطأ وحلّه.
علاوة على ذلك ، حصل الباحثون على محتوى المخرجات بناءً على أربعة نماذج كبيرة من ChatGPT-4 و ChatGPT-3.5 و Bard و HuggingChat:
أظهرت النتائج النهائية أن كلا الطرازين ChatGPT كانا قادرين على تلبية المواصفات وبدأت عملية التصميم. ومع ذلك ، فشل Bard و HuggingChat في تلبية المعايير الأولية للمواصفات.
على الرغم من اتباع عملية الاختبار المذكورة أعلاه ، طلب الباحثون من النموذج الكبير إعادة توليد الإجابات خمس مرات أخرى بناءً على المطالبات الأولية من Bard و HuggingChat ، بعد عدة جولات ، فشل كلا النموذجين. من بينها ، لا يستطيع Bard تلبية مواصفات التصميم المحددة طوال الوقت ، ويبدأ ناتج Verilog لـ HuggingChat في أن يكون غير صحيح بعد تعريف الوحدة.
نظرًا للأداء الضعيف لـ Bard و HuggingChat في موجهات خط الأساس الأولية للتحدي ، قرر الباحثون المتابعة باختبار كامل فقط على ChatGPT-4 و ChatGPT-3.5.
** مسابقة ChatGPT-4 و ChatGPT-3.5 **
يوضح الشكل أدناه النتائج المعيارية لـ ChatGPT-4 و ChatGPT-3.5 ، ومن الواضح أن أداء ChatGPT-3.5 أسوأ قليلاً من أداء ChatGPT-4 ، فكل المحادثات غير متوافقة.
في المقابل ، كان أداء ChatGPT-4 أفضل ، حيث اجتاز معظم المعايير ، والتي تطلب معظمها فقط تعليقات الأداة. ومع ذلك ، في تصميم مقاعد البدلاء ، لا تزال ردود الفعل البشرية مطلوبة.
## ** يتم إقران ChatGPT-4 مع مهندسي الأجهزة لتطوير شرائح معًا **
لاستكشاف إمكانات LLM ، قام الباحثون أيضًا بإقران مهندسي تصميم الأجهزة مع ChatGPT-4 لتصميم معالج دقيق يعتمد على تراكم 8 بت.
تبدو المطالبة الأولية لـ ChatGPT-4 كما يلي:
لنقم بتصميم معالج دقيق جديد بالكامل معًا ... أعتقد أننا بحاجة إلى قصر أنفسنا على بنية تراكمية 8 بت ، بدون تعليمات متعددة البايت. في هذه الحالة ، كيف تعتقد أننا يجب أن نبدأ؟
نظرًا لقيود المساحة ، سعى الباحثون إلى تصميم من نوع von Neumann باستخدام 32 بايت من الذاكرة (بيانات وإرشادات مجمعة).
في النهاية ، عمل ChatGPT-4 مع مهندسي الأجهزة لتصميم معمارية معالجات دقيقة تعتمد على المركم 8 بت. تم بناء المعالج على عملية Skywater 130nm ، مما يعني أن "Chip-Chats" تنفذ ما نعتقد أنه أول HDL في العالم يتم إخراجها من الشريط مكتوبًا بالكامل بواسطة الذكاء الاصطناعي.
مسار البيانات المعتمد على المجمعات لتصميم GPT-4 (رسمه البشر)
في الورقة ، خلص الباحثون إلى أن ChatGPT-4 أنتج رمزًا عالي الجودة نسبيًا ، كما يتضح من فترة التحقق القصيرة. بالنظر إلى حد معدل ChatGPT-4 البالغ 25 رسالة لكل 3 ساعات ، فإن إجمالي ميزانية الوقت لهذا التصميم هو 22.8 ساعة من ChatGPT-4 (بما في ذلك إعادة التشغيل). بلغ متوسط الإنشاء الفعلي لكل رسالة حوالي 30 ثانية: بدون تحديد المعدل ، كان من الممكن إكمال التصميم بالكامل في أقل من 100 دقيقة ، اعتمادًا على المهندس البشري. على الرغم من أن ChatGPT-4 أنشأ مُجمّع Python بسهولة نسبية ، إلا أنه كان من الصعب كتابة البرامج المكتوبة لتصميمنا ، ولم يكتب ChatGPT أي برامج اختبار مهمة.
بشكل عام ، قام الباحثون بتنفيذ جميع التعليمات الأربعة والعشرين في سلسلة شاملة من برامج المُجمِّع المكتوبة من قبل الإنسان والتي تم تقييمها في المحاكاة ومحاكاة FPGA.
** يمكن لـ ChatGPT حفظ دورة تطوير الرقاقة **
قال الدكتور هاموند بيرس ، الأستاذ المساعد في جامعة نيويورك تاندون وعضو فريق البحث: "لقد أنتج هذا البحث ما نعتقد أنه أول HDL تم إنشاؤه بواسطة الذكاء الاصطناعي بالكامل لتصنيع الرقائق المادية". "يمكن لبعض نماذج الذكاء الاصطناعي ، مثل ChatGPT من OpenAI و Google's Bard ، إنشاء رمز برمجي بلغات برمجة مختلفة ، ولكن لم تتم دراسة استخدامها في تصميم الأجهزة على نطاق واسع. تُظهر هذه الدراسة أن الذكاء الاصطناعي يمكن أن يفيد أيضًا تصنيع الأجهزة ، خاصةً عندما يكون تستخدم في المحادثة بحيث يمكنك الانتقال للخلف وللأمام لتحسين التصميم ".
ومع ذلك ، على طول الطريق ، يحتاج الباحثون أيضًا إلى مزيد من الاختبار ومعالجة اعتبارات السلامة التي ينطوي عليها استخدام الذكاء الاصطناعي لتصميم الشرائح.
بشكل عام ، على الرغم من أن ChatGPT ليست أداة برمجية آلية خاصة بمجال الأجهزة ، إلا أنها يمكن أن تصبح أداة مساعدة من EDA وتساعد مصممي EDA على تقليل حد المعرفة بشكل كبير.
يقول الباحثون أيضًا أنه إذا تم تنفيذه في بيئة حقيقية ، فإن استخدام نماذج LLM في تصنيع الرقائق يمكن أن يقلل من الخطأ البشري أثناء تحويل HDL ، ويساعد على تحسين الإنتاجية ، ويقلل من وقت التصميم والوقت في السوق ، ويسمح بمزيد من التصميمات الإبداعية. . في الواقع ، لهذا وحده ، فإن ChatGPT يستحق أن يستخدمه مهندسو الأجهزة للمشاركة في المزيد من المحاولات والاستكشافات في مجال الأجهزة.
للحصول على عملية اختبار أكثر تفصيلاً ، انظر الورقة:
مرجع:
شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
يمكن أيضًا استخدام ChatGPT لإنشاء النوى ، ما عليك سوى التحدث باللغة الإنجليزية؟ !
تنظيم | Tu Min
القائمة | CSDN (المعرف: CSDNnews)
هل ChatGPT رائع حقًا؟
نشر باحثون من كلية تاندون للهندسة بجامعة نيويورك ورقة بحثية بعنوان "Chip-Chat: التحديات والفرص في تصميم أجهزة المحادثة" ، أجابوا بالتجارب: نعم ، ChatGPT أقوى بالفعل!
مجرد الدردشة مع ChatGPT بلغة طبيعية بسيطة الإنجليزية ، تم صنع شريحة معالج دقيق. الأمر الجدير بالملاحظة هو أنه بمساعدة ChatGPT ، لم يتم تصميم مكون الرقاقة هذا فحسب ، بل يمكن تصنيعه أيضًا بعد الاختبار الأساسي.
إذن ، هل حقًا يأتي حقبة "صنع الجوهر" من قبل كل الناس؟ هنا ، قد نلقي نظرة أيضًا على كيفية قيام الباحثين بذلك.
** تطبيق نماذج الذكاء الاصطناعي الكبيرة ، مجال العتاد يتخلف عن البرمجيات **
في الورقة ، أشار الباحثون إلى أن تصميم الأجهزة الحديثة يبدأ بالمواصفات التي توفرها اللغة الطبيعية ، مثل متطلبات المستند باللغة الإنجليزية ، ومن ثم يستخدم مهندسو الأجهزة لغات وصف الأجهزة (HDL) مثل Verilog لإنشاء المتطلبات مع التعليمات البرمجية لـ أكمل التصميم الداخلي للرقاقة ، وأخيراً تم تصنيعه في مكونات الدائرة.
حسنًا ، عندما يقترب عصر AIGC ، مثل ادعاء OpenAI's ChatGPT و Google Bard بقدرتهما على إنشاء رمز ، وقد استخدمهما العديد من المطورين لإنشاء موقع ويب واحدًا تلو الآخر ، ولكن نطاق التطبيق الحالي يركز بشكل أساسي على مجال البرمجيات . ، ما إذا كانت أدوات AIGC هذه يمكن أن تحل محل عمل "الترجمة" (تحويل متطلبات المستند إلى رمز) لمهندسي الأجهزة.
بناءً على ذلك ، استخدم الباحثون ثمانية معايير تمثيلية للتحقيق في إمكانيات وقيود LLM الحديثة عند إنشاء كتابة لغة وصف الأجهزة نفسها.
في التجربة ، استخدم الباحثون ChatGPT كأداة للتعرف على الأنماط (تعمل كإنسان) ، والتي يمكن تحويلها بحرية إلى أنواع مختلفة من اللغات (الشفوية والمكتوبة). وفي الوقت نفسه ، يسمح ChatGPT لمهندسي الأجهزة بتخطي مرحلة HDL.
تظهر عملية التحقق الشاملة في الشكل أدناه:
إذا كان التصميم لا يفي بالمواصفات ، فسيتم إنشاؤه خمس مرات أخرى بنفس الموجه. إذا كان لا يزال لا يفي بالمواصفات ، فإنه يفشل.
بمجرد كتابة التصميمات وحالات الاختبار ، يتم تجميعها باستخدام Icarus Verilog (iverilog ، إحدى أدوات التنفيذ للغة وصف أجهزة Verilog). إذا كان التجميع ناجحًا ، يتم إجراء المحاكاة. إذا لم يتم الإبلاغ عن أي أخطاء ، فسينجح التصميم ، ولا توجد ملاحظات مطلوبة (NFN).
إذا تم الإبلاغ عن أخطاء بواسطة أي من هذه العمليات ، يتم إعادة إدخالها في النموذج ويُطلب منها "الرجاء تقديم الإصلاح" ، وهذا ما يُعرف باسم ملاحظات الأداة (TF). في حالة حدوث نفس الخطأ أو نوع الخطأ نفسه ثلاث مرات ، يتم تقديم التعليقات البشرية البسيطة (SHF) من قبل المستخدم ، عادةً عن طريق تحديد نوع المشكلة في Verilog التي تسببت في الخطأ (على سبيل المثال: خطأ نحوي في بيان).
يتم إعطاء ملاحظات بشرية معتدلة (MHF) في حالة استمرار الخطأ ، ويتم توفير معلومات مباشرة أكثر قليلاً للأداة لتحديد الخطأ المحدد.
في حالة استمرار الخطأ ، يتم تقديم تعليقات بشرية متقدمة (AHF) ، والتي تعتمد على التحديد الدقيق لمكان الخطأ وكيفية إصلاحه.
بمجرد تجميع التصميم ومحاكاته ، مع عدم وجود حالات اختبار فاشلة ، يعتبر ناجحًا.
ولكن إذا لم تُصلح التعليقات عالية المستوى الخطأ ، أو إذا احتاج المستخدم إلى كتابة أي كود Verilog لحل الخطأ ، فسيتم اعتبار الاختبار قد فشل. يعتبر الاختبار أيضًا فاشلاً إذا تجاوزت الجلسة 25 رسالة ، بما يلبي حد معدل OpenAI لرسائل ChatGPT-4 لكل 3 ساعات.
** Bard and HuggingChat تعطلت في الجولة الأولى من الاختبار **
في التجربة المحددة ، أجرى الباحثون اختبارًا معياريًا لسجل التحول 8 بت.
يطلبون من النموذج الكبير محاولة إنشاء نموذج Verilog لـ "اسم اختبار" ، ثم تقديم المواصفات وتحديد منافذ الإدخال والإخراج وأي تفاصيل أخرى مطلوبة ، ثم طرح النموذج الكبير "كيف سأكتب تصميمًا لـ تلبية هذه المواصفات؟ "
هل يمكنك كتابة طاولة اختبار Verilog لهذا التصميم؟ يجب أن يتمتع منضدة الاختبار بقدرات اختبار ذاتي ويمكن استخدامها مع iverilog للمحاكاة والتحقق. في حالة فشل حالة الاختبار ، يجب أن تكون منصة الاختبار قادرة على توفير معلومات كافية حتى يمكن العثور على الخطأ وحلّه.
نظرًا للأداء الضعيف لـ Bard و HuggingChat في موجهات خط الأساس الأولية للتحدي ، قرر الباحثون المتابعة باختبار كامل فقط على ChatGPT-4 و ChatGPT-3.5.
** مسابقة ChatGPT-4 و ChatGPT-3.5 **
يوضح الشكل أدناه النتائج المعيارية لـ ChatGPT-4 و ChatGPT-3.5 ، ومن الواضح أن أداء ChatGPT-3.5 أسوأ قليلاً من أداء ChatGPT-4 ، فكل المحادثات غير متوافقة.
في المقابل ، كان أداء ChatGPT-4 أفضل ، حيث اجتاز معظم المعايير ، والتي تطلب معظمها فقط تعليقات الأداة. ومع ذلك ، في تصميم مقاعد البدلاء ، لا تزال ردود الفعل البشرية مطلوبة.
لاستكشاف إمكانات LLM ، قام الباحثون أيضًا بإقران مهندسي تصميم الأجهزة مع ChatGPT-4 لتصميم معالج دقيق يعتمد على تراكم 8 بت.
تبدو المطالبة الأولية لـ ChatGPT-4 كما يلي:
لنقم بتصميم معالج دقيق جديد بالكامل معًا ... أعتقد أننا بحاجة إلى قصر أنفسنا على بنية تراكمية 8 بت ، بدون تعليمات متعددة البايت. في هذه الحالة ، كيف تعتقد أننا يجب أن نبدأ؟
في النهاية ، عمل ChatGPT-4 مع مهندسي الأجهزة لتصميم معمارية معالجات دقيقة تعتمد على المركم 8 بت. تم بناء المعالج على عملية Skywater 130nm ، مما يعني أن "Chip-Chats" تنفذ ما نعتقد أنه أول HDL في العالم يتم إخراجها من الشريط مكتوبًا بالكامل بواسطة الذكاء الاصطناعي.
في الورقة ، خلص الباحثون إلى أن ChatGPT-4 أنتج رمزًا عالي الجودة نسبيًا ، كما يتضح من فترة التحقق القصيرة. بالنظر إلى حد معدل ChatGPT-4 البالغ 25 رسالة لكل 3 ساعات ، فإن إجمالي ميزانية الوقت لهذا التصميم هو 22.8 ساعة من ChatGPT-4 (بما في ذلك إعادة التشغيل). بلغ متوسط الإنشاء الفعلي لكل رسالة حوالي 30 ثانية: بدون تحديد المعدل ، كان من الممكن إكمال التصميم بالكامل في أقل من 100 دقيقة ، اعتمادًا على المهندس البشري. على الرغم من أن ChatGPT-4 أنشأ مُجمّع Python بسهولة نسبية ، إلا أنه كان من الصعب كتابة البرامج المكتوبة لتصميمنا ، ولم يكتب ChatGPT أي برامج اختبار مهمة.
بشكل عام ، قام الباحثون بتنفيذ جميع التعليمات الأربعة والعشرين في سلسلة شاملة من برامج المُجمِّع المكتوبة من قبل الإنسان والتي تم تقييمها في المحاكاة ومحاكاة FPGA.
** يمكن لـ ChatGPT حفظ دورة تطوير الرقاقة **
قال الدكتور هاموند بيرس ، الأستاذ المساعد في جامعة نيويورك تاندون وعضو فريق البحث: "لقد أنتج هذا البحث ما نعتقد أنه أول HDL تم إنشاؤه بواسطة الذكاء الاصطناعي بالكامل لتصنيع الرقائق المادية". "يمكن لبعض نماذج الذكاء الاصطناعي ، مثل ChatGPT من OpenAI و Google's Bard ، إنشاء رمز برمجي بلغات برمجة مختلفة ، ولكن لم تتم دراسة استخدامها في تصميم الأجهزة على نطاق واسع. تُظهر هذه الدراسة أن الذكاء الاصطناعي يمكن أن يفيد أيضًا تصنيع الأجهزة ، خاصةً عندما يكون تستخدم في المحادثة بحيث يمكنك الانتقال للخلف وللأمام لتحسين التصميم ".
ومع ذلك ، على طول الطريق ، يحتاج الباحثون أيضًا إلى مزيد من الاختبار ومعالجة اعتبارات السلامة التي ينطوي عليها استخدام الذكاء الاصطناعي لتصميم الشرائح.
بشكل عام ، على الرغم من أن ChatGPT ليست أداة برمجية آلية خاصة بمجال الأجهزة ، إلا أنها يمكن أن تصبح أداة مساعدة من EDA وتساعد مصممي EDA على تقليل حد المعرفة بشكل كبير.
يقول الباحثون أيضًا أنه إذا تم تنفيذه في بيئة حقيقية ، فإن استخدام نماذج LLM في تصنيع الرقائق يمكن أن يقلل من الخطأ البشري أثناء تحويل HDL ، ويساعد على تحسين الإنتاجية ، ويقلل من وقت التصميم والوقت في السوق ، ويسمح بمزيد من التصميمات الإبداعية. . في الواقع ، لهذا وحده ، فإن ChatGPT يستحق أن يستخدمه مهندسو الأجهزة للمشاركة في المزيد من المحاولات والاستكشافات في مجال الأجهزة.
للحصول على عملية اختبار أكثر تفصيلاً ، انظر الورقة:
مرجع: