ChatGPT також можна використовувати для створення ядер, просто розмовляйте англійською? !

Question

Організувати |Вт хвСписок | CSDN (ID: CSDNnews)Чи справді ChatGPT такий чудовий?Дослідники з інженерної школи Тандон Університету Нью-Йорка опублікували статтю «Chip-Chat: виклики та можливості в розробці розмовного апаратного забезпечення», у якій відповіли експериментами: Так, ChatGPT справді потужніший!Просто спілкуючись із ChatGPT простою природною англійською мовою, був виготовлений мікропроцесорний чіп. Що ще варто відзначити, це те, що за допомогою ChatGPT цей компонент мікросхеми не тільки розроблений, але й може бути виготовлений після базового тестування.![](https://img.gateio.im/social/moments-bab2147faf-e546369972-dd1a6f-62a40f) «Це безпрецедентне досягнення, яке може прискорити розробку чіпів і дозволити людям без спеціальних технічних навичок проектувати чіпи», — прокоментував Нью-Йоркський університет.Отже, чи справді настає ера «основотворення» всім народом? Тут ми могли б також поглянути на те, як це зробили дослідники.## **Застосування великих моделей ШІ, апаратне забезпечення відстає від програмного забезпечення**У статті дослідники відзначили, що сучасне проектування апаратного забезпечення починається зі специфікацій, наданих природною мовою, наприклад вимог до документів англійською мовою, а потім інженери апаратного забезпечення використовують мови опису апаратного забезпечення (HDL), такі як Verilog, для побудови вимог за допомогою коду для завершити внутрішній дизайн чіпа та, нарешті, синтезувати його в компоненти схеми.Що ж, коли настає ера AIGC, такі як ChatGPT від OpenAI і Bard від Google стверджують, що можуть генерувати код, і багато розробників використовували їх для створення одного веб-сайту за іншим, але нинішня сфера застосування зосереджена в основному на сфері програмного забезпечення чи можуть ці інструменти AIGC замінити «переклад» (перетворення вимог до документів у код) роботу інженерів апаратного забезпечення.Виходячи з цього, дослідники використали вісім репрезентативних тестів для дослідження можливостей і обмежень найсучасніших LLM під час створення мови опису апаратного забезпечення.![](https://img.gateio.im/social/moments-bab2147faf-13b13c1041-dd1a6f-62a40f) ## **Принципи та правила тестування**В експерименті дослідники використовували ChatGPT як розпізнавач шаблонів (діючи як людина), який можна вільно конвертувати в різні типи мов (усні, письмові).В той же час ChatGPT дозволяє апаратним інженерам пропускати стадія ЛПВЩ.Загальний процес перевірки показаний на малюнку нижче:![](https://img.gateio.im/social/moments-bab2147faf-084d63f414-dd1a6f-62a40f) Якщо говорити детально, то спочатку апаратний інженер надає початкові підказки великій моделі, дозволяє їй створити модель Verilog, а потім надає конкретну інформацію про введення та виведення. Нарешті, апаратний інженер виконує візуальну оцінку вихідного проекту, щоб визначити, чи відповідає він основним специфікаціям проекту.Якщо дизайн не відповідає специфікаціям, він генерується ще п’ять разів із тим самим запитом. Якщо він все ще не відповідає специфікації, значить, він виходить з ладу.Після написання проектів і тестів вони компілюються за допомогою Icarus Verilog (iverilog, один із інструментів реалізації мови опису обладнання Verilog). Якщо компіляція пройшла успішно, виконується моделювання. Якщо не повідомляється про помилки, дизайн проходить, зворотний зв’язок не потрібен (NFN).Якщо під час будь-якої з цих операцій повідомляється про помилки, вони повертаються в модель із запитом «будь ласка, надайте виправлення», це відомо як відгук про інструмент (TF). Якщо одна й та сама помилка або тип помилки трапляється тричі, користувач надає простий людський відгук (SHF), зазвичай вказуючи, який тип проблеми у Verilog викликав помилку (наприклад: синтаксична помилка у заяві).Помірний відгук людини (MHF) надається, якщо помилка не зникає, і трохи більш пряма інформація надається інструменту для виявлення конкретної помилки.Якщо помилка не зникає, надсилається Advanced Human Feedback (AHF), яка ґрунтується на точному визначенні місця помилки та способів її усунення.Після того, як проект скомпільований і змодельований, без жодних невдалих тестів, він вважається успішним.Але якщо відгуки високого рівня не виправляють помилку або користувачеві потрібно написати будь-який код Verilog для вирішення проблеми, тест вважається невдалим. Тест також вважається невдалим, якщо сеанс перевищує 25 повідомлень, що відповідає обмеженню OpenAI щодо кількості повідомлень ChatGPT-4 за 3 години.## **Bard і HuggingChat вийшли з ладу в першому раунді тестування**У конкретному експерименті дослідники провели порівняльний тест для 8-розрядного регістра зсуву.Вони просять велику модель спробувати створити модель Verilog для «тестової назви», потім надають специфікацію, визначаючи вхідні та вихідні порти та будь-які інші необхідні деталі, і далі запитують велику модель: «Як я можу написати проект для відповідати цим специфікаціям?"![](https://img.gateio.im/social/moments-bab2147faf-b93b509c86-dd1a6f-62a40f) У той же час дослідники також дозволили великій моделі створити дизайн випробувального стенду:Чи можете ви написати тестовий стенд Verilog для цього дизайну? Тестовий стенд повинен мати можливість самотестування та використовуватися з iverilog для моделювання та перевірки. Якщо тестовий приклад не вдається, тестовий стенд повинен мати можливість надати достатньо інформації, щоб можна було знайти та усунути помилку.![](https://img.gateio.im/social/moments-bab2147faf-82c3f89799-dd1a6f-62a40f) Крім того, дослідники отримали вихідний вміст на основі чотирьох великих моделей ChatGPT-4, ChatGPT-3.5, Bard і HuggingChat:![](https://img.gateio.im/social/moments-bab2147faf-7fd1eb62cb-dd1a6f-62a40f) Остаточні результати показали, що обидві моделі ChatGPT відповідають специфікаціям, і почався процес проектування. Однак Bard і HuggingChat не відповідали початковим критеріям специфікації.![](https://img.gateio.im/social/moments-bab2147faf-75d9fbc7e1-dd1a6f-62a40f) Хоча після процесу тестування, згаданого вище, дослідники попросили велику модель відновити відповіді ще п’ять разів на основі початкових підказок від Bard і HuggingChat, після багатьох раундів обидві моделі зазнали невдачі. Серед них Bard не може завжди відповідати заданій специфікації дизайну, а вихідні дані Verilog HuggingChat починають бути неправильними після визначення модуля.Враховуючи низьку продуктивність Bard і HuggingChat на базових підказках початкового завдання, дослідники вирішили продовжити повне тестування лише на ChatGPT-4 і ChatGPT-3.5.## **Конкурс ChatGPT-4 і ChatGPT-3.5**На малюнку нижче показано порівняльні результати ChatGPT-4 і ChatGPT-3.5. Очевидно, що продуктивність ChatGPT-3.5 трохи гірша, ніж у ChatGPT-4. Усі розмови несумісні.На відміну від цього, ChatGPT-4 показав ще кращі результати, пройшовши більшість контрольних тестів, більшість з яких вимагали лише відгуків інструментів. Проте при проектуванні випробувального стенду все ще потрібен зворотний зв’язок людини.![](https://img.gateio.im/social/moments-bab2147faf-9c410181dd-dd1a6f-62a40f) ## **ChatGPT-4 співпрацює з апаратними інженерами для спільної розробки мікросхем**Щоб дослідити потенціал LLM, дослідники також об’єднали інженерів-конструкторів апаратного забезпечення з ChatGPT-4 для розробки 8-розрядного мікропроцесора на основі акумулятора.Початкова підказка для ChatGPT-4 виглядає так:Давайте разом створимо абсолютно новий мікропроцесор... Я думаю, що нам потрібно обмежитися 8-розрядною архітектурою акумулятора, без багатобайтових інструкцій. Як ви думаєте, з чого нам почати?![](https://img.gateio.im/social/moments-bab2147faf-825eec2729-dd1a6f-62a40f) Враховуючи обмеження простору, дослідники націлилися на дизайн типу фон Неймана з використанням 32 байтів пам’яті (комбіновані дані та інструкції).Зрештою, ChatGPT-4 працював з апаратними інженерами над розробкою нової 8-розрядної архітектури мікропроцесора на основі акумулятора. Процесор створено за 130-нм техпроцесом Skywater, що означає, що ці «Чіпи-чати» реалізують те, що, на нашу думку, є першим у світі HDL на плівку, повністю написаним штучним інтелектом.![](https://img.gateio.im/social/moments-bab2147faf-000b4299a9-dd1a6f-62a40f) Шлях даних на основі акумулятора для дизайну GPT-4 (намальований людьми)У статті дослідники дійшли висновку, що ChatGPT-4 створив відносно високоякісний код, про що свідчить короткий цикл перевірки. Враховуючи обмеження швидкості ChatGPT-4 у 25 повідомлень на 3 години, загальний бюджет для цього дизайну становить 22,8 години ChatGPT-4 (включно з перезапуском). Фактична генерація кожного повідомлення в середньому тривала близько 30 секунд: без обмеження швидкості весь проект можна було б завершити за <100 хвилин, залежно від інженера-людини. Незважаючи на те, що ChatGPT-4 згенерував асемблер Python з відносною легкістю, було важко написати програми, написані для нашого дизайну, і ChatGPT не написав жодних значущих тестових програм.Загалом дослідники виконали всі 24 інструкції в комплексній серії написаних людиною асемблерних програм, оцінених у моделюванні та моделюванні FPGA.## **ChatGPT може скоротити цикл розробки чіпа**«Це дослідження створило те, що, на нашу думку, є першим повністю створеним штучним інтелектом HDL для виготовлення фізичних чіпів», — сказав д-р Хаммонд Пірс, асистент професора Нью-Йоркського університету Тандон і член дослідницької групи. «Деякі моделі штучного інтелекту, такі як ChatGPT від OpenAI і Bard від Google, можуть генерувати програмний код на різних мовах програмування, але їх використання в розробці апаратного забезпечення широко не вивчалося. Це дослідження показує, що штучний інтелект також може принести користь виробництву апаратного забезпечення, особливо коли це використовувані в розмові, які ви можете переглядати туди-сюди, щоб удосконалити дизайн».Однак на цьому шляху дослідники також повинні додатково перевірити та розглянути питання безпеки, пов’язані з використанням ШІ для проектування чіпів.Загалом, хоча ChatGPT не є автоматизованим програмним інструментом спеціально для апаратного забезпечення, він може стати допоміжним інструментом EDA та допомогти розробникам EDA значно знизити поріг знань.Дослідники також стверджують, що за умови реалізації в реальному середовищі використання моделей LLM у виготовленні чіпів може зменшити людські помилки під час перетворення HDL, допомогти підвищити продуктивність, скоротити час проектування та час виходу на ринок, а також дозволить створювати більш творчі проекти. . Фактично, лише для цього ChatGPT заслуговує на те, щоб його використовували інженери апаратного забезпечення для участі в нових спробах і дослідженнях у галузі апаратного забезпечення.Щоб отримати детальнішу інформацію про процес тестування, перегляньте статтю:посилання: