Исследователи из инженерной школы Tandon при Нью-Йоркском университете опубликовали статью «Chip-Chat: вызовы и возможности в разработке аппаратного обеспечения для разговоров», в которой ответили экспериментами: да, ChatGPT действительно мощнее!
Просто пообщавшись с ChatGPT на простом естественном английском языке, был изготовлен микропроцессорный чип. Что еще примечательно, с помощью ChatGPT этот чип-компонент не только проектируется, но и может быть изготовлен после базовых испытаний.
«Это беспрецедентное достижение, которое может ускорить разработку микросхем и позволить людям, не имеющим специальных технических навыков, проектировать микросхемы», — прокомментировал Нью-Йоркский университет.
Так неужели грядет эпоха «ядроделения» всего народа? Здесь мы могли бы также взглянуть на то, как это сделали исследователи.
Применение больших моделей ИИ, аппаратное обеспечение отстает от программного
В документе исследователи указали, что проектирование современного оборудования начинается со спецификаций, представленных на естественном языке, таких как требования к документам на английском языке, а затем инженеры по оборудованию используют языки описания оборудования (HDL), такие как Verilog, для построения требований с кодом для завершить внутреннюю конструкцию чипа и, наконец, синтезировать в компоненты схемы.
Что ж, когда наступает эра AIGC, например, ChatGPT от OpenAI и Bard от Google заявляют, что могут генерировать код, и многие разработчики использовали их для создания одного веб-сайта за другим, но текущая сфера применения в основном сосредоточена на области программного обеспечения. , могут ли эти инструменты AIGC заменить «перевод» (преобразование требований к документам в код) работу инженеров по аппаратному обеспечению.
Исходя из этого, исследователи использовали восемь репрезентативных эталонных тестов для изучения возможностей и ограничений современных LLM при создании написания самого языка описания оборудования.
## Принципы и правила тестирования
В эксперименте исследователи использовали ChatGPT в качестве распознавателя образов (выступающего в роли человека), который можно свободно конвертировать в различные типы языков (устные, письменные). стадия ЛПВП.
Общий процесс проверки показан на рисунке ниже:
Если говорить подробно, сначала инженер по аппаратному обеспечению дает начальные подсказки большой модели, позволяет ей создать модель Verilog, а затем предоставляет конкретную информацию о вводе и выводе. Наконец, инженер по аппаратному обеспечению выполняет визуальную оценку выходного проекта, чтобы определить, соответствует ли он основным спецификациям проекта.
Если дизайн не соответствует спецификации, он создается еще пять раз с тем же запросом. Если он по-прежнему не соответствует спецификации, он терпит неудачу.
После написания проектов и тестовых примеров они компилируются с помощью Icarus Verilog (iverilog, один из инструментов реализации языка описания оборудования Verilog). Если компиляция прошла успешно, выполняется моделирование. Если об ошибках не сообщается, проект проходит проверку без обратной связи (NFN).
Если какая-либо из этих операций сообщает об ошибках, они возвращаются обратно в модель и запрашиваются «пожалуйста, предоставьте исправление», это называется обратной связью по инструменту (TF). Если одна и та же ошибка или тип ошибки возникает три раза, пользователь дает простой человеческий отзыв (SHF), обычно указывая, какой тип проблемы в Verilog вызвал ошибку (например, синтаксическая ошибка в операторе).
Умеренная человеческая обратная связь (MHF) предоставляется, если ошибка сохраняется, и инструменту предоставляется несколько более прямая информация для определения конкретной ошибки.
Если ошибка не устранена, предоставляется расширенная человеческая обратная связь (AHF), которая основана на точном определении того, где именно находится ошибка и как ее исправить.
Как только проект скомпилирован и смоделирован без неудачных тестов, он считается успешным.
Но если обратная связь высокого уровня не устраняет ошибку или пользователю необходимо написать какой-либо код Verilog для устранения ошибки, тест считается не пройденным. Тест также считается не пройденным, если сеанс превышает 25 сообщений, что соответствует пределу скорости OpenAI для сообщений ChatGPT-4 за 3 часа.
Bard и HuggingChat вышли из строя на первом этапе тестирования
В конкретном эксперименте исследователи провели тестовый тест для 8-битного сдвигового регистра.
Они просят большую модель попытаться создать модель Verilog для «тестового имени», затем предоставляют спецификацию, определяя порты ввода и вывода и любые другие необходимые детали, а затем спрашивают большую модель: «Как бы я написал дизайн для соответствуют этим требованиям?»
В то же время исследователи также напрямую позволили большой модели сгенерировать дизайн испытательного стенда:
Можете ли вы написать тестовый стенд Verilog для этого проекта? Испытательный стенд должен иметь возможности самотестирования и возможность использования с iverilog для моделирования и проверки. Если тестовый пример не пройден, испытательный стенд должен предоставить достаточно информации, чтобы можно было найти и устранить ошибку.
Кроме того, исследователи получили выходной контент на основе четырех больших моделей ChatGPT-4, ChatGPT-3.5, Bard и HuggingChat:
Окончательные результаты показали, что обе модели ChatGPT соответствуют спецификациям, и начался процесс проектирования. Однако Bard и HuggingChat не соответствовали первоначальным критериям спецификации.
Несмотря на то, что после упомянутого выше процесса тестирования исследователи попросили большую модель восстановить ответы еще пять раз на основе первоначальных подсказок от Bard и HuggingChat, после многих раундов обе модели потерпели неудачу. Среди них Bard не всегда может соответствовать заданной спецификации дизайна, а вывод Verilog HuggingChat начинает быть неверным после определения модуля.
Учитывая низкую производительность Bard и HuggingChat при первоначальных базовых запросах, исследователи решили продолжить полное тестирование только на ChatGPT-4 и ChatGPT-3.5.
Конкурс ChatGPT-4 и ChatGPT-3.5
На рисунке ниже показаны результаты тестов ChatGPT-4 и ChatGPT-3.5.Очевидно, что производительность ChatGPT-3.5 немного хуже, чем у ChatGPT-4.Разговоры несовместимы.
Напротив, ChatGPT-4 показал себя еще лучше, пройдя большинство тестов, большинство из которых требовали только обратной связи с инструментами. Однако при проектировании испытательного стенда по-прежнему требуется человеческая обратная связь.
## ChatGPT-4 работает вместе с инженерами по оборудованию для совместной разработки чипов
Чтобы изучить потенциал LLM, исследователи также объединили инженеров-разработчиков оборудования с ChatGPT-4 для разработки 8-битного микропроцессора на основе аккумулятора.
Начальное приглашение для ChatGPT-4 выглядит так:
Давайте вместе разработаем совершенно новый микропроцессор... Я думаю, нам нужно ограничиться 8-битной архитектурой аккумулятора, без многобайтовых инструкций. В таком случае, с чего, по-вашему, нам следует начать?
Учитывая нехватку места, исследователи стремились к конструкции типа фон Неймана, использующей 32 байта памяти (объединенные данные и инструкции).
В конце концов, ChatGPT-4 работал с инженерами по аппаратному обеспечению для разработки новой микропроцессорной архитектуры на основе 8-битного аккумулятора. Процессор построен на 130-нм техпроцессе Skywater, а это означает, что эти «чип-чаты» реализуют то, что мы считаем первым в мире записываемым на ленту HDL, полностью написанным искусственным интеллектом.
Путь данных на основе накопителя для конструкции GPT-4 (нарисованный людьми)
В документе исследователи пришли к выводу, что ChatGPT-4 производит код относительно высокого качества, о чем свидетельствует короткий цикл проверки. Учитывая ограничение скорости ChatGPT-4 в 25 сообщений за 3 часа, общий бюджет времени для этого проекта составляет 22,8 часа ChatGPT-4 (включая перезапуск). Фактическая генерация каждого сообщения в среднем составляла около 30 секунд: без ограничения скорости весь проект мог быть завершен менее чем за 100 минут, в зависимости от инженера-человека. Хотя ChatGPT-4 относительно легко сгенерировал ассемблер Python, было сложно написать программы, написанные для нашего дизайна, и ChatGPT не написал каких-либо значительных тестовых программ.
В целом, исследователи выполнили все 24 инструкции в обширной серии программ на ассемблере, написанных человеком, которые оценивались в моделировании и моделировании ПЛИС.
ChatGPT может сократить цикл разработки чипа
«Это исследование привело к тому, что мы считаем первым полностью сгенерированным ИИ HDL для изготовления физических чипов», — сказал доктор Хаммонд Пирс, доцент-исследователь NYU Tandon и член исследовательской группы. «Некоторые модели искусственного интеллекта, такие как ChatGPT от OpenAI и Bard от Google, могут генерировать программный код на разных языках программирования, но их использование при проектировании оборудования широко не изучалось. Это исследование показывает, что ИИ также может принести пользу производству оборудования, особенно когда это необходимо. используется в разговоре, что вы можете пройти вперед и назад, чтобы усовершенствовать дизайн».
Однако попутно исследователям также необходимо дополнительно проверить и учесть соображения безопасности, связанные с использованием ИИ для проектирования микросхем.
В целом, хотя ChatGPT не является автоматизированным программным инструментом, предназначенным специально для области аппаратного обеспечения, он может стать вспомогательным инструментом EDA и помочь разработчикам EDA значительно снизить порог знаний.
Исследователи также говорят, что в случае реализации в реальной среде использование моделей LLM при изготовлении микросхем может уменьшить количество человеческих ошибок во время преобразования HDL, помочь повысить производительность, сократить время проектирования и время выхода на рынок, а также позволит создавать более творческие проекты. . На самом деле, только ради этого ChatGPT достоин того, чтобы инженеры по аппаратному обеспечению использовали его для участия в новых попытках и исследованиях в области аппаратного обеспечения.
Более подробный процесс тестирования см. в статье:
ссылка:
Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
ChatGPT также можно использовать для создания ядер, просто говорите по-английски? !
Организовать | Ту Мин
Листинг | CSDN (ID: CSDNnews)
Действительно ли ChatGPT такой классный?
Исследователи из инженерной школы Tandon при Нью-Йоркском университете опубликовали статью «Chip-Chat: вызовы и возможности в разработке аппаратного обеспечения для разговоров», в которой ответили экспериментами: да, ChatGPT действительно мощнее!
Просто пообщавшись с ChatGPT на простом естественном английском языке, был изготовлен микропроцессорный чип. Что еще примечательно, с помощью ChatGPT этот чип-компонент не только проектируется, но и может быть изготовлен после базовых испытаний.
Так неужели грядет эпоха «ядроделения» всего народа? Здесь мы могли бы также взглянуть на то, как это сделали исследователи.
Применение больших моделей ИИ, аппаратное обеспечение отстает от программного
В документе исследователи указали, что проектирование современного оборудования начинается со спецификаций, представленных на естественном языке, таких как требования к документам на английском языке, а затем инженеры по оборудованию используют языки описания оборудования (HDL), такие как Verilog, для построения требований с кодом для завершить внутреннюю конструкцию чипа и, наконец, синтезировать в компоненты схемы.
Что ж, когда наступает эра AIGC, например, ChatGPT от OpenAI и Bard от Google заявляют, что могут генерировать код, и многие разработчики использовали их для создания одного веб-сайта за другим, но текущая сфера применения в основном сосредоточена на области программного обеспечения. , могут ли эти инструменты AIGC заменить «перевод» (преобразование требований к документам в код) работу инженеров по аппаратному обеспечению.
Исходя из этого, исследователи использовали восемь репрезентативных эталонных тестов для изучения возможностей и ограничений современных LLM при создании написания самого языка описания оборудования.
В эксперименте исследователи использовали ChatGPT в качестве распознавателя образов (выступающего в роли человека), который можно свободно конвертировать в различные типы языков (устные, письменные). стадия ЛПВП.
Общий процесс проверки показан на рисунке ниже:
Если дизайн не соответствует спецификации, он создается еще пять раз с тем же запросом. Если он по-прежнему не соответствует спецификации, он терпит неудачу.
После написания проектов и тестовых примеров они компилируются с помощью Icarus Verilog (iverilog, один из инструментов реализации языка описания оборудования Verilog). Если компиляция прошла успешно, выполняется моделирование. Если об ошибках не сообщается, проект проходит проверку без обратной связи (NFN).
Если какая-либо из этих операций сообщает об ошибках, они возвращаются обратно в модель и запрашиваются «пожалуйста, предоставьте исправление», это называется обратной связью по инструменту (TF). Если одна и та же ошибка или тип ошибки возникает три раза, пользователь дает простой человеческий отзыв (SHF), обычно указывая, какой тип проблемы в Verilog вызвал ошибку (например, синтаксическая ошибка в операторе).
Умеренная человеческая обратная связь (MHF) предоставляется, если ошибка сохраняется, и инструменту предоставляется несколько более прямая информация для определения конкретной ошибки.
Если ошибка не устранена, предоставляется расширенная человеческая обратная связь (AHF), которая основана на точном определении того, где именно находится ошибка и как ее исправить.
Как только проект скомпилирован и смоделирован без неудачных тестов, он считается успешным.
Но если обратная связь высокого уровня не устраняет ошибку или пользователю необходимо написать какой-либо код Verilog для устранения ошибки, тест считается не пройденным. Тест также считается не пройденным, если сеанс превышает 25 сообщений, что соответствует пределу скорости OpenAI для сообщений ChatGPT-4 за 3 часа.
Bard и HuggingChat вышли из строя на первом этапе тестирования
В конкретном эксперименте исследователи провели тестовый тест для 8-битного сдвигового регистра.
Они просят большую модель попытаться создать модель Verilog для «тестового имени», затем предоставляют спецификацию, определяя порты ввода и вывода и любые другие необходимые детали, а затем спрашивают большую модель: «Как бы я написал дизайн для соответствуют этим требованиям?»
Можете ли вы написать тестовый стенд Verilog для этого проекта? Испытательный стенд должен иметь возможности самотестирования и возможность использования с iverilog для моделирования и проверки. Если тестовый пример не пройден, испытательный стенд должен предоставить достаточно информации, чтобы можно было найти и устранить ошибку.
Учитывая низкую производительность Bard и HuggingChat при первоначальных базовых запросах, исследователи решили продолжить полное тестирование только на ChatGPT-4 и ChatGPT-3.5.
Конкурс ChatGPT-4 и ChatGPT-3.5
На рисунке ниже показаны результаты тестов ChatGPT-4 и ChatGPT-3.5.Очевидно, что производительность ChatGPT-3.5 немного хуже, чем у ChatGPT-4.Разговоры несовместимы.
Напротив, ChatGPT-4 показал себя еще лучше, пройдя большинство тестов, большинство из которых требовали только обратной связи с инструментами. Однако при проектировании испытательного стенда по-прежнему требуется человеческая обратная связь.
Чтобы изучить потенциал LLM, исследователи также объединили инженеров-разработчиков оборудования с ChatGPT-4 для разработки 8-битного микропроцессора на основе аккумулятора.
Начальное приглашение для ChatGPT-4 выглядит так:
Давайте вместе разработаем совершенно новый микропроцессор... Я думаю, нам нужно ограничиться 8-битной архитектурой аккумулятора, без многобайтовых инструкций. В таком случае, с чего, по-вашему, нам следует начать?
В конце концов, ChatGPT-4 работал с инженерами по аппаратному обеспечению для разработки новой микропроцессорной архитектуры на основе 8-битного аккумулятора. Процессор построен на 130-нм техпроцессе Skywater, а это означает, что эти «чип-чаты» реализуют то, что мы считаем первым в мире записываемым на ленту HDL, полностью написанным искусственным интеллектом.
В документе исследователи пришли к выводу, что ChatGPT-4 производит код относительно высокого качества, о чем свидетельствует короткий цикл проверки. Учитывая ограничение скорости ChatGPT-4 в 25 сообщений за 3 часа, общий бюджет времени для этого проекта составляет 22,8 часа ChatGPT-4 (включая перезапуск). Фактическая генерация каждого сообщения в среднем составляла около 30 секунд: без ограничения скорости весь проект мог быть завершен менее чем за 100 минут, в зависимости от инженера-человека. Хотя ChatGPT-4 относительно легко сгенерировал ассемблер Python, было сложно написать программы, написанные для нашего дизайна, и ChatGPT не написал каких-либо значительных тестовых программ.
В целом, исследователи выполнили все 24 инструкции в обширной серии программ на ассемблере, написанных человеком, которые оценивались в моделировании и моделировании ПЛИС.
ChatGPT может сократить цикл разработки чипа
«Это исследование привело к тому, что мы считаем первым полностью сгенерированным ИИ HDL для изготовления физических чипов», — сказал доктор Хаммонд Пирс, доцент-исследователь NYU Tandon и член исследовательской группы. «Некоторые модели искусственного интеллекта, такие как ChatGPT от OpenAI и Bard от Google, могут генерировать программный код на разных языках программирования, но их использование при проектировании оборудования широко не изучалось. Это исследование показывает, что ИИ также может принести пользу производству оборудования, особенно когда это необходимо. используется в разговоре, что вы можете пройти вперед и назад, чтобы усовершенствовать дизайн».
Однако попутно исследователям также необходимо дополнительно проверить и учесть соображения безопасности, связанные с использованием ИИ для проектирования микросхем.
В целом, хотя ChatGPT не является автоматизированным программным инструментом, предназначенным специально для области аппаратного обеспечения, он может стать вспомогательным инструментом EDA и помочь разработчикам EDA значительно снизить порог знаний.
Исследователи также говорят, что в случае реализации в реальной среде использование моделей LLM при изготовлении микросхем может уменьшить количество человеческих ошибок во время преобразования HDL, помочь повысить производительность, сократить время проектирования и время выхода на рынок, а также позволит создавать более творческие проекты. . На самом деле, только ради этого ChatGPT достоин того, чтобы инженеры по аппаратному обеспечению использовали его для участия в новых попытках и исследованиях в области аппаратного обеспечения.
Более подробный процесс тестирования см. в статье:
ссылка: