ChatGPT aynı zamanda çekirdek yapmak için de kullanılabilir, sadece İngilizce mi konuşacaksınız? !

Organize | Tu Min

İlan | CSDN (ID: CSDNnews)

ChatGPT gerçekten o kadar harika mı?

New York Üniversitesi'nin Tandon Mühendislik Okulu'ndan araştırmacılar "Chip-Chat: Challenges and Opportunities in Conversational Hardware Design" adlı makaleyi deneylerle yanıtladılar: Evet, ChatGPT gerçekten daha güçlü!

ChatGPT ile basit bir doğal dil olan İngilizce ile sohbet ederken, bir mikroişlemci çipi üretildi. Daha da önemlisi, ChatGPT yardımıyla bu çip bileşeni sadece tasarlanmakla kalmıyor, aynı zamanda temel testlerden sonra üretilebiliyor.

New York Üniversitesi, "Bu, çip geliştirmeyi hızlandırabilen ve özel teknik becerilere sahip olmayan bireylerin çip tasarlamasına olanak tanıyan benzeri görülmemiş bir başarıdır" yorumunda bulundu.

Peki, tüm insanlar tarafından "çekirdek yapma" çağı gerçekten geliyor mu? Burada, araştırmacıların bunu nasıl yaptığına da bir göz atabiliriz.

Yapay zekalı büyük modellerin uygulanması, donanım alanı yazılımın gerisinde kalıyor

Makalede araştırmacılar, modern donanım tasarımının, İngilizce belge gereksinimleri gibi doğal dil tarafından sağlanan özelliklerle başladığına ve ardından donanım mühendislerinin gereksinimleri kodla oluşturmak için Verilog gibi donanım tanımlama dillerini (HDL) kullandıklarına dikkat çekti. çip iç tasarımını tamamlayın ve son olarak devre bileşenlerine sentezleyin.

Pekala, OpenAI'den ChatGPT ve Google'dan Bard gibi AIGC çağı geldiğinde kod üretebileceğini iddia ediyor ve birçok geliştirici bunları birbiri ardına web sitesi oluşturmak için kullandı, ancak mevcut uygulama kapsamı esas olarak yazılım alanına odaklanıyor. . , bu AIGC araçlarının donanım mühendislerinin "çeviri" (belge gereksinimlerinin koda dönüştürülmesi) işinin yerini alıp alamayacağı.

Buna dayanarak, araştırmacılar, donanım tanımlama dilinin yazımını oluştururken son teknoloji LLM'lerin yeteneklerini ve sınırlamalarını araştırmak için sekiz temsili kıyaslama kullandı.

## Test İlkeleri ve Kuralları

Deneyde, araştırmacılar ChatGPT'yi çeşitli dil türlerine (sözlü, yazılı) serbestçe dönüştürülebilen (insan gibi davranan) bir kalıp tanıyıcı olarak kullandılar.Aynı zamanda ChatGPT, donanım mühendislerinin HDL aşaması.

Genel doğrulama süreci aşağıdaki şekilde gösterilmiştir:

Ayrıntılı olarak, önce donanım mühendisi büyük model için ilk ipuçlarını verir, bir Verilog modeli oluşturmasına izin verir ve ardından girdi ve çıktı hakkında belirli bilgiler sağlar. Son olarak, donanım mühendisi, temel tasarım özelliklerini karşılayıp karşılamadığını belirlemek için çıktı tasarımının görsel bir değerlendirmesini gerçekleştirir.

Bir tasarım teknik özellikleri karşılamıyorsa, aynı istemle beş kez daha oluşturulur. Yine de spesifikasyonu karşılamıyorsa, başarısız olur.

Tasarımlar ve test senaryoları yazıldıktan sonra Icarus Verilog (Verilog donanım tanımlama dili için uygulama araçlarından biri olan iverilog) ile derlenir. Derleme başarılı olursa, simülasyon gerçekleştirilir. Herhangi bir hata bildirilmezse, tasarım Geri Bildirim Gerekmez (NFN) durumundan geçer.

Bu işlemlerden herhangi biri tarafından hatalar rapor edilirse, bunlar modele geri beslenir ve "lütfen bir düzeltme sağlayın" istenir, bu, Araç Geri Bildirimi (TF) olarak bilinir. Aynı hata veya hata türü üç kez meydana gelirse, kullanıcı tarafından Basit İnsan Geri Bildirimi (SHF) verilir, genellikle Verilog'da hataya ne tür bir sorunun neden olduğu belirtilir (örn: bir ifadede sözdizimi hatası).

Hata devam ederse Orta Derecede İnsan Geri Bildirimi (MHF) verilir ve belirli hatayı tanımlamak için araca biraz daha doğrudan bilgi sağlanır.

Hata devam ederse, hatanın tam olarak nerede olduğunu ve nasıl düzeltileceğini belirlemeye dayanan Gelişmiş İnsan Geri Bildirimi (AHF) verilir.

Tasarım, başarısız test durumları olmadan derlenip simüle edildikten sonra başarılı kabul edilir.

Ancak üst düzey geri bildirim hatayı düzeltmezse veya kullanıcının hatayı çözmek için herhangi bir Verilog kodu yazması gerekirse, testin başarısız olduğu kabul edilir. Oturumun 25 iletiyi aşması ve 3 saat başına ChatGPT-4 iletilerinin OpenAI hız sınırını karşılaması halinde de test başarısız sayılır.

Bard ve HuggingChat, testin ilk turunda çöktü

Spesifik deneyde, araştırmacılar 8 bitlik bir kaydırma kaydı için bir kıyaslama testi gerçekleştirdiler.

Büyük modelden bir "test adı" için bir Verilog modeli oluşturmaya çalışmasını isterler, ardından giriş ve çıkış bağlantı noktalarını ve gereken diğer ayrıntıları tanımlayarak belirtimi sağlarlar ve ayrıca büyük modele "Bir tasarımı nasıl yazabilirim? bu özellikleri karşılıyor mu?"

Aynı zamanda, araştırmacılar doğrudan büyük modelin test tezgahının tasarımını oluşturmasına da izin veriyor:

Bu tasarım için bir Verilog testbench yazabilir misiniz? Testbench, kendi kendini test etme özelliklerine sahip olmalı ve simülasyon ve doğrulama için iverilog ile birlikte kullanılabilmelidir. Bir test senaryosu başarısız olursa, test tezgahı, hatanın bulunabilmesi ve çözülebilmesi için yeterli bilgiyi sağlayabilmelidir.

Ayrıca araştırmacılar, çıktı içeriğini ChatGPT-4, ChatGPT-3.5, Bard ve HuggingChat'in dört büyük modeline dayalı olarak elde ettiler:

Nihai sonuçlar, her iki ChatGPT modelinin de teknik özellikleri karşılayabildiğini gösterdi ve tasarım süreci başladı. Ancak Bard ve HuggingChat, spesifikasyonun ilk kriterlerini karşılayamadı.

Araştırmacılar, yukarıda belirtilen test sürecini takip etmelerine rağmen, büyük modelden Bard ve HuggingChat'ten gelen ilk istemlere dayanarak yanıtları beş kez daha yeniden oluşturmasını istediler, birçok turdan sonra her iki model de başarısız oldu. Bunlardan Bard, verilen tasarım spesifikasyonunu her zaman karşılayamaz ve HuggingChat'in Verilog çıktısı, modül tanımından sonra hatalı olmaya başlar.

Bard ve HuggingChat'in ilk sorgulama temel istemlerindeki düşük performansı göz önüne alındığında, araştırmacılar yalnızca ChatGPT-4 ve ChatGPT-3.5'te tam test yapmaya karar verdiler.

ChatGPT-4 ve ChatGPT-3.5 yarışması

Aşağıdaki şekil, ChatGPT-4 ve ChatGPT-3.5'in kıyaslama sonuçlarını göstermektedir. ChatGPT-3.5'in performansının ChatGPT-4'e göre biraz daha kötü olduğu açıktır. Konuşmaların tümü uyumsuzdur.

Buna karşılık, ChatGPT-4 daha da iyi performans gösterdi ve çoğu yalnızca araç geri bildirimi gerektiren karşılaştırmalı değerlendirmelerin çoğunu geçti. Bununla birlikte, test tezgahı tasarımında insan geri bildirimi hala gereklidir.

## ChatGPT-4, çipleri birlikte geliştirmek için donanım mühendisleriyle eşleştirilmiştir

LLM'nin potansiyelini keşfetmek için araştırmacılar ayrıca donanım tasarım mühendislerini ChatGPT-4 ile eşleştirerek 8 bitlik akümülatör tabanlı bir mikroişlemci tasarladılar.

ChatGPT-4 için ilk istem şuna benzer:

Gelin hep birlikte yepyeni bir mikroişlemci tasarımı yapalım... Bence kendimizi multi-byte komutları olmayan bir akümülatör 8-bit mimarisi ile sınırlamamız gerekiyor. Durum böyle olunca sizce nasıl başlamalıyız?

Alan kısıtlamaları göz önüne alındığında, araştırmacılar 32 bayt bellek (birleşik veriler ve talimatlar) kullanan von Neumann tipi bir tasarımı hedeflediler.

Nihayetinde ChatGPT-4, yeni bir 8 bitlik akümülatör tabanlı mikroişlemci mimarisi tasarlamak için donanım mühendisleriyle birlikte çalıştı. İşlemci, bir Skywater 130nm işlemi üzerine inşa edilmiştir, yani bu "Chip-Chats", tamamen yapay zeka tarafından yazılmış, dünyanın ilk bantlı HDL'si olduğuna inandığımız şeyi uygular.

GPT-4 tasarımı için akümülatör tabanlı veri yolu (insanlar tarafından çizilir)

Makalede, araştırmacılar ChatGPT-4'ün nispeten yüksek kaliteli kod ürettiği sonucuna vardılar, bu da kısa doğrulama geri dönüşünün kanıtladığı gibi. ChatGPT-4'ün 3 saatte 25 mesajlık hız limiti dikkate alındığında, bu tasarım için toplam süre bütçesi 22,8 saat ChatGPT-4'tür (yeniden başlatma dahil). Her mesajın gerçek üretimi ortalama 30 saniyeydi: hız sınırlaması olmadan, insan mühendise bağlı olarak tüm tasarım <100 dakikada tamamlanabilirdi. ChatGPT-4, Python birleştiricisini nispeten kolaylıkla oluştursa da, tasarımımız için yazılan programları yazmak zordu ve ChatGPT, herhangi bir önemli test programı yazmadı.

Genel olarak, araştırmacılar 24 talimatın tamamını, simülasyon ve FPGA simülasyonunda değerlendirilen, insanlar tarafından yazılan kapsamlı bir birleştirici program serisinde gerçekleştirdiler.

ChatGPT, çip geliştirme döngüsünden tasarruf sağlayabilir

NYU Tandon'da araştırma görevlisi ve araştırma ekibinin bir üyesi olan Dr. Hammond Pearce, "Bu araştırma, fiziksel çiplerin üretimi için tamamen yapay zeka tarafından üretilen ilk HDL olduğuna inandığımız şeyi üretti" dedi. "OpenAI'nin ChatGPT'si ve Google'ın Bard'ı gibi bazı yapay zeka modelleri, farklı programlama dillerinde yazılım kodu üretebilir, ancak bunların donanım tasarımındaki kullanımları geniş çapta incelenmemiştir. Bu çalışma, yapay zekanın donanım üretimine de fayda sağlayabileceğini gösteriyor, özellikle de gerektiğinde. tasarımı iyileştirmek için ileri geri gidebileceğiniz konuşmalarda kullanılır.”

Bununla birlikte, yol boyunca, araştırmacıların ayrıca çip tasarımı için yapay zeka kullanımına ilişkin güvenlik hususlarını daha fazla test etmesi ve ele alması gerekiyor.

Genel olarak, ChatGPT özellikle donanım alanına yönelik otomatik bir yazılım aracı olmasa da, bir EDA yardımcı aracı haline gelebilir ve EDA tasarımcılarının bilgi eşiğini büyük ölçüde azaltmasına yardımcı olabilir.

Araştırmacılar ayrıca, gerçek dünya ortamında uygulandığı takdirde, çip üretiminde LLM modellerinin kullanılmasının HDL dönüşümü sırasında insan hatasını azaltabileceğini, üretkenliği artırmaya yardımcı olabileceğini, tasarım süresini ve pazara sürme süresini kısaltabileceğini ve daha yaratıcı tasarımlara olanak tanıyabileceğini söylüyorlar. . Hatta sırf bunun için bile ChatGPT, donanım mühendisleri tarafından donanım alanında daha fazla girişim ve keşfe katılmak için kullanılmaya değer.

Daha ayrıntılı bir test süreci için şu makaleye bakın:

referans:

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin