Nvidia, yerli AI yongalarını engelliyor ve "Çin Özel Sürümü" "küçülen bir sürüm" haline geldi

Makale kaynağı: Titanium Media

Yazar: Lin Zhijia

Editör: Ma Jinnan

Bu makale ilk olarak Titanium Media APP'de yayınlanmıştır

Bu üç yeni Nvidia AI yongası, HGX H20'nin bant genişliği ve bilgi işlem hızı açısından sınırlı olduğu ve H20'nin fiyatının düşmesi beklenen "geliştirilmiş sürümler" değil, "küçültülmüş sürümler"dir, ancak yine de yerli AI yongası 910B'den daha yüksek olacaktır.

Görüntü kaynağı: Sınırsız Yapay Zeka tarafından oluşturulmuştur

10 Kasım'da, çip devi NVIDIA'nın (NVIDIA), Amerika Birleşik Devletleri'ndeki en son çip ihracat kontrollerine yanıt olarak Çin pazarı için H100'e dayalı üç AI çipi piyasaya süreceği bildirildi.

Spesifikasyon belgesine göre, Nvidia yakında Çinli müşterilere Nvidia'nın Hopper ve Ada Lovelace mimarilerini temel alan HGX H20, L20 PCle ve L2 PCle adlı yeni ürünler piyasaya sürecek. Spesifikasyonlara ve adlandırmaya bakılırsa, üç ürün eğitim, çıkarım ve uç senaryolara yöneliktir ve 16 Kasım'da duyurulacaktır, ürün numunesi teslim süresi bu yıl Kasım'dan Aralık'a kadardır ve seri üretim süresi bu yıl Aralık'tan gelecek yıl Ocak'a kadardır.

Titanium Media App, bir dizi NVIDIA endüstri zinciri şirketinden yukarıdaki haberin doğru olduğunu öğrendi.

Titanium Media App ayrıca NVIDIA'nın üç AI yongasının "geliştirilmiş sürümler" değil, "küçültülmüş sürümler" olduğunu özel olarak öğrendi. Teorik olarak, genel bilgi işlem gücü NVIDIA H100 GPU yongasınınkinden yaklaşık %80 daha düşüktür, yani H20, H100'ün kapsamlı bilgi işlem gücü performansının %20'sine eşittir ve HBM video belleği ve NVLink ara bağlantı modüllerinin eklenmesi, bilgi işlem gücünün maliyetini artırır. Bu nedenle, HGX H20'nin fiyatı H100'e göre düşecek olsa da, bu ürünün fiyatının yine de yerli AI çipi 910B'den daha yüksek olması bekleniyor.

"Bu, otoyol şeritlerini genişletmeye eşdeğerdir, ancak gişelerin girişi genişletilmemiştir, bu da trafiği sınırlar. Ayrıca teknik olarak, donanım ve yazılım kilidi sayesinde, çipin performansı hassas bir şekilde kontrol edilebilir ve donanım yükseltilse bile üretim hattını büyük ölçekte değiştirmeye gerek yoktur, performans yine de gerektiği gibi ayarlanabilir. Şu anda, yeni H20 kaynaktan 'sıkışmış' performansa sahip. Bir endüstri kaynağı, yeni H20 çipini şöyle açıkladı: "Örneğin, H100 ile bir görevi çalıştırmak 20 gün sürüyordu, ancak şimdi H20'nin tekrar çalışması 100 gün sürebilir." "

Amerika Birleşik Devletleri'nde yeni bir çip kısıtlaması turunun yayınlanmasına rağmen, Nvidia, Çin'in devasa AI bilgi işlem gücü pazarından vazgeçmiş görünmüyor.

Aynı zamanda 910B, bilgi işlem güç tüketimi ve ısınma açısından NVIDIA A100/H100 serisi ürünlerden çok daha yüksektir ve uzun vadeli akıllı bilgi işlem merkezlerinin model eğitim ihtiyaçlarını tam olarak karşılaması zor olan CUDA ile uyumlu değildir.

Şimdiye kadar, Nvidia bu konuda resmi olarak herhangi bir yorum yapmadı.

Bu yıl 17 Ekim'de ABD Ticaret Bakanlığı Sanayi ve Güvenlik Bürosu'nun (BIS) çipler için yeni ihracat kontrol düzenlemeleri yayınlayarak Nvidia'nın yüksek performanslı AI çipleri de dahil olmak üzere yarı iletken ürünlere yeni ihracat kontrolleri getirdiği ve kısıtlamaların 23 Ekim'de yürürlüğe girdiği bildirildi. Nvidia'nın ABD SEC'e yaptığı başvuru, hemen yürürlüğe giren yasaklı ürünlerin en güçlü AI yongaları olan A800, H800 ve L40S'yi içerdiğini gösteriyor.

Ek olarak, L40 ve RTX 4090 işlemciler orijinal 30 günlük pencereyi korur.

31 Ekim'de Nvidia'nın 5 milyar dolar değerindeki gelişmiş çip siparişini iptal etmek zorunda kalabileceği haberi geldi ve Nvidia'nın hisse senedi fiyatı haberler nedeniyle keskin bir şekilde düştü. Daha önce, Nvidia'nın yalnızca Çin için tedarik ettiği A800 ve H800, Amerika Birleşik Devletleri'ndeki yeni düzenlemeler nedeniyle Çin pazarında normal şekilde satılamıyordu ve bu iki yongaya A100 ve H100'ün "hadım edilmiş versiyonları" deniyordu ve Nvidia, Amerika Birleşik Devletleri'ndeki önceki düzenlemelere uymak için yonganın performansını düşürdü.

31 Ekim'de, Çin Uluslararası Ticareti Teşvik Konseyi sözcüsü Zhang Xin, ABD tarafından Çin'e yarı iletkenler için yeni yayınlanan ihracat kontrol kurallarının, yapay zeka ile ilgili çiplerin ve yarı iletken üretim ekipmanlarının Çin'e ihracatı üzerindeki kısıtlamaları daha da sıkılaştırdığını ve bir dizi Çinli kuruluşu ihracat kontrolünün "varlık listesine" dahil ettiğini söyledi. Amerika Birleşik Devletleri'nin bu önlemleri, piyasa ekonomisi ilkelerini ve uluslararası ekonomik ve ticari kuralları ciddi şekilde ihlal etti ve küresel yarı iletken tedarik zincirinin yırtılma ve parçalanma riskini artırdı. Amerika Birleşik Devletleri tarafından 2022'nin ikinci yarısından itibaren uygulanan Çin'e çip ihracatı yasağı, küresel arz ve talebi derinden değiştiriyor, 2023'te çip arzında dengesizliğe neden oluyor, dünya çip endüstrisinin modelini etkiliyor ve Çinli şirketler de dahil olmak üzere çeşitli ülkelerdeki işletmelerin çıkarlarına zarar veriyor.

NVIDIA HGX H20, L20, L2 ve diğer ürünlerin performans parametrelerinin karşılaştırılması

Titanium Media App, yeni HGX H20, L20 ve L2 AI çip ürünlerinin sırasıyla NVIDIA'nın bulut eğitimi, bulut çıkarımı ve uç çıkarımı için uygun olan Hopper ve Ada mimarilerine dayandığını öğrendi.

Bunlar arasında, son iki L20 ve L2 AI çıkarım ürünü benzer "yerli ikame" ve CUDA uyumlu çözümlere sahipken, HGX H20, esas olarak A100/H800'ün yerini alan, ürün yazılımı kastrasyonu ile H100 ve AI eğitim çipi ürünlerine dayanmaktadır.

Belgelere göre, yeni H20, CoWoS gelişmiş paketleme teknolojisine sahip ve 96 GB'a bir HBM3 (yüksek performanslı bellek) ekliyor, ancak maliyet de 240 ABD doları artıyor; H20'nin FP16 yoğun bilgi işlem gücü, H100'ün bilgi işlem gücünün yaklaşık %15'i olan 148TFLOPS'a (saniyede trilyon kayan nokta işlemi) ulaşır, bu nedenle ek algoritma ve personel maliyetleri eklemesi gerekir; NVLink, 400 GB/sn'den 900 GB/sn'ye yükseltildi s, bu nedenle ara bağlantı oranı büyük ölçüde yükseltilecektir.

Değerlendirmeye göre, H100/H800, bilgi işlem gücü kümelerinin ana uygulama şemasıdır. Bunlar arasında H100'ün teorik limiti 50.000 kart ve maksimum bilgi işlem gücü 100.000 P, H800'ün maksimum uygulama kümesi 20.000-30.000 kart, toplam 40.000 P bilgi işlem gücü ve A100'ün maksimum uygulama kümesi 16.000 kart ve maksimum bilgi işlem gücü 9600P'dir.

Bununla birlikte, yeni H20 yongasının teorik sınırı 50.000 karttır, ancak her kartın bilgi işlem gücü 0.148P'dir ve toplam bilgi işlem gücü, H100 / H800 ve A100'den daha düşük olan yaklaşık 7400P'dir. Bu nedenle, H20 kümesinin ölçeği H100'ün teorik ölçeğinden uzaktır ve bilgi işlem gücü ve iletişim dengesi tahminine dayanarak, makul medyan genel bilgi işlem gücü yaklaşık 3000P'dir ve 100 milyar seviyeli parametre modelinin eğitimini tamamlamak için daha fazla maliyet ve daha fazla bilgi işlem gücü eklenmesi gerekir.

İki yarı iletken endüstrisi uzmanı, Titanium Media App'e, mevcut performans parametrelerinin tahminine dayanarak, Nvidia B100 GPU ürünlerinin gelecek yıl Çin pazarına satılmayacağının çok muhtemel olduğunu söyledi.

Genel olarak, büyük model şirketleri GPT-4 gibi parametrelerle büyük model eğitimi yapmak istiyorsa, bilgi işlem gücü kümelerinin ölçeği çekirdektir ve şu anda yalnızca H800 ve H100 büyük model eğitimi için yetkin olabilirken, yerli 910B'nin performansı A100 ile H100 arasındadır ve bu sadece "son çare yedek seçimidir".

Şimdi Nvidia tarafından piyasaya sürülen yeni H20, trilyon seviyesindeki büyük modellerin eğitim ihtiyaçlarını karşılayamayan dikey model eğitimi ve çıkarımı için daha uygundur, ancak genel performans, NVIDIA'nın CUDA ekolojisi ile birleştiğinde 910B'ninkinden biraz daha yüksektir, bu nedenle ABD çip kısıtlama emri altında gelecekte Çin'in AI çip pazarındaki yerli kartlar için tek seçim yolunu engelliyor.

En son mali rapora göre, 30 Temmuz'da sona eren çeyrekte, Nvidia'nın 13,5 milyar dolarlık satışlarının %85'inden fazlası Amerika Birleşik Devletleri ve Çin'den geldi ve satışların yalnızca yaklaşık %14'ü diğer ülke ve bölgelerden geldi.

H20 haberlerinden etkilenen Nvidia'nın hisse senedi fiyatı, 9 Kasım'da ABD borsasının kapanışı itibariyle %0,81 oranında hafif bir artışla hisse başına 469,5 dolardan kapandı. Son beş işlem gününde Nvidia, en son piyasa değeri 1,16 trilyon dolar ile %10'dan fazla arttı.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)