AI Yeni İstihbarat Çemberi丨Günlük Okunmalı: Nvidia B100 AI çipi gelecek yıl piyasaya sürülecek, Alibaba Intelligent Information Business Group kuark büyük modelini piyasaya sürdü

2023-11-14 09:46:26

Özet: Alibaba Akıllı Bilgi İş Grubu, genel arama, tıp ve sağlık, eğitim ve öğrenme, işyeri ofisi ve diğer senaryolara uygulanacak tam yığın, kendi geliştirdiği, 100 milyar seviyeli parametreli kuark büyük modelini resmi olarak yayınladı. Nvidia kısa süre önce, 2024'te piyasaya sürülen Blackwell mimarisi B100 GPU'nun GPT-3 175B çıkarım performansı kıyaslamaları açısından A100, H100 ve H200'ü geçeceğini ve AI performans performansının Hopper mimarisi H200 GPU'nun iki katından fazla olacağını açıkladı.

Görüntü kaynağı: Sınırsız Yapay Zeka tarafından oluşturulmuştur

Sıcak Haberler:

NVIDIA: B100 gelecek yıl piyasaya sürülecek, yapay zeka performansı H200'ün iki katından fazla

"Science and Technology Innovation Board Daily" tarafından 14 Kasım'da yayınlanan bir rapora göre, Nvidia kısa süre önce 2024'te piyasaya sürülen Blackwell mimarisi B100 GPU'nun GPT-3 175B çıkarım performansı kıyaslaması açısından A100, H100 ve H200'ü geçeceğini ve AI performans performansının Hopper mimarisi H200 GPU'nun iki katından fazla olacağını açıkladı. Piyasa, Nvidia'nın TSMC'yi 3nm işlemle OEM Blackwell GPU'lara emanet etmesini bekliyor ve Nvidia, üretim süresini 2024'ün 2. çeyreğine kadar ilerletmeyi planlıyor. Blackwell GPU, NVIDIA'nın yongalarla tasarlanmış ilk HPC/AI hızlandırıcısı olacak.

Alibaba Akıllı Bilgi İş Grubu, 100 Milyar Parametreli Quark Büyük Modelini Piyasaya Sürdü

Financial Associated Press'in 14 Kasım'da yayınladığı bir rapora göre, Alibaba'nın akıllı bilgi iş grubu, genel arama, tıbbi sağlık, eğitim ve öğrenim, işyeri ofisi ve diğer senaryolara uygulanacak tam yığın, kendi geliştirdiği, 100 milyar seviyeli parametreli bir kuark büyük modelini resmi olarak yayınladı ve kuark uygulaması da bu büyük modelin yardımıyla tamamen yükseltilecek.

OpenAI CEO'su: Yeni nesil yapay zeka modeli GPT-5 zaten eğitimde ve daha fazla veriye ihtiyaç duyuyor

AI New Intelligence tarafından 14 Kasım'da yayınlanan bir rapora göre, OpenAI CEO'su Sam Altman kısa süre önce FT ile yaptığı röportajda OpenAI'nin sonraki adımlarından daha fazlasını açıkladı. Altman, şirketin yeni nesil yapay zeka modeli GPT-5'i geliştirdiğini söyledi. Ancak programı yayınlamayı taahhüt etmedi. Altman, bunun eğitilmesi için daha fazla veri gerektireceğini ve bunun da internetteki halka açık veri kümelerinden ve şirketin tescilli verilerinden geleceğini söylüyor. OpenAI kısa süre önce büyük ölçekli veri kümeleri, özellikle de "bugün internette herkese açık ve kolayca erişilemeyen", özellikle uzun biçimli yazılar veya herhangi bir formattaki konuşmalar için bir çağrı yayınladı.

Altman ayrıca, modellerini eğitmek için OpenAI'nin diğer birçok büyük AI şirketi gibi Nvidia'nın gelişmiş H100 yongalarını kullandığını söyledi. Nvidia'nın çip kıtlığı nedeniyle bu yıl "ciddi gerilimler" yaşandığını belirtti. Ancak Google, Microsoft, AMD ve Intel gibi diğer şirketler rakip yapay zeka çiplerini piyasaya sürmeye hazırlanırken, Nvidia'ya olan güven uzun sürmeyebilir.

Buna ek olarak, OpenAI'nin tüketici başarısına rağmen Altman, şirketin yapay genel zeka oluşturma yolunda ilerleme kaydetmeye çalıştığını söyledi. ChatGPT'nin temelini oluşturan modeller olan büyük dil modellerinin (LLM'ler) "AGI oluşturmanın temel parçalarından biri olduğunu, ancak bunun üzerinde başka birçok parça olduğunu" savunuyor. Ayrıca, Google DeepMind gibi şirketlerin göz ardı ettiğine inandığı bir faktör olan bilgi sıkıştırma olarak dilin önemini vurguladı.

Google ve UC Berkeley, tek bir adımda fotogerçekçi görüntüler oluşturabilen yeni bir üretken yapay zeka yaklaşımı olan "Idempotent Generative Network"ü başlattı

IT House tarafından 14 Kasım'da yayınlanan bir rapora göre, Google kısa süre önce Kaliforniya Üniversitesi, Berkeley (UC Berkeley) ile birlikte çalışarak difüzyon modellerinin yerini alabilecek "Idempotent Generative Network (IGN)" adlı yeni bir üretken yapay zeka yöntemi geliştirdi.

OpenAI tarafından bu yıl Mart ayında yayınlanan üretken çekişmeli ağlar (GAN'lar), difüzyon modelleri ve Tutarlılık Modelleri dahil olmak üzere, mevcut ana akım üretken yapay zeka modelleri, belirli bir hedef veri dağılımına karşılık gelen çıktılara (genellikle doğal görüntüler) eşlenen rastgele gürültü, eskizler veya düşük çözünürlüklü veya başka şekilde bozuk görüntüler gibi girdilerle oluşturulur. Bir difüzyon modeli söz konusu olduğunda, hedef veri dağılımı eğitim sırasında öğrenilir ve ardından birden fazla adımda "gürültüden arındırılmış" gerçekleştirilir.

Google araştırma ekibi, ideal olarak tek bir adımda, herhangi bir girdi biçiminden uygun bir görüntü oluşturmak için Idempotent Generation Network (IGN) adlı yeni bir üretken model geliştirdi. Model, mevcut diğer model algoritmalarından farklı olarak, herhangi bir girdi verisini hedef veri dağıtımına yansıtan ve belirli bir girdi ile sınırlı olmayan bir tür "küresel projektör" olarak düşünülebilir.

Kai-Fu Lee'nin yapay zeka şirketi "Zero One Everything" açık kaynaklı Yi büyük modeli, LLaMA'yı intihal etmekle suçlanıyor

14 Kasım'da IT Home'a göre, Sinovation Works'ün başkanı ve CEO'su Kai-Fu Lee, bu yıl iki açık kaynaklı büyük model olan Yi-34 B ve Yi-6 B'yi piyasaya süren AI büyük model başlangıç şirketi "Zero One Everything"i kurdu. Bununla birlikte, Yi-34 B'nin Hugging Face açık kaynaklı ana sayfasında geliştirici ehartford, modelin Meta LLaMA'nın mimarisini kullandığını ve yalnızca iki tensör adının değiştirildiğini, input_layernorm ve post_attention_layernorm olduğunu sorguladı.

Buna ek olarak, Alibaba'nın eski baş AI bilim adamı Jia Yangqing'in bugün internette dolaşan bir arkadaş çevresi var ve "büyük bir yerli üreticinin yeni modelinin tam olarak LLaMA'nın mimarisi olduğunu, ancak farkı temsil etmek için koddaki isimlendirmenin LLaMA'dan adlarına değiştirildiğini ve ardından birkaç değişkenin adını değiştirdiğini" söylüyor.

Zero One Thing Tartışmalara Yanıt Veriyor: Geliştirilen büyük model, GPT'nin olgun yapısına dayanmaktadır ve modelin anlaşılması ve eğitimi konusunda birçok çalışma yapılmıştır

Science and Technology Innovation Board Daily tarafından 14 Kasım'da yayınlanan bir rapora göre, Kai-Fu Lee'nin yapay zeka şirketi Zero One Everything açık kaynak modeli, LLaMA mimarisini tamamen kullanmak ve yalnızca iki tensörün isimlerini değiştirmekle suçlandı. Bu bağlamda, Zero One Everything şunları söyledi: GPT, endüstri tarafından tanınan olgun bir mimaridir ve Llama bunu GPT'de özetledi. Ar-Ge modelinin yapısal tasarımı, GPT'nin olgun yapısına dayanmaktadır ve endüstrinin en iyi kamu başarılarından yararlanmaktadır, çünkü büyük model teknolojisinin gelişimi hala çok erken aşamadadır, endüstrinin ana akımıyla tutarlı olan yapı, genel adaptasyon ve gelecekteki yineleme için daha elverişlidir. Aynı zamanda, 0100000 World ekibi, modellerin anlaşılması ve eğitim konusunda çok fazla çalışma yaptı ve ayrıca model yapısı düzeyinde temel atılımları keşfetmeye devam ediyor.

** Miao Ya kamerasının ürün başkanı Zhang Yueguang istifa etti ve İnternet ünlüsü AI uygulamalarının popülaritesi soğudu **

Tech Planet'in 13 Kasım'da yayınladığı bir rapora göre, Ali Da Entertainment'a bağlı Miao Ya kamera ürününün başkanı Zhang Yueguang görevinden ayrıldı ve Alipay'in Bahar Şenliği "Jiwufu" ve "Xiuyixi" projelerinin planlanmasına katıldı ve Byte, Ali ve diğer şirketlerde çalıştı.

Miao Ya kamera, yüzleri içeren 20'den fazla fotoğraf yüklediğiniz, 9.9 yuan ödediğiniz ve ardından istediğiniz şablonu ve şekli seçtiğiniz sürece, C-end seviyesinde çemberin dışında olan bir AIGC ürünüdür, bir fotoğraf çalışması elde etmek için kendi "dijital klonunuzu" yapabilirsiniz. Miao Ya kamera, bir süre uygulama ürünleri listesine "hakim oldu", ancak sonraki sıralama tamamen düştü. 13 Kasım itibariyle, Qimai'den gelen en son veriler, Miao Ya Camera'nın iOS "sosyal" listesinin 64. sırada olduğunu gösteriyor. Şu anda, AIGC ürünleri için uzun vadeli bir talebin nasıl oluşturulacağı, pazar düzeyinde zor bir sorun haline gelmiştir.

Yapay zeka girişimi Silo AI, Avrupa için AB'de 24 dili kapsayan açık kaynaklı dil modeli "Poro"yu başlattı

VentureBeat'in bildirdiğine göre, Finlandiya'nın Helsinki kentinde bulunan bir yapay zeka girişimi olan Silo AI, bu hafta Avrupa dillerinin çok dilli AI yeteneklerini artırmayı amaçlayan yeni bir açık kaynaklı büyük dil modeli "Poro" yayınladı. Poro, sonunda Avrupa Birliği'nin 24 resmi dilinin tümünü kapsayan plandaki ilk açık kaynaklı modeldir. Modeller, Silo AI'nın SiloGen Üretken Yapay Zeka Birimi ve Turku Üniversitesi'ndeki TurkuNLP araştırma grubu tarafından geliştirildi.

34,2 milyar parametre ile Poro 34B modeli, adını Fince "ren geyiği" kelimesinden almıştır. İngilizce, Fince ve Python ve Java gibi programlama dillerini kapsayan 21 trilyon tokenlik çok dilli bir veri kümesinin bir bölümü üzerinde eğitildi.

Silo AI CEO'su Peter Sarlin, Poro'nun Avrupa'daki Fince gibi düşük kaynaklı diller için üstün performansla eğitimin temel zorluğunu çözmek için tasarlandığını söyledi. Modeller, diller arası eğitim yöntemlerinden yararlanarak, İngilizce gibi yüksek kaynaklara sahip dillerden gelen verilerden yararlanabilir.

Rakuten Group, Rakuten AI for Business Platformunu Başlatmak için OpenAI ile Ortaklık Kuruyor

14 Kasım'da Rakuten Group, OpenAI ile stratejik bir işbirliği duyurdu ve yeni bir yapay zeka platformu olan Rakuten AI for Business'ı başlattı. Platformun pazarlama, satış, müşteri desteği, operasyonlar, stratejik planlama ve mühendislik dahil olmak üzere çeşitli temel iş işlevlerini desteklediği ve şu anda yalnızca davetle kullanılabildiği ve 2024 ve sonrasında hizmet kapsamını genişletme planları olduğu bildiriliyor.

Araştırma: Yapay zeka şirketleri eğitim verilerinin tükenmesi kriziyle karşı karşıya, yüksek kaliteli veriler 2026 yılına kadar tükenecek

Avustralya'daki Macquarie Üniversitesi'nde bilgi teknolojisi hukuku profesörü olan Rita Matulionyte, The Conversation dergisindeki bir makalede, Webmaster's House tarafından 14 Kasım'da bildirildiği üzere, AI araştırmacılarının yaklaşık bir yıldır veri arzı kıtlığı konusunda alarm verdiğini belirtti. Epoch AI'nın yapay zeka tahmin grubu tarafından geçen yıl yapılan bir araştırmaya göre, AI şirketlerinin yüksek kaliteli metin eğitimi verileri 2026 yılına kadar tükenebilirken, düşük kaliteli metin ve görüntü verileri 2030 ile 2060 arasında tükenebilir.

Veriye aç yapay zeka şirketleri için, yapay zeka modelleri tarafından oluşturulan sentetik verilerle eğitim almak uygun bir çözüm olmayabilir. Araştırmalar, bir yapay zeka modelini yapay zeka tarafından oluşturulan içeriği kullanacak şekilde eğitmenin, modelde içsel bir deformite etkisine yol açarak çıktıyı kafa karıştırıcı ve tuhaf hale getirebileceğini göstermiştir. Bu potansiyel sorunla karşı karşıya kalındığında, büyük ölçekli insan içerik çiftlikleri olmadıkça, çözüm veri ortaklıklarında yatıyor olabilir. Bu, bol miktarda yüksek kaliteli veriye sahip şirketlerin veya kurumların, para karşılığında veri alışverişi yapmak için AI şirketleriyle anlaşmalar yaptığı anlamına gelir.

Vietnamlı teknoloji tek boynuzlu atı VNG, ChatGPT benzeri yapay zeka hizmetini başlatmayı planlıyor

Vietnamlı oyun girişimi VNG, Nikkei Asia tarafından 14 Kasım'da bildirildiği üzere, Vietnamca konuşan kullanıcılar için özel olarak tasarlanmış ChatGPT benzeri bir yapay zeka hizmeti başlatmayı planlıyor. Tencent ve Alibaba'nın Ant Financial Group tarafından desteklenen teknoloji tek boynuzlu atı, kendi pazarında Facebook'tan daha popüler olan bir sohbet uygulamasına sahip ve yakın zamanda bir çeviri özelliği ekledi. VNG, bir sonraki adımın, kullanıcıların e-posta oluşturmaktan sorgulara yanıt bulmaya kadar her şeyi yapmasına olanak tanıyan yapay zeka tarafından oluşturulan yetenekler eklemek olacağını söylüyor.

Kaynaklar, OpenAI'nin Google'ın yapay zeka yeteneğini 10 milyon dolarlık bir tazminat paketiyle kaçırmaya çalıştığını söylüyor

The Information'a atıfta bulunan IT House'a göre, OpenAI, multi-milyon dolarlık tazminat paketleriyle Google'ın en iyi araştırmacılarından bazılarını ve testleri çalıştırmak için AI hızlandırıcı çipleri gibi birinci sınıf teknoloji kaynaklarını çeken Google ile yetenek savaşı içinde.

AIGC Önerilen Okuma:

"En güçlü model eğitim çipi H200 piyasaya sürüldü!141G geniş bellek, %90'a varan AI çıkarımı, H100 ile de uyumlu"

Nvidia Lao Huang, yeni nesil GPU yongalarıH200 ile bir kez daha patlama yaptı. Resmi web sitesi belirsiz bir şekilde "Yapay zeka ve süper bilgi işlem için oluşturulmuş dünyanın en güçlü GPU'su" dedi. Tüm AI şirketlerinin bellek eksikliğinden şikayet ettiğini duydum? Bu sefer, büyük bellek doğrudan 141GB, bu da H100'ün 80GB'ına kıyasla doğrudan %76 arttı. HBM3e bellekle donatılan ilk GPU olarak, bellek bant genişliği de %43'lük bir artışla 3,35 TB/sn'den 4,8 TB/sn'ye yükseltildi. Yapay zeka için ne anlama geliyor?

"Musk'ın ChatGPT'si "Grok", nasıl çalışır?

Şu anda, Grok hala erken beta sürümündedir ve yalnızca Amerika Birleşik Devletleri'ndeki az sayıda kullanıcı tarafından kullanılabilir ve katılmak isteyenler xAI web sitesi aracılığıyla da başvurabilirler, ancak yakın gelecekte Grok, X platformundaki tüm "X Premium+" kullanıcıları tarafından kullanılabilir. Peki, ChatGPT gibi yapay zeka asistanlarına kıyasla Grok'u bu kadar özel kılan nedir?

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Reward
like
Comment
Repost
Share

Comment

0/400

No comments

Topic
#Gate Initial Listing WLFI
9k Popularity
#Will Crypto Market Break Out in September?
11k Popularity
#Are You Bullish or Bearish Today?
11k Popularity
#GUSD Now Live on Gate
45k Popularity
#Gate Alpha XLAB Points Airdrop
412 Popularity

Sitemap