Çin'de, Pekin ve Guangdong'da yoğunlaşan, 1 milyardan fazla parametreye sahip 79 büyük ölçekli model piyasaya sürüldü.

Kaynak: Kağıt

Muhabir Zhang Jing

Eksik istatistiklere göre, şu anda Çin'de 1 milyardan fazla parametre ölçeğine sahip 79 büyük ölçekli model piyasaya sürüldü ve 14 il/bölge, çoğunlukla Pekin'de yoğunlaşan büyük ölçekli modellerin araştırma ve geliştirmesini yürütüyor. Guangdong, Pekin'de 38 büyük ölçekli model ve Guangdong büyük modelinde 20 model. Çin'deki büyük modellerin yarısından fazlası açık kaynaklıdır ve üniversiteler/bilimsel araştırma kurumları açık kaynağın ana gücüdür.

·Pekin, Jiangsu, Guangdong, Şanghay, vb. nispeten büyük ölçekli model yeteneklerine sahip bölgelerdir ve büyük ölçekli model araştırma ve geliştirme için temel entelektüel destek sağlar. Bununla birlikte, toplam yetenek miktarı hala azdır.Büyük ölçekli modeller yüksek bir eşiğe sahiptir ve yüksek kaliteli AI yetenekleri gerektirir.Şu anda, çeşitli yerlerde büyük ölçekli model yeteneklerin sayısı yetersizdir.

Resim kaynağı: Unbounded AI aracı tarafından oluşturulmuştur

Çin'de, çoğunlukla Pekin ve Guangdong'da yoğunlaşan, 1 milyardan fazla parametreye sahip 79 büyük ölçekli model var.

28 Mayıs'ta, 2023 Zhongguancun Forumu'nun paralel forumlarından biri olan Yapay Zeka Büyük Model Geliştirme Forumu'nda, Çin Bilimsel ve Teknolojik Bilgi Enstitüsü müdürü Zhao Zhiyun, "Çin'in Yapay Zeka Büyük Model Haritası Üzerine Araştırma Raporunu" yayınladı. ". Şu anda, Çin'in 1 milyardan fazla parametre ölçeğinde, Pekin'de 38 büyük ölçekli model ve Guangdong'da 20 büyük ölçekli model dahil olmak üzere, başta Pekin ve Guangdong'da olmak üzere 79 büyük ölçekli model piyasaya sürüldü. Çin'deki büyük modellerin yarısından fazlası açık kaynaklıdır ve üniversiteler/bilimsel araştırma kurumları açık kaynağın ana gücüdür.

Google tarafından 2017'de piyasaya sürülen Transformer ağ yapısı, büyük modellerin geliştirilmesi için kaynak teknolojidir. O zamandan beri büyük model teknolojisi, doğal dil anlama, bilgisayarla görme ve akıllı konuşmada ikonik teknolojik atılımlar gerçekleştirdi. Genelleme yeteneği ve diğer yönler elde edildi. sıçrama geliştirme. ChatGPT, büyük dil modellerinin hızla ortaya çıkmasını daha da teşvik etti ve ayrıca çok sayıda Ar-Ge ekibini genel görüş ve çok modluluk gibi daha büyük modellerin geliştirilmesine yatırım yapmaya çekti. Zhao Zhiyun, beş yılı aşkın bir süre içinde, büyük ölçekli model teknolojisinin büyük bir teknoloji grubu oluşturduğunu ve çeşitli parametre ölçeklerini, çeşitli teknik mimarileri, çeşitli modları ve çeşitli senaryoları kapsayan büyük ölçekli bir model ailesini türettiğini söyledi.

Küresel büyük ölçekli modellerin gelişme trendinden yola çıkarak, Amerika Birleşik Devletleri'ndeki Google ve OpenAI gibi kuruluşlar büyük ölçekli model teknolojisinde ön saflarda yer almaya devam ediyor ve Avrupa, Rusya, İsrail vb. ayrıca büyük ölçekli modellerin araştırılmasına ve geliştirilmesine yatırım yapıyor. Dünya çapında piyasaya sürülen büyük ölçekli modellerin dağılımına bakılırsa, Çin ve Amerika Birleşik Devletleri küresel toplamın %80'inden fazlasını oluşturarak büyük bir farkla başı çekiyor. büyük ölçekli modellerin sayısı Eşzamanlı büyüme eğilimi.

Çin'deki büyük modellerin gelişme trendinde Zhao Zhiyun, eksik istatistiklere göre Çin'de şimdiye kadar 1 milyardan fazla parametre ölçeğine sahip 79 büyük modelin piyasaya sürüldüğünü ve 14 il/bölgenin araştırma ve geliştirme yürüttüğünü söyledi. Pekin'de 38 büyük model ve Guangdong'da 20 büyük model dahil olmak üzere başlıca Pekin ve Guangdong'da olmak üzere büyük modellerin sayısı. Model etki alanı dağılımı açısından, doğal dil işleme, büyük ölçekli model araştırma ve geliştirme için hala en aktif odak alanıdır, ardından çok modlu alanlar gelir ve bilgisayar görüşü ve akıllı ses alanlarında hala daha az sayıda büyük ölçekli model vardır. Araştırma ve geliştirme konularının dağılımı açısından, üniversiteler, bilimsel araştırma kurumları ve işletmeler gibi farklı inovasyon konularının tümü büyük modellerin araştırma ve geliştirmesine katılmaktadır ve akademi ile sanayi arasındaki ortak araştırma ve geliştirme hala yetersizdir. "Bu yılın başından beri büyük modeller hızla gelişiyor, ancak aynı zamanda küçülen bir işbirliği eğilimi de gözlemliyoruz ve bundan sonra dikkat etmemiz gerekiyor."

Aynı zamanda, bilgi işlem gücü modeli eşleştirme derecesi yüksektir ve genel bilgi işlem gücü hızla gelişmektedir. Pekin, Guangdong, Zhejiang, Şanghay ve diğer yerler en fazla sayıda büyük modele sahiptir ve bu dört yer aynı zamanda son üç yılda en fazla yapay zeka sunucusu satın alan bölgelerdir. Yerellikler ayrıca, halka açık bilgi işlem gücü sağlayarak ve büyük ölçekli model araştırma ve geliştirme için daha fazla bilgi işlem gücü desteği sağlayarak yapay zeka bilgi işlem gücüne yönelik hızla artan talebi tamamlıyor.

Yetenek aynı zamanda yapay zekanın önemli bir ayağıdır. Pekin, Jiangsu, Guangdong, Şanghay, vb. nispeten çok sayıda büyük ölçekli model yeteneğine sahip bölgelerdir ve büyük ölçekli model araştırma ve geliştirme için temel entelektüel destek sağlar. Bununla birlikte, toplam yetenek miktarı hala azdır.Büyük ölçekli modeller yüksek bir eşiğe sahiptir ve yüksek kaliteli AI yetenekleri gerektirir.Şu anda, çeşitli yerlerde büyük ölçekli model yeteneklerin sayısı yetersizdir.

"Büyük model makalelerin yayınlanmasıyla, Çin'in büyük modelinin akademik etkisinin yavaş yavaş şekillendiğini görebiliriz. Bölgesel etki açısından Pekin, Guangdong ve Şanghay, makale sayısı açısından ülkedeki en yüksek ülkelerdir. Zhao Zhiyun, Tsinghua Üniversitesi, Ali ve Baidu tarafından ortaklaşa geliştirilen CogView model makalesinin en yüksek alıntı sayısına sahip olduğunu söyledi. Ancak, önde gelen yabancı büyük modellerin akademik etkisiyle karşılaştırıldığında, hala büyük bir boşluk var.

Açık kaynak inovasyon ekolojisi açısından, Çin'deki büyük modellerin yarısından fazlası açık kaynaklıdır ve Pekin, Guangdong ve Şangay, açık kaynağın sayısı ve etkisi bakımından ülkedeki ilk üç ülke arasındadır. Üniversiteler/bilimsel araştırma kurumları, açık kaynağın ana güçleridir.Zhao Zhiyun, "Tsinghua Üniversitesi'nden ChatGLM-6B, Fudan Üniversitesi'nden MOSS ve Baidu'nun Wenxin serisi büyük ölçekli modelleri, açık kaynak üzerinde en yüksek etkiye sahip" dedi.

Çin büyük ölçekli modellerinin endüstriyel uygulaması iki yol boyunca gelişir: Birincisi, genel amaçlı büyük ölçekli modellerin uygulama alanının sürekli genişlemesidir.Büyük ölçekli model, sektörler arası bir genel yapay zeka oluşturmak için hızla gelişmektedir. yetenek platformu ve uygulama endüstrisi, ofis, yaşam ve eğlenceden tıbbi bakım, endüstri ve eğitime penetrasyonunu hızlandırıyor. İkincisi, profesyonel büyük ölçekli modellerin dikey alanlarda sürekli olarak derinleştirilmesidir.Biyotıp ve uzaktan algılama meteorolojisi gibi dikey alanlar için bir grup profesyonel büyük ölçekli model, alandaki derin avantajlarından tam anlamıyla yararlanır ve yüksek kaliteli profesyonel hizmetler sunar. özel iş senaryoları için çözümler.

Kaynakların ve araştırma ve geliştirme güçlerinin genel planlamasını güçlendirmeyi ve büyük modellerin düzenli gelişimini desteklemeyi savunun.

Büyük modellerin gelişme eksikliği göz önüne alındığında, Zhao Zhiyun 4 öneri ve beklenti ortaya koydu:

Birincisi, büyük modellerin düzenli bir şekilde geliştirilmesini teşvik etmek için kaynakların genel planlamasını ve araştırma ve geliştirme güçlerini güçlendirmektir. Akıllı bilgi işlem merkezleri, süper bilgi işlem merkezleri ve bulut bilgi işlem merkezleri gibi bilgi işlem kaynaklarının genel planlamasını güçlendirerek, genel veri paylaşım kataloglarını ve paylaşım kurallarını formüle edin ve veri sınıflandırmasının ve sınıflandırmasının düzenli bir şekilde açılmasını teşvik edin.

İkincisi, temel araştırma ve teknolojik yeniliği hızlandırmak ve akademik ve açık kaynak etkisini artırmaktır. Büyük ölçekli model teknolojisi, gelişimin ilk aşamalarındadır ve temel teori ve teknolojik yenilik için büyük bir potansiyel vardır. Damıtma ve kantifikasyon gibi minyatürleştirme teknikleriyle, model "zayıflaştırılır" ve büyük modellerin minyatürleştirilmesi ve yeşil gelişimi için teknik destek sağlanır. Sanayi-üniversite-araştırma işbirliğinin daha da güçlendirilmesi ve büyük modellerin açık kaynak kullanımının teşvik edilmesi, büyük modellerin teknolojik ilerlemesini de hızlandıracaktır.

Üçüncüsü, sahnenin büyük modellerin geliştirilmesindeki öncü rolünü güçlendirmek ve büyük modeller için bir kıyaslama projesi oluşturmaktır. Sektöre özgü eğitim veri kümelerine dayalı olarak finans, tıbbi bakım ve elektrik gücü alanlarında profesyonel büyük modeller oluşturun ve belirli iş senaryolarında yüksek kaliteli uygulama atılımları gerçekleştirin. uygulama senaryoları ve uygulama verileri aracılığıyla teknoloji.

Dördüncüsü, uluslararası işbirliğini güçlendirmek ve küresel yapay zeka yönetişimine aktif olarak katılmak. Sorumlu bir tavırla büyük modellerin yönetişimini ortaklaşa teşvik edin ve yapay zekanın yönetişim ilkelerinin ve etik normlarının tüm büyük modeller zincirinde kök salmasını umun. Aynı zamanda, artan fikir birliği temelinde yapay zeka yönetişimi konusunda küresel işbirliğini güçlendirin.

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin