Büyük model 2.0'a geldiğinde hangi optimizasyonlar ve atılımlar yapılacak?

Orijinal metin: The Paper, yazar: Che Xingyun

Görsel kaynağı: Unbounded AI‌ tarafından oluşturuldu

Bu yılın Haziran ayında, büyük üreticiler ChatGPT benzeri ürünlerini yükselttiler. 9 Haziran'da Xunfei, Xinghuo Cognitive Big Model'in yükseltilmiş bir sürümünü piyasaya sürdü; 13 Haziran'da ChatGPT benzeri ürünü piyasaya sürdükten sonra 360, 360 Smart Brain Big Model Uygulama Konferansını yeniden düzenledi.

Şubat ayı civarında piyasaya sürülen büyük modellerden farklı olarak son dönemde çeşitli firmalar tarafından piyasaya sürülen upgrade ürünler uygulama katmanına daha çok yöneliyor ve amaç binlerce hanenin işini kolaylaştırmak.

Mevcut sürümden yola çıkarak, 360 Intellectual Brain başlangıçta modlar arası oluşturma yeteneklerine sahipti.Metinlerden metin, tablolar ve resimler üretmeye ek olarak; resimlerden metin ve resimler oluşturma ve videolardan metin oluşturma ve metinlerden ve videolardan video kesme diğer temel kreasyonlar Ayrıca, kullanıcılara "ruhu, insan tasarımı ve hafızası olan" özelleştirilebilir ve ayrıcalıklı bir "yapay zeka" sunmak için "dijital insanı" yeniden tanımlıyor.

Şu anda 360 Smart Brain ve kullanıcılar arasındaki en yakın mesafeye sahip uygulama senaryosu 360'ın mevcut aile grubudur.Zhou Hongyi basın toplantısında "360 Smart Brain 4.0"ın 360 Security Guard, 360 Browser, 360 Search'e bağlanacağını söyledi, vb. İnsan-makine işbirliği.

Basın toplantısında Zhou Hongyi önceki bakış açısını değiştirdi, "Bir keresinde yerli büyük ölçekli model ile ChatGPT arasındaki farkın iki yıl olduğunu söylemiştim ve şimdi bu cümleyi geri almak istiyorum." Seviye aynı seviyede GPT3.5 ile ve bu hızda gelişirse göz açıp kapayıncaya kadar GPT4'ü yakalayacak, hatta geçecek.

İlk sürümün yayınlanmasından 360 Smart Brain'in resmi olarak yayınlanmasına kadar geçen dört ay içinde Zhou Hongyi bu kadar büyük bir değişiklik gördü mü?

Bilim ve teknoloji devi büyük model avlıyor

2023 Zhongguancun Forumunda yayınlanan "Çin Yapay Zeka Büyük Ölçekli Model Haritası Araştırma Raporu", şu anda Çin'in yapay zeka büyük ölçekli modellerinin güçlü bir gelişme eğilimi gösterdiğini gösteriyor. Eksik istatistiklere göre, şu an itibariyle ülke çapında 1 milyardan fazla parametreye sahip 79 büyük ölçekli model piyasaya sürüldü.

Bununla birlikte, büyük teknoloji şirketlerinin büyük ölçekli modellerinin parametreleri nispeten büyüktür: Alibaba Tongyi Qianwen büyük modelinin parametreleri 10 trilyonun üzerinde, Tencent Hunyuan büyük modelinin ve Huawei'nin Pangu büyük modelinin parametreleri bir trilyonun üzerindedir. ve Baidu Wenxin'in büyük modeli bir trilyondan fazla parametreye sahip.Büyük ölçekli modelin parametre hacmi 200 milyardan fazla ve JD Yanxi büyük modelinin parametre hacmi 100 milyar; teknoloji şirketlerinin parametre hacmi dikey endüstriler genellikle 100 milyardan fazladır ve büyük bilimsel araştırma kurumları modelinin parametre hacmi yüz milyar düzeyinde ve altındadır.

Büyük modelin yerleşim sistemi açısından bakıldığında, büyük teknoloji şirketleri bilgi işlem gücü katmanı, platform katmanı, model katmanı ve uygulama katmanında dördü bir arada kapsamlı bir düzen gerçekleştirmiştir. Baidu, Ali ve Huawei, Baidu'nun "Kunlun çekirdeği + uçan kürek platformu + Wenxin büyük modeli + endüstri uygulaması", Ali'nin "Hanguang 800 çipi + M6-OFA tabanı" gibi çiplerden uygulamalara kadar kapsamlı bir bağımsız araştırma ve geliştirme düzenine sahiptir. + Tongyi büyük model + endüstri uygulaması", Huawei'nin "Shengteng çipi + MindSpore çerçevesi + Pangu büyük modeli + endüstri uygulaması".

Buna ek olarak, Kingsoft Office ayrıca 31 Mayıs'ta WPS AI'yi piyasaya sürdü. Şu anda WPSAI, Kingsoft Office'in hafif belgeler, metin, tablolar, sunumlar ve PDF'ler gibi ofis bileşenlerine bağlandı. , soru-cevap ve insan-bilgisayar etkileşimi, stratejik yönde geliştirme ve tüm Kingsoft Office ürünlerine erişim.

Çeşitli büyük üreticilerin bu yola hızlı bir şekilde akın etmesi, esas olarak, düzenleyici otoriteler tarafından endüstrinin gelişimini düzenlemek için hızlı takip ve önlemlerin alınmasından kaynaklanmaktadır.Üst düzey yapının refakatiyle, her büyük üretici doğal olarak araştırma ve geliştirmeye yatırım yapın ve ürünleri güvenle piyasaya sürün.

Büyük ölçekli modelin bu yıl Mart ayında partiler halinde piyasaya sürülmesinden bu yana, AI düzenleme politikaları yavaş yavaş netleşti ve bu da endüstri uygulamalarına yönelik yönü işaret etti.

Tüm sektörün gelişimine bakıldığında, 11 Nisan'da "Üretken Yapay Zeka Hizmet Yönetim Yöntemi" yorumlara açıldı; 30 Mayıs'ta Bilgi ve İletişim Teknolojileri Enstitüsü ortaklaşa "Kite" açık yapay zeka modelini hazırlıyor. lisans ve bir sonraki adım "Zhikite Açık Yapay Zeka Modeli Lisansı (Yorum Taslağı)" düzenlemek olacaktır.

Ardından, birinci kademe şehirler ortaklaşa "Küresel Olarak Etkili Bir Yapay Zeka İnovasyon Kaynağının İnşasını Hızlandırmak İçin Pekin İçin Uygulama Planı (2023-2025)"; Yıl)" yayınladı.

Bu bağlamda Zhou Hongyi, yerli büyük modelin, anlaşılması kolay görünen ChatGPT ile farkı hızla kapatacağına inanıyor.

360 Akıllı Beyin arasındaki fark nedir

Zhou Hongyi'nin planına göre 360 büyük model, senaryolaştırma, ürünleştirme, düzleştirme ve dikeyleştirme dikkate alınarak büyük modelin sürekli olarak yükseltilmesine dayanacak.

Bu geliştirme stratejisi kapsamında 360 Smart Brain, tüketici (kullanıcı kişisel AI asistanı), küçük ve orta ölçekli işletmeler (SaaS dikey uygulaması), işletmeler/hükümetler/şehirler (özelleştirilmiş dağıtım modeli), endüstri (endüstri sektörü modeli) ve diğer dördü elde edebilir. ana uygulama senaryoları.

Yukarıda belirtilen farklı senaryoların ihtiyaçlarını daha iyi karşılayabilmek için, genel büyük ölçekli modelin metin girmekten metin çıkarmak, görüntüleri ve videoları anlamak ve mevcut üzerinde görüntü ve video üretebilmek için dönüşümü tamamlaması gerekir. “kulakları” ve “gözleri” olan büyük ölçekli bir model yapmaya eşdeğer olan temel, “dijital insan” yaratmanın temellerini atıyor.

Geleneksel dijital insanların yalnızca yerleşik senaryoya göre çıktı alması gerekir, ancak büyük modeller çağında, 360 dijital insanlar özelleştirilebilir, böylece insanlar tasarlanır, anıları ve deneyimleri olur. Şu anda, 360'ta 200'den fazla karakter var. dijital insan kare platformu, iki kategoriye ayrıldı: dijital ünlüler ve dijital çalışanlar. 360, gelecekte herkesin kendi yapay zeka asistanına sahip olmasını ve eski insanlarla sanal alanda, zaman ve mekanda iletişim kurma fırsatına sahip olmasını umuyor.

Gösteri toplantısında Zhou Hongyi, "Zhuge Liang"a bunun günümüzde hayaletler ve hayvanlar için bir malzeme haline geldiğini nasıl düşündüğünü sordu ve dijital adam Zhuge Liang'ın ses tonuyla cevap verdi: Geçmişin ve bugünün kaderi kaçınılmaz. Bugünün durumunda, dünya kargaşa içinde. Yaşlı olmama rağmen hala dünyayı hedefliyorum. Bugünün gençleri beni hayaletler ve hayvanlar için bir malzeme olarak kullanıyorlar ve ben bu değişikliği seve seve kabul ediyorum. Ve genç arkadaşlara önlerindeki yolda cesurca ilerlemelerini ve daha iyi bir gelecek yaratmalarını diliyorum.

Aynı zamanda Zhou Hongyi, gelecekte dijital insan formunun da kendi hedeflerine, planlama ve ayrıştırma yeteneklerine sahip olacağını, böylece görevleri tamamlamak için çeşitli dikey modellerin çağrılabileceğini vurguladı.

Ancak bu fonksiyonlar aslında mevcut büyük ölçekli model uygulamalarına dayalı optimizasyonlardır ve yeni bir alan açmamıştır. Ama aslında, büyük model bir atılım yaptığında, en yaratıcı uygulama senaryosu insansız sürüş oluyor.

** Sürücüsüz sürüşün hızlı şeride girme şansı var **

İnsansız sürüş alanına dönüp baktığımızda, 2016'dan beri büyük üreticiler bu alanda konuşlanıyor, ancak bu yıla kadar hiçbiri gerçek insansız sürüşe ulaşamadı.

Şu anda, L2+ seviyesinde bir insansız sürüş sistemi, manuel etiketlemeden sonra model eğitimi için kullanılabilecek çok boyutlu veriler sağlamak için 10'dan fazla kameraya, 1-2 lidar veya 3-5 milimetre dalga radarına ihtiyaç duyuyor. Görüntüleri tanıyabilen büyük modellerin ortaya çıkmasından sonra, manuel etiketleme için gereken zaman maliyeti ve malzeme harcaması keskin bir şekilde düşecektir.

Nisan 2023'teki Momo Zhixing DriveGPT basın toplantısına göre, şerit çizgileri, trafik katılımcıları, trafik ışıkları vb. 0.5 yuan'dır. Teknoloji şirketlerinin büyük ölçekli model eğitimleri olgunlaştıktan sonra tek bir görselin otomatik etiketlenmesinin marjinal maliyetinin 0'a yaklaşacağına ve ortalama maliyetin daha da düşmesinin beklendiğine inanıyoruz.

Şubat 2023'te Kaiwang Veri Ürünleri Projesi başkan yardımcısı Zhang Peng'e göre, şu anda manuel etiketleme, makine etiketleme ile desteklenen ana veri etiketleme yöntemidir ve veri etiketlemenin %95'i hala büyük ölçüde manueldir. Büyük modellerin müdahalesi, bu endüstrinin verimliliğini büyük ölçüde artırabilir. Tesla'yı örnek alırsak, manuel etiketleme ekibi 2021'de 1.000'den fazla kişiye sahip olacak ve ekip 2022'de 200'den fazla kişiyi işten çıkaracak.

Ek olarak, büyük modeller çağında, üçüncü taraf teknoloji devlerinin, OEM'lerin kendi otonom sürüş algoritmalarını ve kapalı döngü veri sistemlerini oluşturmalarına yardımcı olurken, büyük modellerin veri oluşturma yeteneklerine güvenerek eksiksiz bir araç zinciri sağlamaları bekleniyor. veri alanındaki boşluğu daraltarak, otonom sürüşün Android çağının gelmesi bekleniyor.

Şu anda, veri kapalı çevrimi, simülasyon, algılama algoritmaları, düzenleme ve kontrol algoritmaları ve diğer alanları etkinleştirmek için büyük modeller kullanılmıştır. Ve Microsoft ve Nvidia gibi devler, büyük modellerde düzen ve otonom sürüş için rekabet ediyor, yoksa yeni kıvılcımlar ateşleyecek.

Ayrıca büyük modellerin ortaya çıkması da sektördeki işbölümünü teşvik ediyor, "tekerleği yeniden icat etmekten" kaçınıyor ve sensörlerin ve çiplerin yinelenmesini hızlandırıyor ve sistem maliyetinin önemli ölçüde düşmesi bekleniyor. Otonom sürüş endüstrisi zincirindeki büyük ölçekli model geliştiricilerin ve oyuncuların çok yönlü bir şekilde fayda sağlaması bekleniyor.

Baidu Apollo'yu örnek olarak alırsak, orijinal bir modeli önceden eğitmek için önce grafik bilgilerini kullanır, sokak görünümü görüntü verilerini tanımlamak, konumlandırmak ve bölümlere ayırmak için algoritmalar kullanır ve bunları bir temel kitaplık oluşturmak için kodlayıcıya koyar, yani bir temel kitaplık oluşturur. sokak görünümü veri havuzuna dayalı olarak resimler ve metin bilgileri arasındaki yazışma.

İkinci olarak, metin ve resimler aracılığıyla belirli sahneleri (ekspres araçlar, tekerlekli sandalyeler, çocuklar vb.) arayabilir ve madencilik yapabilir ve stok verilerinin kullanımını büyük ölçüde geliştiren araç tarafı modelinde özelleştirilmiş eğitim gerçekleştirebilirsiniz.

Baidu, büyük bir algı modelini eğitmek için 2B ve 3B verileri tam olarak kullanmak için yarı denetimli bir yöntem kullanır. Küçük modeli birden fazla adımda ayrıştırarak, küçük modelin performansı iyileştirilir ve aynı zamanda küçük model, uzun mesafeli görsel 3B algılama yeteneğini geliştirmek ve geliştirmek için kullanılan otomatik etiketleme yoluyla eğitim için özelleştirilir. çok modlu algı modelinin algı etkisi.

Diğer bir lider oyuncu olan SenseTime, AIGC'nin otomatik sürüş sistemini eğitmek için gerçek trafik sahneleri ve zor örnekler oluşturmak için kullanılabileceğini ve üst sınırı iyileştirmek için büyük modelin girdisi olarak çok modlu verilerin kullanılabileceğini kamuoyuna açıkladı. sistemin köşe sahnelerini algılaması.

Aynı zamanda, çok modlu büyük otonom sürüş modeli, algı ve karar vermenin entegre entegrasyonunu gerçekleştirebilir ve 3D ortam, çevrenin görsel olarak anlaşılmasını gerçekleştirmek için çıkıştaki ortam kod çözücü aracılığıyla yeniden yapılandırılabilir; davranış kod çözücü tam bir yol planlaması oluşturabilir, motivasyon kod çözücü kullanılabilir Doğal dil muhakeme sürecini açıklayarak otonom sürüş sistemini daha güvenli ve güvenilir hale getirir.

Büyük model yukarıdaki işlevleri gerçekleştirdikten sonra, insansız sürüş eşiği gelecekte daha da düşecek.Önde gelen üreticiler insansız sürüş projelerinin ilerlemesini hızlandırırken, aynı zamanda daha fazla yeni oyuncunun bu alana katılmasını ve ihtiyaç duyulan yolları geliştirmesini sağlayabilir. yol navigasyonuna ek olarak yollar.Örneğin süpürme robotunun yol planlamasının daha da optimize edilmesi gibi planlama işlevinin yolu.

Şimdi bakıldığında, büyük ölçekli modellerin Şubat'tan Mart'a kadar olan merkezi sürüm döneminin ve Nisan'dan Mayıs'a kadar olan ürün geliştirme döneminin ve politika yönünün kademeli olarak netleştirilmesinin ardından Haziran, yapay zeka büyük ölçekli modellerin merkezi sürüm dönemine girdi. ölçekli model ürün ve uygulamaları Bu aynı zamanda doğrudan OpenAI API'nin fiyat düşüşüne de yol açar.

Öngörülebilir gelecekte, yapay zeka teknolojisi yinelemeye ve uygulamalar ilerlemeye devam edecek.Aynı zamanda, giderek daha fazla sayıda büyük teknoloji şirketi bu yolu kesmek için ürünler piyasaya sürecek ve bu da endüstrinin refahını artırmaya ve daha fazlasını getirmeye devam edecek. Büyük bir kullanıcı tabanına sahip olan Tencent gibi pazar talebini karşılayan GPT benzeri ürünler de 19 Haziran'da büyük modeller alanında teknik bir çözüm yayınladı.

Bu şirketler bir araya geldiğinde, endüstrinin gelişimi hızlı şeride girecek ve bu aynı zamanda C-end kullanıcıların da yakında bu ürünü kullanabilecekleri anlamına geliyor.Parasını kimin ödeyeceğine gelince, her üreticinin kendine güvenmesi gerekiyor. kendi yeteneği.

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin