Görüntü kaynağı: Sınırsız AI tarafından oluşturuldu
ChatGPT'nin çıktığı günden bu yana 8 ay geçti.
8 ay içinde, Çin'deki birçok büyük model ortaya çıktı ve çeşitli endüstri senaryolarına hızlı bir şekilde girmeye devam etti. Ancak şimdiye kadar, büyük modeller tarafından gerçekten altüst edilen hiçbir senaryo veya endüstri olmadı.
İstatistikler, büyük modellerin uygulanmasında işletmelerin %45'inin bekle-gör aşamasında, %39'unun keşif ve fizibilite çalışması aşamasında, %16'sının pilot uygulama aşamasında olduğunu ve tam uygulama yapan işletmelerin sıfır olduğunu göstermektedir. **
Görülmeye değer bir soru, bugün Çin topraklarında büyük modellerin uygulanmasının ilerlemesi nedir?
Büyük bir model iniş, finans, enerji öncelikli
"Lütfen bu yıl Ağustos ayında elektrik kullanımımı kontrol etmeme yardım edin ve en çok hangi gün elektrik kullanacağım?" Bu görüntüdeki kusurları tespit etmeme yardım et"... Güney Yapay Zeka İnovasyon Platformu'nda, dil etkileşimi yoluyla, bir veri parçası önünüzde net bir şekilde görüntülenir.
Bu platformda, enerji endüstrisi çalışanları, otomatik olarak veri işleme sonuçları üretebilmesi, kusur sahnelerinin görüntü ayrıntılarını doğru bir şekilde tanımlayabilmesi ve personelin güç denetimi sürecinde verileri almasına ve işlemesine yardımcı olabilmesi için güç modeline talimatlar verebilir.
Şu anda, China Southern Power Grid'in müşteri hizmetleri alanında, yüksek frekanslı sorunların% 60'ı güç modeli tarafından çözülebilir ve güç modeli, müşteri duyarlılığı dalgalanmalarını belirlemede manuelden bile daha iyidir.
Ek olarak, güç iletimi ve dağıtımı alanında, ** güç modeli dakikada 100 sorunlu resmi işleme yeteneğine sahiptir ve aynı anda 20 tür kusuru tanımlayabilir ve tanıma verimliliği geleneksel AI algoritmalarının 10 katıdır. **
Güç dağıtımı alanında, güç modeli, dağıtım departmanının elektrik şebekesindeki anormal koşullar için hızlı ve otomatik olarak bertaraf planları oluşturmasına ve elektrik piyasası düzenlemesinin gerekliliklerine zamanında yanıt vermesine yardımcı olarak planları daha güvenli, daha verimli ve daha az maliyetli hale getirebilir.
Bu, enerji alanında büyük modellerin uygulanmasının bir mikrokozmosudur.
Bazı önde gelen enerji üreticilerinin, özellikle elektrik şebekeleri ve madenler alanında büyük modellerin uygulanmasında teknoloji şirketleriyle işbirliğine başladıkları ve elektrik şebekesi planlaması, arıza/arıza sorgulama, kömür madeni operasyon izleme ve diğer senaryolar gibi bazı ön pilot gösteriler oluşturdukları anlaşılmaktadır.
Enerji alanına ek olarak, finansal alan da büyük modellerin en büyük iniş senaryolarından biridir. **
iAnalytics'in bir raporunda, enerji ve bankacılık da büyük modellerin uygulanmasında en hızlı ilerleme kaydeden iki sektör olarak listelendi.
Finansal alandaki geniş uygulama yelpazesi, büyük modellerin sayısından ve kurumsal dinamiklerden de görülebilir. Bir dizi veriye göre, Ağustos ayı itibariyle, 1 milyarın üzerinde yerli parametrelere sahip büyük modellerin sayısı 116'ya kadar yükseldi ve bunların yaklaşık 18'i finans sektöründeki büyük modellerdi. **
Buna ek olarak, altı aylık raporda, Çin Sanayi ve Ticaret Bankası, Çin Ziraat Bankası, Çin Bankası, İletişim Bankası, Çin Tüccarlar Bankası, Çin CITIC Bankası, Sanayi Bankası, Huaxia Bankası ve Zheshang Bankası dahil olmak üzere dokuz banka, büyük modellerin uygulanmasını araştırmayı açıkça önerdi.
Büyük ölçekli model üreticileri tarafında, bazı yoğun endüstri modellerinin piyasaya sürülmesi, finansal senaryoların uygulanmasının sıcaklığını da yansıtıyor.
Örneğin, Mayıs ayı sonlarında Du Xiaoman, 100 milyar seviyeli Çin modeli "Xuanyuan"ı piyasaya sürdü; Haziran ayında Tencent Cloud, finansal model işbirliğini yürütmek için DCIS ile el ele verdi, Çin Ziraat Bankası, ChatGPT benzeri büyük model uygulaması ChatABC'yi başlattı ve Çin Sanayi ve Ticaret Bankası, Ascend AI'ya dayalı finans sektörü için genel bir model yayınladı.
Temmuz'dan Ağustos'a kadar, "Üretken Yapay Zeka Hizmetlerinin Yönetimi için Geçici Önlemler"in resmi olarak uygulanmasıyla, Tencent, Baidu, iFLYTEK, Huawei, ByteDance ve diğer şirketler de dahil olmak üzere birçok şirket, en son büyük ölçekli model ilerlemesini art arda yayınladı; Eylül ayında Ant Group, finansal modelini ve üretken bir yapay zeka programlama platformu olan açık kaynaklı CodeFuse'u da resmi olarak yayınladı.
**Finans alanı, şüphesiz büyük modellerin inmesi için en çok senaryodan biridir. **
İster enerji alanında ister finans alanında olsun, ilkinin büyük modellerin öncü inişini başarabilmesinin nedeni, bu iki endüstri arasındaki bazı ortaklıklardan kaynaklanmaktadır. **
Her şeyden önce, enerji ve bankacılık sektörleri, büyük modellerin eğitimi ve uygulanması için uygun koşullar sağlayan, iyi bir veri temeli ve dijital ortama sahip, son derece veri odaklı endüstrilerdir. **
İkincisi, her iki endüstrinin de çok sayıda veri işleme ve karar verme ihtiyacı vardır ve büyük ölçekli makine öğrenimi ve derin öğrenme teknolojileri, endüstrinin bu sorunları çözmesine ve karar verme verimliliğini ve doğruluğunu artırmasına yardımcı olabilir.
Buna ek olarak, enerji ve bankacılık sektörünün iş modeli nispeten olgundur ve yüksek ticari değere sahiptir, bu nedenle bu endüstrilerde büyük model teknolojisine olan talep de nispeten büyüktür, bu nedenle büyük modellerin uygulanmasını teşvik etmektedir.
Enerji ve bankacılık olmak üzere iki büyük endüstrinin, esas olarak iyi veri temeli, büyük teknik talep ve yüksek ticari değer gibi birçok faktörün kapsamlı etkisinden dolayı, büyük modellerin uygulanmasında nispeten hızlı olduğu görülebilir. **
Finans ve enerji olmak üzere iki iniş senaryosunda bile, büyük modeller için hala üstesinden gelinmesi zor bazı sorunlar olduğunu belirtmekte fayda var.
2 Beklenen sahne değerinin karşılanamaması
Finans sektöründe pazarlama, risk kontrolü ve operasyon, birçok bankanın daha fazla önem verdiği büyük modellerin uygulama yönleridir.
Bunlar arasında akıllı Soru-Cevap asistanı, akıllı müşteri hizmetleri, pazarlama görüntülerinin otomatik olarak oluşturulması ve kredi sonrası rapor yazma, bankaların ve diğer finansal kurumların aktif olarak düzenlendiği alt bölümlerdir. Bununla birlikte, şu anda, akıllı Soru-Cevap asistanı, akıllı müşteri hizmetleri ve pazarlama görüntülerinin otomatik olarak oluşturulması gibi üretken senaryoların değeri neredeyse beklenenle aynıdır, ancak karar vermede büyük modellerin uygulanmasının beklenen ve gerçek etkileri ile uyuyan müşteri uyandırma ve dijital iş salonları gibi yerel uygulama senaryoları arasında hala bir boşluk vardır.
Örneğin, akıllı müşteri hizmetleri senaryosunda, geçmişte, birkaç akıllı fikir tartışması soru bankası vardı ve alaka düzeyi yoktu. Günümüzde, büyük modellere dayalı kişiselleştirilmiş soru bankalarının üretimi, eğitim döngüsünü kısaltabilir ve pazarlama görsellerinin otomatik olarak oluşturulmasında, tasarımcılar malzeme kitaplığında seçer ve tasarlarlardı, ancak şimdi otomatik olarak oluşturmak için Midjourney'i kullanabilirler, bu da telif hakkı maliyetlerini ve işçilik maliyetlerini azaltabilir.
Uyuyan müşteri uyanışı ve dijital iş salonu senaryosu değer beklentisi söz konusu olduğunda, birincisi, uyandırma etkisini iyileştirmek için uçtan uca bir stratejiye ulaşabilen bir stratejiyi otomatik olarak oluşturmak için büyük bir model kullanır. İkinci büyük model tarafından desteklenen dijital insan, müşterilerin işlerini yürütmelerine yardımcı olur, işlemleri tamamlamak için ürünler önerir ve APP'den bağımsız olarak yeni kanallar gerçekleştirebilir.
Bununla birlikte, şu anda, bu iki senaryonun pratik uygulama değeri henüz bilinmemektedir. **
Enerji sektöründe büyük ölçekli modellerin uygulanması da benzerdir.
Enerji sektöründe, ekipman çalıştırma ve denetleme bilgi asistanları ve akıllı müşteri hizmetleri gibi üretken uygulamaların değeri neredeyse beklenenle aynıdır. Bununla birlikte, bakım belgeleri, ekipman arıza onarımı ve güç yükü tahmini gibi senaryolarda, senaryonun gerçek değeri hala bilinmemektedir. **
Spesifik olarak, ekipman çalıştırma ve denetim bilgi asistanı senaryosunda, geçmişte NLP teknolojisine dayalı yapılandırılmış bir bilgi tabanı oluşturulmuştur ve büyük bir modelin kutsamasıyla, operasyon ve denetim asistanı, verimliliği artırmak için büyük bir modelin desteğiyle oluşturulabilir ve akıllı müşteri hizmetleri senaryosunda, geçmişte Bert modeline dayalı akıllı bir müşteri hizmeti kullanıldı ve şimdi akıllı müşteri hizmetlerinin kullanıcı deneyimi, daha doğru niyet anlayışı, daha antropomorfik dil ve iyileştirilmiş kullanıcı deneyimi elde edebilen büyük bir model kullanılarak geliştirildi.
Bakım belgesi oluşturma, ekipman arıza bakımı ve güç yükü tahmini senaryolarında, büyük modelin değeri, verimliliği artırmak için belgeleri hızlı ve otomatik olarak oluşturmaktır, büyük model arızanın nedenini hızlı bir şekilde bulabilir ve bakım önerileri ve çözümleri sağlayabilir ve tahmin doğruluğunu artırmak için yükü gerçek zamanlı olarak tahmin etmek için daha fazla etkileyen faktör içerir.
Ancak şu anda bu senaryolarda büyük modellerin değeri henüz bilinmemektedir ve keşfedilmesi için hala zamana ihtiyacı vardır. **İster finans sektörü ister enerji sektörü olsun, üretim senaryosunun hızlı bir şekilde karaya çıktığı ve birçok uygulamaya sahip olduğu, karar verme senaryosunun ise daha yavaş ve inişinin daha zor olduğu ve daha az uygulama olduğu tespit edilebilir. **
3 "Senaryolar > Karar Verme Senaryoları Oluşturma": Dönüştürülmesi Zor Üretkenlik
Şu anda, ** büyük modelin uygulanması hala pilot uygulama aşamasındadır ve tam olarak başlatılmamıştır. **
Yukarıda bahsedildiği gibi, finans sektöründe akıllı Soru-Cevap, akıllı müşteri hizmetleri, dijital iş salonları, kredi sonrası rapor oluşturma, uyuyan müşterilerin uyandırılması ve finansal ürün önerisi gibi yapay zeka büyük model uygulamaları kademeli olarak hayata geçirilmiş ve akıllı müşteri hizmetleri, ekipman çalıştırma ve denetim bilgi asistanları, bakım belgesi oluşturma, güç sistemi simülasyon platformları ve güç yükü tahmini enerji sektöründe pilot uygulama yapılmıştır.
Bununla birlikte, tüketim malları perakendesi, menkul kıymetler ve medya hala keşif aşamasındayken, imalat ve ilaç şirketleri hala bekle ve gör aşamasındadır.
Büyük modelin uygulanmasının genişlik olarak daha iyimser olmasına rağmen, derinlemesine daha zor olduğu görülebilir.
Büyük bir modelin derinliği, yeteneklerine, ölçeğine, bilgi işlem kaynaklarına, veri kalitesine, etki alanı bilgisine vb. bağlıdır. Bununla birlikte, mevcut yerli model için, geliştirmenin ilk aşamasındadır ve birçok tesis ve yetenek hala kademeli olarak gelişmektedir. **
Model yetenekleri ve uygulama etkileri gibi faktörlerle sınırlı olan mevcut yerleştirme uygulaması, temel olarak oluşturma senaryolarına dayanmaktadır. **
Karar verme modelinden farklı olarak, üretken model esas olarak metin üretimi, diyalog sistemi, dil çevirisi vb. alanlarda kullanılır ve metinlerin üretim kurallarını ve iç anlamsal ilişkilerini öğrenmek için büyük miktarda metin verisini analiz ederek yüksek kaliteli metin çıktısı üretebilir. Üretken büyük modellerin temsili modelleri arasında OpenAI'nin GPT serisi ve Baidu'nun Wenxin Yiyan'ı yer alıyor.
Karar verme modelleri ağırlıklı olarak öneri sistemleri, pekiştirmeli öğrenme ve diğer alanlarda kullanılır ve işlenmesi gereken veriler genellikle sürekli sayısal değişkenler içerir ve karar vermek veya gelecekteki davranışları tahmin etmek gerekir. Karar verme modellerinin temsili modelleri arasında DeepMind'ın AlphaZero serisi ve OpenAI'nin Dota2 AI'sı bulunur.
Karar verme modeliyle karşılaştırıldığında, üretken model her şeyden önce metin oluşturma ve diyalog sistemindedir, veriler çok sayıda metin derlemi aracılığıyla toplanabilir ve düzenlenebilirken, öneri sistemi ve pekiştirmeli öğrenmede verilerin genellikle manuel olarak tasarlanması ve oluşturulması gerekir, bu da nispeten karmaşıktır.
İkinci olarak, metin oluşturma ve diyalog sistemleri alanlarındaki araştırmalar nispeten olgunlaşmıştır ve kullanılabilecek birçok hazır algoritma ve çerçeve varken, öneri sistemleri ve pekiştirmeli öğrenme alanları daha fazla keşif ve araştırmaya ihtiyaç duymaktadır.
Ayrıca, arama motorları, sohbet robotları, otomatik yazma vb. gibi metin oluşturma ve diyalog sistemleri gibi alanlarda çok çeşitli uygulama senaryoları bulunurken, öneri sistemleri ve pekiştirmeli öğrenme ağırlıklı olarak e-ticaret, reklamcılık, oyunlar ve diğer alanlarda kullanılmaktadır.
Üretken senaryolar yaygın olarak kullanılsa da, tahmine dayalı karar verme senaryolarının gelecekte yüksek değerli senaryolar olduğu bir gerçektir. İster büyük bir model tedarikçisi ister bir kuruluş olsun, büyük model yeteneklerine dayalı olarak iş değerini artırmak istiyorsanız, ikincisi çabaların yönüdür. **
4 Sektör senaryosunda yapay zeka modeline bakalım
**Büyük bir modelin inişi için öncelikle uygun alanların ve senaryoların seçilmesi gerekir. Bu alandaki senaryolar güçlü dijital yeteneklere ve dijital temellere sahiptir. **
Örneğin, akıllı müşteri hizmetleri alanında, SSS sistemleri ve sohbet robotları gibi senaryolar için büyük modeller düşünülebilir. Reklam önerisi alanında, e-ticaret platformlarında kişiselleştirilmiş öneriler gibi senaryolara uygulanabilir; Kamuoyu izleme alanında, haber medyasının içerik sınıflandırması ve duygu analizi gibi senaryolara uygulanabilir.
İkincisi, yüksek model kabiliyetine ve uygulama etkisine sahip olmalıdır. Mevcut kurumsal kullanıcıların büyük modeli uygulamak için ana yolu perspektifinden bakıldığında, grup işletmelerinin odak noktası büyük modellerin kapasite geliştirmesi ve genel işletmelerin/departmanların odak noktası uygulama senaryolarının araştırılmasıdır. Büyük model kapasite geliştirme üç seviyeye ayrılır: altyapı inşaatı, büyük model eğitimi ve büyük model uygulaması.
Şu anda, büyük modellerin uygulama yönünün esas olarak iki türe ayrıldığını belirtmekte fayda var: birincisi, küçük modeller temel dayanak noktasıdır ve büyük modeller küçük modellerin geliştirme verimliliğini artırır; **
Ancak, bu giriş yolu modelin özelliklerini sınırlar.
Büyük ölçekli model inişinin derinliğini teşvik etmek için, büyük ölçekli model tedarikçileri ve işletmelerin yetenekleri ve işbirliği modellerini keşfetmeye devam etmesi gerekir. **
Büyük modellerin inişini derinleştirmek için bazı yollar yavaş yavaş netleşiyor.
Gelecekte, büyük ölçekli model teknolojisinin sürekli geliştirilmesi ve yaygınlaşmasıyla birlikte, model kaskad uygulaması giderek daha kapsamlı hale gelecektir.
Örneğin, konuşma tanıma, görüntü tanıma ve doğal dil işleme gibi daha karmaşık ve doğru uygulama senaryoları elde etmek için birden çok büyük model birleştirilebilir ve basamaklandırılabilir. Aynı zamanda, büyük modeller ve küçük modeller de kendi avantajlarından tam anlamıyla yararlanmak ve modelin performansını ve genelleme yeteneğini geliştirmek için basamaklandırılabilir.
Buna dayanarak, büyük modellerin uygulama derinliği genişletilir ve çeşitli alanlarda karar verme senaryolarının uygulanması hızlandırılır.
İkincisi, farklı endüstrilerin farklı özel ihtiyaçları vardır ve büyük modellerin gelecekte daha özelleştirilmiş bir yönde gelişmesi gerekir. Sektöre özel derlemlerin eğitimi sayesinde, büyük modeller farklı endüstrilerin gerçek uygulama senaryolarına daha iyi uyum sağlayabilir.
İkincisi, pratik uygulamalarda verimlilik ve kaynak gereksinimlerini daha iyi karşılayabilmek için büyük modellerin daha hafif olma yönünde geliştirilmesi gerekmektedir. Model sıkıştırma ve ayıklama gibi teknikler, modelin performansını sağlarken modelin boyutunu ve bilgi işlem kaynak tüketimini azaltabilir.
Ayrıca, veri gizliliği koruma konularının giderek daha fazla öne çıkmasıyla birlikte, büyük modellerin veri güvenliğine ve gizlilik korumasına daha fazla dikkat etmesi gerekiyor.
Modelin özelleştirilmesi, hafifliği ve veri güvenliği, uygulanması için önemli faktörler haline geldi.
Çin'in yapay zeka modelinin uygulanması, akıllı müşteri hizmetleri, reklam önerisi ve kamuoyu izleme alanlarında bir dizi başarı elde etti. Bununla birlikte, ** iniş sürecinde de birçok zorlukla karşı karşıyadır. Gelecekte, endüstri özelleştirmesi, model hafifliği ve veri güvenliği gibi teknolojilerin geliştirilmesiyle birlikte, AI büyük modellerinin inişi ve uygulanması daha geniş bir geliştirme alanını başlatacaktır. **
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Sekiz ay geçti, Çin'in büyük ölçekli modelinin uygulanması nasıl ilerliyor?
Orijinal kaynak: Sanayici
ChatGPT'nin çıktığı günden bu yana 8 ay geçti.
8 ay içinde, Çin'deki birçok büyük model ortaya çıktı ve çeşitli endüstri senaryolarına hızlı bir şekilde girmeye devam etti. Ancak şimdiye kadar, büyük modeller tarafından gerçekten altüst edilen hiçbir senaryo veya endüstri olmadı.
İstatistikler, büyük modellerin uygulanmasında işletmelerin %45'inin bekle-gör aşamasında, %39'unun keşif ve fizibilite çalışması aşamasında, %16'sının pilot uygulama aşamasında olduğunu ve tam uygulama yapan işletmelerin sıfır olduğunu göstermektedir. **
Görülmeye değer bir soru, bugün Çin topraklarında büyük modellerin uygulanmasının ilerlemesi nedir?
Büyük bir model iniş, finans, enerji öncelikli
"Lütfen bu yıl Ağustos ayında elektrik kullanımımı kontrol etmeme yardım edin ve en çok hangi gün elektrik kullanacağım?" Bu görüntüdeki kusurları tespit etmeme yardım et"... Güney Yapay Zeka İnovasyon Platformu'nda, dil etkileşimi yoluyla, bir veri parçası önünüzde net bir şekilde görüntülenir.
Bu platformda, enerji endüstrisi çalışanları, otomatik olarak veri işleme sonuçları üretebilmesi, kusur sahnelerinin görüntü ayrıntılarını doğru bir şekilde tanımlayabilmesi ve personelin güç denetimi sürecinde verileri almasına ve işlemesine yardımcı olabilmesi için güç modeline talimatlar verebilir.
Şu anda, China Southern Power Grid'in müşteri hizmetleri alanında, yüksek frekanslı sorunların% 60'ı güç modeli tarafından çözülebilir ve güç modeli, müşteri duyarlılığı dalgalanmalarını belirlemede manuelden bile daha iyidir.
Ek olarak, güç iletimi ve dağıtımı alanında, ** güç modeli dakikada 100 sorunlu resmi işleme yeteneğine sahiptir ve aynı anda 20 tür kusuru tanımlayabilir ve tanıma verimliliği geleneksel AI algoritmalarının 10 katıdır. **
Güç dağıtımı alanında, güç modeli, dağıtım departmanının elektrik şebekesindeki anormal koşullar için hızlı ve otomatik olarak bertaraf planları oluşturmasına ve elektrik piyasası düzenlemesinin gerekliliklerine zamanında yanıt vermesine yardımcı olarak planları daha güvenli, daha verimli ve daha az maliyetli hale getirebilir.
Bu, enerji alanında büyük modellerin uygulanmasının bir mikrokozmosudur.
Bazı önde gelen enerji üreticilerinin, özellikle elektrik şebekeleri ve madenler alanında büyük modellerin uygulanmasında teknoloji şirketleriyle işbirliğine başladıkları ve elektrik şebekesi planlaması, arıza/arıza sorgulama, kömür madeni operasyon izleme ve diğer senaryolar gibi bazı ön pilot gösteriler oluşturdukları anlaşılmaktadır.
Enerji alanına ek olarak, finansal alan da büyük modellerin en büyük iniş senaryolarından biridir. **
iAnalytics'in bir raporunda, enerji ve bankacılık da büyük modellerin uygulanmasında en hızlı ilerleme kaydeden iki sektör olarak listelendi.
Buna ek olarak, altı aylık raporda, Çin Sanayi ve Ticaret Bankası, Çin Ziraat Bankası, Çin Bankası, İletişim Bankası, Çin Tüccarlar Bankası, Çin CITIC Bankası, Sanayi Bankası, Huaxia Bankası ve Zheshang Bankası dahil olmak üzere dokuz banka, büyük modellerin uygulanmasını araştırmayı açıkça önerdi.
Büyük ölçekli model üreticileri tarafında, bazı yoğun endüstri modellerinin piyasaya sürülmesi, finansal senaryoların uygulanmasının sıcaklığını da yansıtıyor.
Örneğin, Mayıs ayı sonlarında Du Xiaoman, 100 milyar seviyeli Çin modeli "Xuanyuan"ı piyasaya sürdü; Haziran ayında Tencent Cloud, finansal model işbirliğini yürütmek için DCIS ile el ele verdi, Çin Ziraat Bankası, ChatGPT benzeri büyük model uygulaması ChatABC'yi başlattı ve Çin Sanayi ve Ticaret Bankası, Ascend AI'ya dayalı finans sektörü için genel bir model yayınladı.
Temmuz'dan Ağustos'a kadar, "Üretken Yapay Zeka Hizmetlerinin Yönetimi için Geçici Önlemler"in resmi olarak uygulanmasıyla, Tencent, Baidu, iFLYTEK, Huawei, ByteDance ve diğer şirketler de dahil olmak üzere birçok şirket, en son büyük ölçekli model ilerlemesini art arda yayınladı; Eylül ayında Ant Group, finansal modelini ve üretken bir yapay zeka programlama platformu olan açık kaynaklı CodeFuse'u da resmi olarak yayınladı.
**Finans alanı, şüphesiz büyük modellerin inmesi için en çok senaryodan biridir. **
İster enerji alanında ister finans alanında olsun, ilkinin büyük modellerin öncü inişini başarabilmesinin nedeni, bu iki endüstri arasındaki bazı ortaklıklardan kaynaklanmaktadır. **
Her şeyden önce, enerji ve bankacılık sektörleri, büyük modellerin eğitimi ve uygulanması için uygun koşullar sağlayan, iyi bir veri temeli ve dijital ortama sahip, son derece veri odaklı endüstrilerdir. **
İkincisi, her iki endüstrinin de çok sayıda veri işleme ve karar verme ihtiyacı vardır ve büyük ölçekli makine öğrenimi ve derin öğrenme teknolojileri, endüstrinin bu sorunları çözmesine ve karar verme verimliliğini ve doğruluğunu artırmasına yardımcı olabilir.
Buna ek olarak, enerji ve bankacılık sektörünün iş modeli nispeten olgundur ve yüksek ticari değere sahiptir, bu nedenle bu endüstrilerde büyük model teknolojisine olan talep de nispeten büyüktür, bu nedenle büyük modellerin uygulanmasını teşvik etmektedir.
Enerji ve bankacılık olmak üzere iki büyük endüstrinin, esas olarak iyi veri temeli, büyük teknik talep ve yüksek ticari değer gibi birçok faktörün kapsamlı etkisinden dolayı, büyük modellerin uygulanmasında nispeten hızlı olduğu görülebilir. **
Finans ve enerji olmak üzere iki iniş senaryosunda bile, büyük modeller için hala üstesinden gelinmesi zor bazı sorunlar olduğunu belirtmekte fayda var.
2 Beklenen sahne değerinin karşılanamaması
Finans sektöründe pazarlama, risk kontrolü ve operasyon, birçok bankanın daha fazla önem verdiği büyük modellerin uygulama yönleridir.
Bunlar arasında akıllı Soru-Cevap asistanı, akıllı müşteri hizmetleri, pazarlama görüntülerinin otomatik olarak oluşturulması ve kredi sonrası rapor yazma, bankaların ve diğer finansal kurumların aktif olarak düzenlendiği alt bölümlerdir. Bununla birlikte, şu anda, akıllı Soru-Cevap asistanı, akıllı müşteri hizmetleri ve pazarlama görüntülerinin otomatik olarak oluşturulması gibi üretken senaryoların değeri neredeyse beklenenle aynıdır, ancak karar vermede büyük modellerin uygulanmasının beklenen ve gerçek etkileri ile uyuyan müşteri uyandırma ve dijital iş salonları gibi yerel uygulama senaryoları arasında hala bir boşluk vardır.
Örneğin, akıllı müşteri hizmetleri senaryosunda, geçmişte, birkaç akıllı fikir tartışması soru bankası vardı ve alaka düzeyi yoktu. Günümüzde, büyük modellere dayalı kişiselleştirilmiş soru bankalarının üretimi, eğitim döngüsünü kısaltabilir ve pazarlama görsellerinin otomatik olarak oluşturulmasında, tasarımcılar malzeme kitaplığında seçer ve tasarlarlardı, ancak şimdi otomatik olarak oluşturmak için Midjourney'i kullanabilirler, bu da telif hakkı maliyetlerini ve işçilik maliyetlerini azaltabilir.
Uyuyan müşteri uyanışı ve dijital iş salonu senaryosu değer beklentisi söz konusu olduğunda, birincisi, uyandırma etkisini iyileştirmek için uçtan uca bir stratejiye ulaşabilen bir stratejiyi otomatik olarak oluşturmak için büyük bir model kullanır. İkinci büyük model tarafından desteklenen dijital insan, müşterilerin işlerini yürütmelerine yardımcı olur, işlemleri tamamlamak için ürünler önerir ve APP'den bağımsız olarak yeni kanallar gerçekleştirebilir.
Bununla birlikte, şu anda, bu iki senaryonun pratik uygulama değeri henüz bilinmemektedir. **
Enerji sektöründe büyük ölçekli modellerin uygulanması da benzerdir.
Enerji sektöründe, ekipman çalıştırma ve denetleme bilgi asistanları ve akıllı müşteri hizmetleri gibi üretken uygulamaların değeri neredeyse beklenenle aynıdır. Bununla birlikte, bakım belgeleri, ekipman arıza onarımı ve güç yükü tahmini gibi senaryolarda, senaryonun gerçek değeri hala bilinmemektedir. **
Spesifik olarak, ekipman çalıştırma ve denetim bilgi asistanı senaryosunda, geçmişte NLP teknolojisine dayalı yapılandırılmış bir bilgi tabanı oluşturulmuştur ve büyük bir modelin kutsamasıyla, operasyon ve denetim asistanı, verimliliği artırmak için büyük bir modelin desteğiyle oluşturulabilir ve akıllı müşteri hizmetleri senaryosunda, geçmişte Bert modeline dayalı akıllı bir müşteri hizmeti kullanıldı ve şimdi akıllı müşteri hizmetlerinin kullanıcı deneyimi, daha doğru niyet anlayışı, daha antropomorfik dil ve iyileştirilmiş kullanıcı deneyimi elde edebilen büyük bir model kullanılarak geliştirildi.
Bakım belgesi oluşturma, ekipman arıza bakımı ve güç yükü tahmini senaryolarında, büyük modelin değeri, verimliliği artırmak için belgeleri hızlı ve otomatik olarak oluşturmaktır, büyük model arızanın nedenini hızlı bir şekilde bulabilir ve bakım önerileri ve çözümleri sağlayabilir ve tahmin doğruluğunu artırmak için yükü gerçek zamanlı olarak tahmin etmek için daha fazla etkileyen faktör içerir.
Ancak şu anda bu senaryolarda büyük modellerin değeri henüz bilinmemektedir ve keşfedilmesi için hala zamana ihtiyacı vardır. **İster finans sektörü ister enerji sektörü olsun, üretim senaryosunun hızlı bir şekilde karaya çıktığı ve birçok uygulamaya sahip olduğu, karar verme senaryosunun ise daha yavaş ve inişinin daha zor olduğu ve daha az uygulama olduğu tespit edilebilir. **
3 "Senaryolar > Karar Verme Senaryoları Oluşturma": Dönüştürülmesi Zor Üretkenlik
Şu anda, ** büyük modelin uygulanması hala pilot uygulama aşamasındadır ve tam olarak başlatılmamıştır. **
Yukarıda bahsedildiği gibi, finans sektöründe akıllı Soru-Cevap, akıllı müşteri hizmetleri, dijital iş salonları, kredi sonrası rapor oluşturma, uyuyan müşterilerin uyandırılması ve finansal ürün önerisi gibi yapay zeka büyük model uygulamaları kademeli olarak hayata geçirilmiş ve akıllı müşteri hizmetleri, ekipman çalıştırma ve denetim bilgi asistanları, bakım belgesi oluşturma, güç sistemi simülasyon platformları ve güç yükü tahmini enerji sektöründe pilot uygulama yapılmıştır.
Bununla birlikte, tüketim malları perakendesi, menkul kıymetler ve medya hala keşif aşamasındayken, imalat ve ilaç şirketleri hala bekle ve gör aşamasındadır.
Büyük modelin uygulanmasının genişlik olarak daha iyimser olmasına rağmen, derinlemesine daha zor olduğu görülebilir.
Büyük bir modelin derinliği, yeteneklerine, ölçeğine, bilgi işlem kaynaklarına, veri kalitesine, etki alanı bilgisine vb. bağlıdır. Bununla birlikte, mevcut yerli model için, geliştirmenin ilk aşamasındadır ve birçok tesis ve yetenek hala kademeli olarak gelişmektedir. **
Model yetenekleri ve uygulama etkileri gibi faktörlerle sınırlı olan mevcut yerleştirme uygulaması, temel olarak oluşturma senaryolarına dayanmaktadır. **
Karar verme modelinden farklı olarak, üretken model esas olarak metin üretimi, diyalog sistemi, dil çevirisi vb. alanlarda kullanılır ve metinlerin üretim kurallarını ve iç anlamsal ilişkilerini öğrenmek için büyük miktarda metin verisini analiz ederek yüksek kaliteli metin çıktısı üretebilir. Üretken büyük modellerin temsili modelleri arasında OpenAI'nin GPT serisi ve Baidu'nun Wenxin Yiyan'ı yer alıyor.
Karar verme modelleri ağırlıklı olarak öneri sistemleri, pekiştirmeli öğrenme ve diğer alanlarda kullanılır ve işlenmesi gereken veriler genellikle sürekli sayısal değişkenler içerir ve karar vermek veya gelecekteki davranışları tahmin etmek gerekir. Karar verme modellerinin temsili modelleri arasında DeepMind'ın AlphaZero serisi ve OpenAI'nin Dota2 AI'sı bulunur.
Karar verme modeliyle karşılaştırıldığında, üretken model her şeyden önce metin oluşturma ve diyalog sistemindedir, veriler çok sayıda metin derlemi aracılığıyla toplanabilir ve düzenlenebilirken, öneri sistemi ve pekiştirmeli öğrenmede verilerin genellikle manuel olarak tasarlanması ve oluşturulması gerekir, bu da nispeten karmaşıktır.
İkinci olarak, metin oluşturma ve diyalog sistemleri alanlarındaki araştırmalar nispeten olgunlaşmıştır ve kullanılabilecek birçok hazır algoritma ve çerçeve varken, öneri sistemleri ve pekiştirmeli öğrenme alanları daha fazla keşif ve araştırmaya ihtiyaç duymaktadır.
Ayrıca, arama motorları, sohbet robotları, otomatik yazma vb. gibi metin oluşturma ve diyalog sistemleri gibi alanlarda çok çeşitli uygulama senaryoları bulunurken, öneri sistemleri ve pekiştirmeli öğrenme ağırlıklı olarak e-ticaret, reklamcılık, oyunlar ve diğer alanlarda kullanılmaktadır.
Üretken senaryolar yaygın olarak kullanılsa da, tahmine dayalı karar verme senaryolarının gelecekte yüksek değerli senaryolar olduğu bir gerçektir. İster büyük bir model tedarikçisi ister bir kuruluş olsun, büyük model yeteneklerine dayalı olarak iş değerini artırmak istiyorsanız, ikincisi çabaların yönüdür. **
4 Sektör senaryosunda yapay zeka modeline bakalım
**Büyük bir modelin inişi için öncelikle uygun alanların ve senaryoların seçilmesi gerekir. Bu alandaki senaryolar güçlü dijital yeteneklere ve dijital temellere sahiptir. **
Örneğin, akıllı müşteri hizmetleri alanında, SSS sistemleri ve sohbet robotları gibi senaryolar için büyük modeller düşünülebilir. Reklam önerisi alanında, e-ticaret platformlarında kişiselleştirilmiş öneriler gibi senaryolara uygulanabilir; Kamuoyu izleme alanında, haber medyasının içerik sınıflandırması ve duygu analizi gibi senaryolara uygulanabilir.
İkincisi, yüksek model kabiliyetine ve uygulama etkisine sahip olmalıdır. Mevcut kurumsal kullanıcıların büyük modeli uygulamak için ana yolu perspektifinden bakıldığında, grup işletmelerinin odak noktası büyük modellerin kapasite geliştirmesi ve genel işletmelerin/departmanların odak noktası uygulama senaryolarının araştırılmasıdır. Büyük model kapasite geliştirme üç seviyeye ayrılır: altyapı inşaatı, büyük model eğitimi ve büyük model uygulaması.
Şu anda, büyük modellerin uygulama yönünün esas olarak iki türe ayrıldığını belirtmekte fayda var: birincisi, küçük modeller temel dayanak noktasıdır ve büyük modeller küçük modellerin geliştirme verimliliğini artırır; **
Ancak, bu giriş yolu modelin özelliklerini sınırlar.
Büyük ölçekli model inişinin derinliğini teşvik etmek için, büyük ölçekli model tedarikçileri ve işletmelerin yetenekleri ve işbirliği modellerini keşfetmeye devam etmesi gerekir. **
Büyük modellerin inişini derinleştirmek için bazı yollar yavaş yavaş netleşiyor.
Gelecekte, büyük ölçekli model teknolojisinin sürekli geliştirilmesi ve yaygınlaşmasıyla birlikte, model kaskad uygulaması giderek daha kapsamlı hale gelecektir.
Örneğin, konuşma tanıma, görüntü tanıma ve doğal dil işleme gibi daha karmaşık ve doğru uygulama senaryoları elde etmek için birden çok büyük model birleştirilebilir ve basamaklandırılabilir. Aynı zamanda, büyük modeller ve küçük modeller de kendi avantajlarından tam anlamıyla yararlanmak ve modelin performansını ve genelleme yeteneğini geliştirmek için basamaklandırılabilir.
Buna dayanarak, büyük modellerin uygulama derinliği genişletilir ve çeşitli alanlarda karar verme senaryolarının uygulanması hızlandırılır.
İkincisi, farklı endüstrilerin farklı özel ihtiyaçları vardır ve büyük modellerin gelecekte daha özelleştirilmiş bir yönde gelişmesi gerekir. Sektöre özel derlemlerin eğitimi sayesinde, büyük modeller farklı endüstrilerin gerçek uygulama senaryolarına daha iyi uyum sağlayabilir.
İkincisi, pratik uygulamalarda verimlilik ve kaynak gereksinimlerini daha iyi karşılayabilmek için büyük modellerin daha hafif olma yönünde geliştirilmesi gerekmektedir. Model sıkıştırma ve ayıklama gibi teknikler, modelin performansını sağlarken modelin boyutunu ve bilgi işlem kaynak tüketimini azaltabilir.
Ayrıca, veri gizliliği koruma konularının giderek daha fazla öne çıkmasıyla birlikte, büyük modellerin veri güvenliğine ve gizlilik korumasına daha fazla dikkat etmesi gerekiyor.
Modelin özelleştirilmesi, hafifliği ve veri güvenliği, uygulanması için önemli faktörler haline geldi.
Çin'in yapay zeka modelinin uygulanması, akıllı müşteri hizmetleri, reklam önerisi ve kamuoyu izleme alanlarında bir dizi başarı elde etti. Bununla birlikte, ** iniş sürecinde de birçok zorlukla karşı karşıyadır. Gelecekte, endüstri özelleştirmesi, model hafifliği ve veri güvenliği gibi teknolojilerin geliştirilmesiyle birlikte, AI büyük modellerinin inişi ve uygulanması daha geniş bir geliştirme alanını başlatacaktır. **