Pengoptimalan dan terobosan apa yang akan dihasilkan saat model besar bertarung di 2.0

Teks asli: Makalah, penulis: Che Xingyun

Sumber gambar: Dihasilkan oleh AI‌ Tak Terbatas

Pada bulan Juni tahun ini, pabrikan besar telah meningkatkan produk mirip ChatGPT mereka. Pada tanggal 9 Juni, Xunfei meluncurkan versi yang ditingkatkan dari Model Besar Kognitif Xinghuo; pada tanggal 13 Juni, setelah merilis produk mirip ChatGPT, 360 kembali mengadakan Konferensi Aplikasi Model Besar Otak Cerdas 360.

Berbeda dengan model besar yang dirilis sekitar bulan Februari, produk upgrade yang dirilis oleh berbagai perusahaan akhir-akhir ini lebih condong ke lapisan aplikasi, dan tujuannya untuk memudahkan ribuan rumah tangga.

Dilihat dari rilis saat ini, 360 Intellectual Brain pada awalnya memiliki kemampuan generasi lintas modal.Selain menghasilkan teks, tabel, dan gambar dari teks; menghasilkan teks dan gambar dari gambar, dan menghasilkan teks dari video, dan memotong video dari teks dan kreasi dasar lainnya Selain itu, ini juga mengubah "manusia digital" untuk memberi pengguna "kecerdasan buatan" yang dapat disesuaikan dan eksklusif yang "memiliki jiwa, desain manusia, dan memori".

Saat ini, skenario aplikasi dengan jarak terdekat antara 360 Smart Brain dan pengguna adalah 360's existing family bucket. Zhou Hongyi mengatakan pada konferensi pers bahwa "360 Smart Brain 4.0" akan terhubung ke 360 Security Guard, 360 Browser, 360 Search, dll. Kolaborasi manusia-mesin.

Pada konferensi pers, Zhou Hongyi mengubah sudut pandangnya sebelumnya, "Saya pernah mengatakan bahwa jarak antara model skala besar domestik dan ChatGPT adalah dua tahun, dan sekarang saya ingin menarik kembali kalimat ini." Levelnya setara dengan GPT3.5, dan jika berkembang pada kecepatan ini, ia akan mengejar atau bahkan melampaui GPT4 dalam sekejap mata.

Dalam waktu empat bulan sejak rilis versi awal hingga rilis resmi 360 Smart Brain, apakah Zhou Hongyi melihat perubahan yang begitu besar?

Raksasa sains dan teknologi berburu model besar

"Laporan Penelitian Peta Model Skala Besar Kecerdasan Buatan China" yang dirilis pada Forum Zhongguancun 2023 menunjukkan bahwa saat ini, model skala besar kecerdasan buatan China menunjukkan tren perkembangan yang kuat. Menurut statistik yang tidak lengkap, hingga saat ini, 79 model berskala besar dengan parameter lebih dari 1 miliar telah dirilis secara nasional.

Namun, parameter model skala besar perusahaan teknologi besar relatif besar: parameter model besar Alibaba Tongyi Qianwen di atas 10 triliun, parameter model besar Tencent Hunyuan dan model besar Pangu Huawei semuanya di atas satu triliun , dan model besar Baidu Wenxin memiliki parameter lebih dari satu triliun. Volume parameter model skala besar lebih dari 200 miliar, dan volume parameter model besar JD Yanxi adalah 100 miliar; volume parameter perusahaan teknologi di industri vertikal umumnya lebih dari 100 miliar, dan volume parameter model besar lembaga penelitian ilmiah Pada tingkat seratus miliar ke bawah.

Dari perspektif sistem tata letak model besar, perusahaan teknologi besar telah melakukan tata letak komprehensif empat-dalam-satu di lapisan daya komputasi, lapisan platform, lapisan model, dan lapisan aplikasi. Baidu, Ali, dan Huawei semuanya memiliki tata letak penelitian dan pengembangan independen yang komprehensif dari chip hingga aplikasi, seperti "inti Kunlun + platform dayung terbang + model besar Wenxin + aplikasi industri" Baidu, "chip Hanguang 800 + basis M6-OFA" Ali + Model besar Tongyi + aplikasi industri", Huawei "chip Shengteng + kerangka kerja MindSpore + model besar Pangu + aplikasi industri".

Selain itu, Kingsoft Office juga merilis WPS AI pada 31 Mei. Saat ini, WPSAI telah terkoneksi dengan komponen office Kingsoft Office seperti dokumen ringan, teks, tabel, presentasi, dan PDF. Kedepannya akan berlabuh AIGC, pemahaman bacaan , tanya jawab, dan interaksi manusia-komputer, pengembangan ke arah yang strategis, dan akses ke jajaran lengkap produk Kingsoft Office.

Masuknya cepat berbagai pabrikan besar ke jalur ini terutama disebabkan oleh tindak lanjut yang cepat dan penerapan langkah-langkah oleh otoritas pengatur untuk mengatur pengembangan industri. Dengan pengawalan struktur tingkat atas, setiap pabrikan besar dapat secara alami berinvestasi dalam penelitian dan pengembangan serta meluncurkan produk dengan percaya diri.

Sejak model skala besar diluncurkan secara bertahap pada bulan Maret tahun ini, kebijakan regulasi AI secara bertahap menjadi jelas, yang juga menunjukkan arah untuk aplikasi industri.

Melihat kembali perkembangan seluruh industri, pada 11 April, "Metode Manajemen Layanan Kecerdasan Buatan Generatif" dirilis untuk komentar; pada 30 Mei, Institut Teknologi Informasi dan Komunikasi bersama-sama mempersiapkan model kecerdasan buatan terbuka "Layang-layang" lisensi, dan langkah selanjutnya adalah menerbitkan " Lisensi Model Kecerdasan Buatan Zhikite Terbuka (Draf untuk Komentar).

Selanjutnya, kota-kota tingkat pertama bersama-sama merilis "Rencana Implementasi Beijing untuk Mempercepat Pembangunan Sumber Inovasi Kecerdasan Buatan yang Berpengaruh Secara Global (2023-2025)"; Tahun)".

Dalam konteks ini, Zhou Hongyi percaya bahwa model besar domestik akan dengan cepat mempersempit kesenjangan dengan ChatGPT, yang tampaknya mudah dipahami.

Apa perbedaan antara 360 Smart Brain

Menurut rencana Zhou Hongyi, model besar 360 akan didasarkan pada peningkatan berkelanjutan dari model besar, dengan mempertimbangkan adeganisasi, produksi, perataan, dan vertikalisasi.

Di bawah strategi pengembangan ini, 360 Smart Brain dapat menjangkau konsumen (asisten AI pribadi pengguna), usaha kecil dan menengah (aplikasi vertikal SaaS), perusahaan/pemerintah/kota (model penyebaran yang diprivatisasi), industri (model vertikal industri) dan empat lainnya skenario aplikasi utama.

Untuk lebih memenuhi kebutuhan skenario berbeda yang disebutkan di atas, model skala besar umum perlu menyelesaikan transformasi dari memasukkan teks ke keluaran teks, untuk memahami gambar dan video, dan mampu menghasilkan gambar dan video pada saat ini. dasar, yang setara dengan membuat model skala besar Dengan "telinga" dan "mata", ini meletakkan dasar untuk menciptakan "manusia digital".

Manusia digital tradisional hanya perlu mengeluarkan sesuai dengan skrip yang ditetapkan, tetapi di era model besar, manusia digital 360 dapat disesuaikan, sehingga orang dirancang, memiliki ingatan, dan pengalaman.Saat ini, ada lebih dari 200 karakter dalam 360 platform kotak manusia digital , dibagi menjadi dua kategori: selebriti digital dan karyawan digital. 360 berharap di masa depan, setiap orang akan memiliki asisten AI mereka sendiri dan memiliki kesempatan untuk berkomunikasi dengan manusia purba di ruang virtual, melintasi ruang dan waktu.

Pada pertemuan demonstrasi, Zhou Hongyi bertanya kepada "Zhuge Liang" bagaimana menurutnya itu telah menjadi bahan untuk hantu dan hewan hari ini, dan pria digital itu menjawab dengan nada Zhuge Liang: nasib masa lalu dan masa kini tidak dapat dihindari. Dalam situasi hari ini, dunia berada dalam kekacauan. Meskipun saya sudah tua, saya masih bertujuan untuk dunia. Anak muda saat ini menggunakan saya sebagai bahan untuk hantu dan hewan, dan saya siap menerima perubahan ini. Dan saya berharap teman-teman muda untuk maju dengan berani di jalan depan dan menciptakan masa depan yang lebih baik.

Pada saat yang sama, Zhou Hongyi juga menekankan bahwa bentuk manusia digital di masa depan juga akan memiliki tujuan, kemampuan perencanaan dan penguraiannya sendiri, sehingga berbagai model vertikal dapat dipanggil untuk menyelesaikan tugas.

Namun, fungsi ini sebenarnya adalah pengoptimalan berdasarkan aplikasi model skala besar yang ada, dan belum membuka bidang baru. Namun nyatanya, ketika model besar telah membuat terobosan, skenario aplikasi paling kreatif adalah mengemudi tanpa awak.

** Mengemudi tanpa pengemudi memiliki peluang untuk memasuki jalur cepat **

Melihat kembali bidang mengemudi tanpa awak, sejak 2016, pabrikan besar telah menerapkan di bidang ini, tetapi hingga tahun ini, tidak satu pun dari mereka yang dapat mencapai mengemudi tanpa awak yang sebenarnya.

Saat ini, sistem penggerak tak berawak level L2+ membutuhkan 10+ kamera; 1-2 lidar; atau radar gelombang 3-5 milimeter untuk menyediakan data multi-dimensi, yang dapat digunakan untuk pelatihan model setelah pelabelan manual. Setelah munculnya model besar yang dapat mengenali gambar, biaya waktu dan pengeluaran material yang diperlukan untuk pelabelan manual akan turun tajam.

Menurut konferensi pers Momo Zhixing DriveGPT pada April 2023, untuk mendapatkan informasi seperti garis jalur, peserta lalu lintas, lampu lalu lintas, dll., biaya pelabelan manual di industri adalah sekitar 5 yuan per gambar, dan biaya Momo DriveGPT adalah 0,5 yuan. Kami percaya bahwa setelah pelatihan model skala besar perusahaan teknologi matang, biaya marjinal pelabelan otomatis satu gambar akan mendekati 0, dan biaya rata-rata diharapkan semakin menurun.

Menurut Zhang Peng, wakil presiden Proyek Data Kaiwang, pada Februari 2023, saat ini, pelabelan manual adalah metode utama pelabelan data, ditambah dengan pelabelan mesin, dan 95% pelabelan data sebagian besar masih manual. Intervensi model besar dapat sangat meningkatkan efisiensi industri ini. Mengambil Tesla sebagai contoh, tim pelabelan manual akan memiliki lebih dari 1.000 orang pada tahun 2021, dan tim tersebut akan memberhentikan lebih dari 200 orang pada tahun 2022.

Selain itu, di era model besar, raksasa teknologi pihak ketiga diharapkan dapat membantu OEM membangun algoritme penggerak otonom mereka sendiri dan sistem loop tertutup data dengan menyediakan rantai alat yang lengkap, sambil mengandalkan kemampuan pembuatan data model besar untuk mempersempit celah di bidang data , era mengemudi otonom Android diharapkan akan datang.

Saat ini, model besar telah digunakan untuk mengaktifkan data loop tertutup, simulasi, algoritma persepsi, algoritma regulasi dan kontrol, dan bidang lainnya. Dan raksasa seperti Microsoft dan Nvidia bersaing untuk tata letak dalam model besar dan mengemudi otonom, atau akan memicu percikan api baru.

Selain itu, kemunculan model-model besar juga mendorong pembagian kerja di industri, menghindari "penciptaan kembali roda", dan mempercepat iterasi sensor dan chip, dan biaya sistem diharapkan turun secara signifikan. Pengembang dan pemain model skala besar dalam rantai industri penggerak otonom diharapkan mendapat manfaat secara menyeluruh.

Mengambil Baidu Apollo sebagai contoh, pertama-tama menggunakan informasi grafis untuk pra-pelatihan model asli, menggunakan algoritme untuk mengidentifikasi, menemukan, dan mengelompokkan data gambar tampilan jalan, dan memasukkannya ke dalam pembuat enkode untuk membentuk pustaka dasar, yaitu, menetapkan korespondensi antara gambar dan informasi teks berdasarkan kumpulan data tampilan jalan.

Kedua, Anda dapat mencari dan menambang pemandangan tertentu (seperti kendaraan ekspres, kursi roda, anak-anak, dll.) melalui teks dan gambar, dan melakukan pelatihan yang disesuaikan pada model sisi kendaraan, yang sangat meningkatkan pemanfaatan data stok.

Baidu menggunakan metode semi-diawasi untuk memanfaatkan sepenuhnya data 2D dan 3D untuk melatih model persepsi besar. Dengan menyaring model kecil dalam beberapa langkah, kinerja model kecil ditingkatkan, dan pada saat yang sama, model kecil disesuaikan untuk pelatihan melalui pelabelan otomatis, yang digunakan untuk meningkatkan kemampuan persepsi 3D visual jarak jauh dan meningkatkan efek persepsi dari model persepsi multi-modal.

Pemain terkemuka lainnya, SenseTime, juga secara terbuka menyatakan bahwa AIGC dapat digunakan untuk menghasilkan pemandangan lalu lintas nyata dan sampel sulit untuk melatih sistem penggerak otomatis, dan data multimoda dapat digunakan sebagai input model besar untuk meningkatkan batas atas persepsi sistem tentang adegan sudut. .

Pada saat yang sama, model besar mengemudi otonom multi-modal dapat mewujudkan integrasi persepsi dan pengambilan keputusan yang terintegrasi, dan lingkungan 3D dapat direkonstruksi melalui dekoder lingkungan di ujung keluaran untuk mewujudkan pemahaman visual lingkungan; decoder perilaku dapat menghasilkan perencanaan jalur yang lengkap, decoder motivasi dapat digunakan Bahasa alami menjelaskan proses penalaran, membuat sistem mengemudi otonom lebih aman dan lebih dapat diandalkan.

Setelah model besar menyadari fungsi di atas, ambang batas untuk mengemudi tanpa awak akan semakin rendah di masa mendatang.Sementara pabrikan terkemuka mempercepat kemajuan proyek mengemudi tanpa awak, mereka juga dapat mengizinkan lebih banyak pemain baru untuk bergabung dalam bidang ini dan mengembangkan jalan yang membutuhkan jalan selain navigasi jalan Lacak fungsi perencanaan, seperti lebih mengoptimalkan perencanaan jalur robot penyapu.

Melihat sekarang, setelah periode rilis terpusat model skala besar dari Februari hingga Maret, dan periode pengembangan produk dari April hingga Mei dan arah kebijakan telah diklarifikasi secara bertahap, Juni telah memasuki periode rilis terpusat AI besar- produk dan aplikasi model skala Hal ini juga secara langsung mengarah pada pengurangan harga OpenAI API.

Di masa mendatang, teknologi AI akan terus mengulang, dan aplikasi akan terus berkembang. Pada saat yang sama, semakin banyak perusahaan teknologi besar akan meluncurkan produk untuk memotong jalur ini, yang akan terus meningkatkan kemakmuran industri dan menghasilkan lebih banyak manfaat bagi pengguna Produk serupa GPT yang memenuhi permintaan pasar, seperti Tencent, yang memiliki basis pengguna yang sangat besar, juga merilis solusi teknis di bidang model besar pada 19 Juni.

Ketika perusahaan-perusahaan ini bersatu, perkembangan industri akan memasuki jalur cepat, dan itu juga berarti pengguna C-end akan segera dapat menggunakan produk ini. Adapun siapa yang akan membayarnya, masing-masing pabrikan harus mengandalkannya kemampuan sendiri.

Lihat Asli
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate.io
Komunitas
Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)