Pada 17 Oktober, Amerika Serikat memperkuat larangan chip AI untuk pasar Cina. Diantaranya, kinerja dan kepadatan jelas dianggap sebagai standar kontrol ekspor, dan chip dengan daya komputasi lebih dari 300 teraflops per chip dan kepadatan kinerja lebih dari 370 gigaflops per milimeter persegi termasuk dalam daftar ekspor terlarang.
Meskipun di bawah larangan ini, chip AI kelas atas yang disediakan oleh AMD, Intel dan perusahaan lain juga terpengaruh. Namun, karena dominasi Nvidia di bidang chip AI global, larangan ini melibatkan pelatihan AI utama GPU NVIDIA seperti A100 dan H100, sehingga larangan chip ini juga dikenal sebagai "larangan NVIDIA".
Begitu berita itu keluar, itu segera memicu diskusi panas di industri AI. Namun, sebagian besar diskusi berfokus pada kapan larangan akan diterapkan, apakah ada zona penyangga, model GPU mana yang terlibat, dan berapa lama larangan akan berlangsung. Ini mengarah pada latar belakang makro yang jelas yang telah diabaikan: meskipun hubungan ekonomi dan perdagangan antara Cina dan Amerika Serikat telah berfluktuasi dari waktu ke waktu sejak pecahnya gesekan perdagangan, kontrol chip untuk Cina selalu meningkat tanpa henti. Secara khusus, larangan chip AI kelas atas telah diterapkan dengan kuat dalam banyak kontroversi.
Pada titik ini, tampaknya industri AI harus membentuk konsensus dasar: meninggalkan ilusi dan bersiap untuk pertarungan.
Alih-alih mengkhawatirkan GPU mana yang dilarang, apakah mungkin untuk mencabut larangan tersebut. Mengapa Anda tidak memeriksa kembali ke mana arah komputasi AI China di era Tirai Besi chip?
Pada artikel ini, kami berharap untuk memulai dari situasi industri saat ini dan memikirkan jalan ke depan untuk komputasi AI.
Situasi Saat Ini
Pertama-tama, kita harus memahami sebuah pertanyaan, yaitu, mengapa setelah diperkenalkannya larangan NVIDIA, reaksi opini publik dan industri AI tidak seserius pada awal blokade chip pada tahun 18 atau 19. Tampaknya hanya masalah apakah kartu grafis konsumen RTX 4090 dilarang telah memicu beberapa perdebatan di antara para gamer dan pedagang terkait.
Logika makro di balik ini adalah bahwa industri sangat enggan untuk melihat chip AI kelas atas dilarang, tetapi pada kenyataannya, situasi ini telah lama diharapkan. Di satu sisi, Amerika Serikat telah mempromosikan blokade chip di China selama bertahun-tahun, dan beberapa GPU kelas atas Nvidia telah dilarang, dan umpan balik dari industri telah lama disesuaikan dari kejutan menjadi ketenangan. Selain itu, setelah ledakan ChatGPT, pasar GPU kelas atas global telah meningkat tajam tahun ini, diikuti oleh pernyataan berulang Amerika Serikat untuk mempromosikan larangan keseluruhan penjualan chip AI kelas atas ke China. Setelah beberapa bulan, tidak ada bedanya dengan akhirnya jatuh palu.
Untuk mengatasi larangan yang dapat diperkirakan ini, dan pada saat yang sama ada promosi obyektif pengembangan model besar, dari akhir tahun lalu hingga paruh pertama tahun ini, sejumlah besar perusahaan Cina di bidang sains dan teknologi, keuangan, dan mobil berkonsentrasi pada penimbunan GPU kelas atas Nvidia, yang telah menyebabkan situasi di mana sulit untuk menemukan kartu di pasar. Dengan kata lain, bagi banyak perusahaan teknologi China kecil dan menengah dan startup AI, GPU kelas atas tidak dapat dibeli, dan tidak banyak yang berubah sejak larangan tersebut.
Kenyataan lain adalah bahwa chip AI kelas atas bukan tidak mungkin untuk dilokalisasi. Pada awal 18 dan 19 tahun setelah dimulainya friksi perdagangan, industri chip AI domestik mempercepat perkembangannya. Ini mengarah pada fakta bahwa dalam hal kebutuhan pelatihan AI, meskipun GPU kelas atas NVIDIA sulit diganti, mereka tidak tergantikan.
Selain itu, chip AI tidak relevan bagi konsumen massal seperti chip ponsel, dan Huawei telah membuat terobosan dalam chip ponsel. Semua jenis tanda telah bergabung untuk menyebabkan publik dan industri memiliki mentalitas yang tenang, bahkan sedikit aneh, tentang larangan ini.
Tetapi harus dilihat secara obyektif bahwa larangan ini sama sekali tidak berbahaya bagi industri AI China. Di satu sisi, sangat sulit untuk mengganti GPU NVIDIA dalam jangka pendek, baik dari segi kapasitas produksi chip maupun kompatibilitas ekologis. Dan larangan itu juga akan secara langsung membahayakan produsen yang menggunakan produk NVIDIA dalam skala besar di berbagai bidang seperti server AI.
Masalah yang lebih kritis adalah bahwa di masa depan, jika larangan itu berlanjut untuk waktu yang lama, komputasi AI China secara bertahap akan memisahkan diri dari chip kelas atas dunia, dan kemungkinan efek negatif jangka panjang sangat kompleks, seperti:
Apakah chip AI yang diwakili oleh GPU kelas atas NVIDIA menyebabkan terputusnya pengembangan daya komputasi AI China setelah diperbarui dan diulang?
Setelah pengembangan divergensi daya komputasi yang mendasarinya, akankah industri AI China tertinggal dalam pengembangan teknologi perangkat lunak seperti model besar?
Larangan chip AI ini telah menunjukkan karakteristik blokade skala besar. Akankah blokade teknologi ini benar-benar hanya bertahan di bidang chip AI? Akankah kemampuan dasar digital seperti daya komputasi umum, penyimpanan, dan perangkat lunak dasar menjadi target berikutnya?
Secara keseluruhan, larangan chip AI adalah permainan yang disiapkan untuk China, bukan serangan mendadak. Jika Anda ingin berhasil melewati level ini, Anda juga perlu memainkan setiap kartu di tangan Anda dengan baik dan memainkannya bersama, sehingga dapat mengurangi intensitas kerusakan dan meningkatkan tingkat kemenangan dalam jangka panjang.
Saat ini, komputasi AI China memiliki tiga "rencana terobosan" yang harus dikerjakan pada saat bersamaan.
Opsi 1: Manfaatkan identitas "pembeli" dengan baik
Ada kebenaran sederhana, logika perilaku pasar komersial ditentukan oleh penawaran dan permintaan. Namun, dalam perdagangan teknologi antara Cina dan Amerika Serikat, diwakili oleh chip, kita sering jatuh ke dalam kesalahan berpikir: kita berpikir bahwa sebagian besar aturan permainan ditetapkan oleh pemerintah dan perusahaan AS, dan mereka ingin menjual kita, kita akan membeli, dan mereka tidak akan mau membeli kita.
Sebagai "pembeli" terbesar pasar chip global, perusahaan China tidak memiliki hak untuk berbicara, yang sangat tidak masuk akal.
Bahkan, larangan chip AI di pasar China telah secara langsung merugikan raksasa teknologi Amerika yang diwakili oleh Nvidia. Saat ini, permintaan pasar terbesar untuk chip AI NVIDIA berasal dari China. Sebelumnya, CEO Nvidia Jensen Huang menjelaskan bahwa "jika kita kehilangan pasar China, kita tidak memiliki tindakan darurat, dan tidak ada China lain di dunia."
Dalam konteks ini, kita dapat melihat kontradiksi tajam antara perusahaan teknologi Amerika, yang mengejar kepentingan komersial, dan pemerintah AS, yang mengejar kepentingan politik. Perusahaan teknologi AS selalu mencari cara untuk menentang dan menghindari larangan tersebut, seperti Nvidia, yang meluncurkan versi GPU khusus China sebagai tanggapan atas embargo tahun lalu.
Pasar Cina mencerna sekitar sepertiga dari kapasitas produksi perusahaan teknologi AS, dan hubungan penawaran dan permintaan antara keduanya tidak dapat terputus untuk waktu yang lama. Dalam menghadapi larangan teknologi keseluruhan yang semakin jelas di Amerika Serikat, pasar Cina juga harus secara aktif memanfaatkan status "pembeli" untuk membuat perilakunya sendiri lebih berbeda dan dapat diprediksi.
Hindari membuat semacam kinerja dan kesan "selamat datang jika Anda menjual, hanya tidak berdaya jika Anda tidak menjual".
"Identitas pembeli" harus menjadi salah satu yang memiliki posisi, kekuasaan, dan kemarahan.
Skema 2: Ganti kartu dengan cloud, dan daya komputasi terkonsentrasi
Untuk jangka waktu yang lama, larangan AS terhadap chip AI China hanya dapat diperkuat, dan waktu ini bertepatan dengan tahap kritis pengembangan model besar AI. Banyak orang di industri percaya bahwa meskipun pengembangan model besar cepat, itu belum menunjukkan situasi cepat dari outlet ilmiah dan teknologi lainnya sebelumnya, dan kurangnya uang untuk investasi dan kurangnya kartu untuk komputasi adalah alasan utama.
Jadi bagaimana mengatasi masalah kesenjangan daya komputasi di industri AI China di bawah larangan tersebut? Rencana darurat pertama adalah bagi perusahaan untuk meningkatkan alokasi dan investasi daya komputasi cloud AI dan mempromosikan penggunaan cloud untuk menggantikan kartu.
Faktanya, di bawah tren umum bahwa chip AI kelas atas dapat dilarang, beberapa produsen cloud publik besar di China telah membuat langkah untuk meningkatkan penimbunan GPU kelas atas Nvidia. Di satu sisi, ini karena vendor cloud sendiri perlu meningkatkan investasi dalam model besar dan membuka pasar MaaS, sehingga ada permintaan langsung untuk daya komputasi AI. Di sisi lain, itu juga karena GPU dapat digunakan kembali untuk waktu yang lama setelah diubah menjadi kumpulan sumber daya cloud, yang merupakan situasi di mana vendor cloud dapat menyerang dan mundur. Oleh karena itu, pada paruh pertama tahun ini, ada situasi di mana semua chip AI kelas atas di pasaran mengalir ke produsen cloud, dan sulit bagi perusahaan kecil dan menengah untuk menemukan kartu.
Dari sudut pandang obyektif, perpindahan chip AI kelas atas ke cloud ini bermanfaat bagi seluruh pasar China untuk menangani larangan chip AI, dan juga sejalan dengan pemikiran strategis Eastern Data dan Western Computing.
Tren lain yang bagus untuk daya komputasi cloud AI adalah meningkatnya jumlah parameter model besar dan jumlah data yang digunakan. Pelatihan kumpulan kartu lokal menjadi semakin ketat. Pelatihan kilokalori dan 10.000 kalori yang harus terjadi di cloud telah menjadi arah pengembangan utama di masa depan, sehingga pengguna perusahaan secara alami akan lebih aktif di cloud.
Pada saat yang sama, daya komputasi cloud AI tidak hanya akan tetap pada tingkat penimbunan GPU NVIDIA. Selanjutnya, ini adalah tren umum untuk daya komputasi AI independen domestik untuk didorong ke cloud. Didorong oleh kebijakan yang relevan, vendor cloud meningkatkan pengadaan chip AI independen. Menurut data IDC, pada paruh pertama tahun 2023, 500.000 chip akselerator AI yang dikembangkan sendiri telah digunakan di server AI China. Dalam hal servitisasi daya komputasi AI otonom, HUAWEI CLOUD telah meluncurkan layanan cloud Ascend AI. Kekuatan komputasi AI, yang menggabungkan cloud dan otonomi, akan sangat dikembangkan dalam konteks larangan chip AI.
Selain itu, dalam beberapa tahun terakhir, sejumlah besar pusat komputasi AI yang menggunakan daya komputasi AI independen telah didirikan di berbagai tempat dalam konteks Data Timur dan Komputasi Barat, dan secara keseluruhan, kekuatan komputasi AI cloud China stabil dan dapat diandalkan.
Namun, banyak perusahaan masih lebih suka membeli daya komputasi AI lokal. Di satu sisi, ini karena pasar GPU NVIDIA kekurangan pasokan, dan retensi nilainya sangat baik, dan bahkan dapat digunakan sebagai aset inti perusahaan. Di sisi lain, daya komputasi cloud AI sering mengalami masalah seperti antrian, downtime, dan kurangnya layanan perangkat lunak.
Cara lebih meningkatkan pengalaman pengembang menggunakan daya komputasi cloud AI adalah arah berikutnya yang perlu menjadi fokus vendor cloud publik.
Solusi 3: Biarkan daya komputasi AI domestik tumbuh secara eksplosif
Dalam menghadapi babak baru larangan chip AI, apa kepercayaan terbesar industri AI China? Apakah itu kebiasaan setelah bertahun-tahun, atau apakah ada kelebihan makanan di rumah setelah sejumlah besar tunka? Tidak. Simpul yang paling kritis adalah bahwa setelah bertahun-tahun pengembangan, industri chip AI China telah berkembang pesat. GPU high-end Nvidia masih penting, tetapi tidak seperti tidak ada alternatif.
Menurut data yang sebelumnya dirilis oleh IDC, pengiriman kartu akselerator AI China pada tahun 2022 akan menjadi sekitar 1,09 juta, di mana pangsa pasar Nvidia akan mencapai 85%, pangsa pasar Ascend Reality Huawei akan mencapai 10%, Baidu Kunlun akan menjadi 2%, dan Cambrian dan Suiyuan Technology keduanya akan menjadi 1%.
Dapat dilihat bahwa daya komputasi AI domestik telah mencapai tingkat pangsa pasar tertentu, tidak hanya "di atas kertas" dalam konsep dan teori. Pada saat yang sama, perlu juga dicatat bahwa chip AI domestik masih belum ideal dalam hal kinerja inti, ekologi perangkat lunak, dan kapasitas pengiriman, dan jalan masih panjang. Di bawah kondisi obyektif larangan NVIDIA, daya komputasi AI domestik harus mengatasi kesulitan-kesulitan ini dalam jangka pendek dan mempercepat siklus pertumbuhan dan kematangannya sendiri.
Untuk mencapai tujuan ini, beberapa hal sangat penting:
**1. Bentuk konsensus industri untuk menghindari kebingungan konsep. **
Ketika berbicara tentang chip AI, kami sering mengatakan bahwa ia memiliki banyak cara untuk menerapkannya, dan ada banyak merek independen yang berpartisipasi di pasar ini, yang tampaknya makmur. Misalnya, chip AI termasuk GPU, FPGA, ASIC, integrasi penyimpanan dan komputasi dan chip seperti otak, dll., Dan produsen chip akselerasi AI domestik termasuk Alibaba, Baidu, Huawei, Kambrium, Informasi Haiguang, Teknologi Suiyuan, Tiantian Zhixin, Teknologi Biqian, Moore Threads, Loongson Zhongke, dll.
"Kemakmuran" semacam ini tidak hanya membingungkan dalam opini publik dan pasar investasi, tetapi juga sering muncul dalam beberapa laporan industri dan analisis kebijakan. Tetapi masalahnya adalah bahwa definisi chip AI umumnya terlalu berlebihan. Misalnya, chip seperti otak hanyalah imajinasi teknis di masa mendatang, dan jika chip seperti otak ditambahkan setiap kali chip AI domestik dibahas, itu hanya akan membuang waktu dan mengalihkan energi. Contoh lain, beberapa produsen chip AI hanya dapat membuat chip untuk digunakan sendiri dan tidak dapat mengirimkannya ke pasar. Beberapa vendor belum memiliki kemampuan untuk mengkomersialkan dan berada dalam tahap konstruksi awal, dan kontribusi mereka terhadap otonomi komputasi AI dalam jangka pendek sangat kecil.
Untuk mengatasi larangan GPU high-end Nvidia, kita perlu fokus pada alternatif GPU yang layak dan efektif, daripada membuat terlalu banyak asosiasi dan divergensi. Hanya dengan membentuk konsensus industri ini kita dapat mengumpulkan kekuatan untuk menyelesaikan masalah. **
**2. Beralih ke penggunaan komersial skala besar dan hindari pembuatan inti PPT. **
Faktanya, tidak peduli dari perspektif chip akselerasi AI atau mesin server, sangat sedikit produsen chip AI yang dapat mengirim di China. Terutama terkonsentrasi di Huawei dan Baidu, Teknologi Suiyuan dan Informasi Haiguang juga memiliki pengiriman tertentu. Sejumlah besar produsen semikonduktor dan perusahaan AI masih terjebak dalam rencana dan visi membangun chip. Hal ini menyebabkan stagnasi sejumlah besar chip AI domestik yang telah didukung oleh kebijakan dan ekspektasi pasar investasi, dan bahkan ada kecurigaan untuk tetap pada tahap ini untuk menikmati dividen pasar keuangan.
** Orientasi industri berikutnya harus beralih dari pembentukan chip AI ke pengiriman chip AI, membantu produsen chip AI mendapatkan umpan balik bisnis langsung, menerima pengujian pasar produk dan kapasitas produksi, dan secara bertahap membentuk arus kas positif. **
Memperkuat ekosistem perangkat lunak dan memperkuat kemampuan migrasi. **
Alasan mengapa GPU NVIDIA penting tidak hanya dalam kinerja perangkat keras, tetapi juga dalam kemampuan ekologis perangkat lunak dengan CUDA dan PyTorch sebagai intinya, sehingga pengembangan chip AI domestik tidak boleh meremehkan kemampuan perangkat lunak. Sambil memperkuat pembangunan ekosistem perangkat lunak independen, perlu juga memperhatikan kemampuan migrasi dan biaya migrasi untuk membangun model AI berdasarkan ekosistem NVIDIA.
Untuk tujuan ini, sejumlah besar produsen telah menjelajah, seperti DCU Informasi Haiguang, yang sangat mirip dengan CUDA dalam hal ekologi dan lingkungan pemrograman, dan pengguna CUDA dapat dengan cepat bermigrasi ke platform ROCm Haiguang dengan biaya rendah. Sebelumnya, PyTorch 2.1 mengumumkan dukungan untuk Huawei Ascend. Dapat dilihat bahwa chip AI domestik memiliki pengaruh skala tertentu dan dapat lebih terintegrasi ke dalam ekosistem perangkat lunak global.
**Di masa depan, jika Anda ingin mewujudkan ledakan komputasi AI domestik, Anda tidak dapat meninggalkan wabah ekologi perangkat lunak dasar AI domestik. **
Tingkatkan dukungan untuk "merek utama" dan bentuk efek skala besar. **
Untuk chip AI Amerika, selain GPU NVIDIA, apa lagi yang Anda ketahui? Bahkan jika pertanyaan ini ditanyakan kepada beberapa pengembang AI, jawabannya sebagian besar tidak jelas atau belum dicoba. Dapat dilihat bahwa komputasi AI, seperti halnya komputasi umum dan komputasi grafis, memiliki probabilitas tinggi bahwa satu atau dua "merek utama" pada akhirnya akan muncul. Ini milik hukum obyektif pasar, dan tidak perlu mencapai situasi "membiarkan seratus bunga mekar" dengan cara menarik bibit untuk membantu mereka tumbuh.
Bahkan sejauh komputasi AI China harus mempercepat kematangannya dan menyelesaikan tujuan substitusi otonom, adalah hal yang baik untuk mencapai situasi satu super dan banyak yang kuat sesegera mungkin. Ini dapat menghindari fragmentasi ekologis dan pemborosan sejumlah besar investasi TI yang disebabkan oleh ayunan industri. Proses ini harus diserahkan kepada pasar untuk memilih, perlahan-lahan mulai terbentuk. Namun, dalam konteks larangan chip, kebangkitan komputasi AI domestik telah berakhir, daripada membiarkan 100 jenis chip AI perlahan-lahan matang dan perlahan dikocok, seperti mempercepat pembentukan situasi penggantian cepat "merek utama".
Dilihat dari situasi saat ini, Ascend adalah kekuatan yang paling mungkin untuk menjadi merek utama daya komputasi AI domestik. Liu Qingfeng, pendiri dan ketua iFLYTEK, sebelumnya mengatakan bahwa GPU Huawei telah dibandingkan dengan NVIDIA A100. Menurut data, daya komputasi presisi bilangan bulat Ascend 310 mencapai 16 TOPS, dan daya komputasi presisi bilangan bulat Ascend 910 mencapai 640 TOPS. Ini berarti bahwa kinerja Ascend 910 mendekati NVIDIA A100.
Pada saat yang sama, Ascend saat ini adalah satu-satunya kekuatan komputasi AI domestik yang memiliki pangsa pasar yang stabil, dan telah menginkubasi arsitektur komputasi heterogen CANN yang mirip dengan NVIDIA CUDA dan kerangka komputasi AI MindSpore dalam perangkat lunak. Dalam hal kinerja inti, ekosistem perangkat lunak, dan pangsa pasar, Ascend memiliki kelayakan untuk mempercepat pertumbuhan dan mewujudkan lokalisasi skala besar daya komputasi AI.
** Standardisasi standar industri, memperkuat konstruksi perangkat lunak, dan meningkatkan dukungan merek independen adalah cara utama untuk mempromosikan pertumbuhan pesat daya komputasi AI domestik dalam jangka pendek. **
Larangan Nvidia adalah masalah yang umumnya tidak ingin dilihat oleh industri AI China, coba hindari, dan bahkan saat ini agak rahasia. Namun, situasinya lebih kuat daripada manusia, dan dalam proses percepatan de-globalisasi dan perlombaan AI, ada kemungkinan besar bahwa larangan serupa hanya akan jauh lebih mungkin terjadi di masa depan.
Penghindaran, jalan memutar, dan keheningan tidak dapat menyelesaikan masalah, dan hanya dengan tenang mengatasinya dan berjuang untuk perbaikan diri kita dapat secara mendasar menyelesaikan masalah dikendalikan oleh orang lain.
Di bawah larangan tersebut, ke mana perginya komputasi AI China dari sini?
Jawabannya adalah kita tidak punya pilihan, jadi kita harus memberi dunia pilihan kedua.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Setelah larangan NVIDIA, ke mana perginya komputasi AI China?
Sumber asli: Tubuh kutub otak
Pada 17 Oktober, Amerika Serikat memperkuat larangan chip AI untuk pasar Cina. Diantaranya, kinerja dan kepadatan jelas dianggap sebagai standar kontrol ekspor, dan chip dengan daya komputasi lebih dari 300 teraflops per chip dan kepadatan kinerja lebih dari 370 gigaflops per milimeter persegi termasuk dalam daftar ekspor terlarang.
Meskipun di bawah larangan ini, chip AI kelas atas yang disediakan oleh AMD, Intel dan perusahaan lain juga terpengaruh. Namun, karena dominasi Nvidia di bidang chip AI global, larangan ini melibatkan pelatihan AI utama GPU NVIDIA seperti A100 dan H100, sehingga larangan chip ini juga dikenal sebagai "larangan NVIDIA".
Begitu berita itu keluar, itu segera memicu diskusi panas di industri AI. Namun, sebagian besar diskusi berfokus pada kapan larangan akan diterapkan, apakah ada zona penyangga, model GPU mana yang terlibat, dan berapa lama larangan akan berlangsung. Ini mengarah pada latar belakang makro yang jelas yang telah diabaikan: meskipun hubungan ekonomi dan perdagangan antara Cina dan Amerika Serikat telah berfluktuasi dari waktu ke waktu sejak pecahnya gesekan perdagangan, kontrol chip untuk Cina selalu meningkat tanpa henti. Secara khusus, larangan chip AI kelas atas telah diterapkan dengan kuat dalam banyak kontroversi.
Pada titik ini, tampaknya industri AI harus membentuk konsensus dasar: meninggalkan ilusi dan bersiap untuk pertarungan.
Alih-alih mengkhawatirkan GPU mana yang dilarang, apakah mungkin untuk mencabut larangan tersebut. Mengapa Anda tidak memeriksa kembali ke mana arah komputasi AI China di era Tirai Besi chip?
Pada artikel ini, kami berharap untuk memulai dari situasi industri saat ini dan memikirkan jalan ke depan untuk komputasi AI.
Situasi Saat Ini
Pertama-tama, kita harus memahami sebuah pertanyaan, yaitu, mengapa setelah diperkenalkannya larangan NVIDIA, reaksi opini publik dan industri AI tidak seserius pada awal blokade chip pada tahun 18 atau 19. Tampaknya hanya masalah apakah kartu grafis konsumen RTX 4090 dilarang telah memicu beberapa perdebatan di antara para gamer dan pedagang terkait.
Logika makro di balik ini adalah bahwa industri sangat enggan untuk melihat chip AI kelas atas dilarang, tetapi pada kenyataannya, situasi ini telah lama diharapkan. Di satu sisi, Amerika Serikat telah mempromosikan blokade chip di China selama bertahun-tahun, dan beberapa GPU kelas atas Nvidia telah dilarang, dan umpan balik dari industri telah lama disesuaikan dari kejutan menjadi ketenangan. Selain itu, setelah ledakan ChatGPT, pasar GPU kelas atas global telah meningkat tajam tahun ini, diikuti oleh pernyataan berulang Amerika Serikat untuk mempromosikan larangan keseluruhan penjualan chip AI kelas atas ke China. Setelah beberapa bulan, tidak ada bedanya dengan akhirnya jatuh palu.
Untuk mengatasi larangan yang dapat diperkirakan ini, dan pada saat yang sama ada promosi obyektif pengembangan model besar, dari akhir tahun lalu hingga paruh pertama tahun ini, sejumlah besar perusahaan Cina di bidang sains dan teknologi, keuangan, dan mobil berkonsentrasi pada penimbunan GPU kelas atas Nvidia, yang telah menyebabkan situasi di mana sulit untuk menemukan kartu di pasar. Dengan kata lain, bagi banyak perusahaan teknologi China kecil dan menengah dan startup AI, GPU kelas atas tidak dapat dibeli, dan tidak banyak yang berubah sejak larangan tersebut.
Kenyataan lain adalah bahwa chip AI kelas atas bukan tidak mungkin untuk dilokalisasi. Pada awal 18 dan 19 tahun setelah dimulainya friksi perdagangan, industri chip AI domestik mempercepat perkembangannya. Ini mengarah pada fakta bahwa dalam hal kebutuhan pelatihan AI, meskipun GPU kelas atas NVIDIA sulit diganti, mereka tidak tergantikan.
Selain itu, chip AI tidak relevan bagi konsumen massal seperti chip ponsel, dan Huawei telah membuat terobosan dalam chip ponsel. Semua jenis tanda telah bergabung untuk menyebabkan publik dan industri memiliki mentalitas yang tenang, bahkan sedikit aneh, tentang larangan ini.
Tetapi harus dilihat secara obyektif bahwa larangan ini sama sekali tidak berbahaya bagi industri AI China. Di satu sisi, sangat sulit untuk mengganti GPU NVIDIA dalam jangka pendek, baik dari segi kapasitas produksi chip maupun kompatibilitas ekologis. Dan larangan itu juga akan secara langsung membahayakan produsen yang menggunakan produk NVIDIA dalam skala besar di berbagai bidang seperti server AI.
Masalah yang lebih kritis adalah bahwa di masa depan, jika larangan itu berlanjut untuk waktu yang lama, komputasi AI China secara bertahap akan memisahkan diri dari chip kelas atas dunia, dan kemungkinan efek negatif jangka panjang sangat kompleks, seperti:
Apakah chip AI yang diwakili oleh GPU kelas atas NVIDIA menyebabkan terputusnya pengembangan daya komputasi AI China setelah diperbarui dan diulang?
Setelah pengembangan divergensi daya komputasi yang mendasarinya, akankah industri AI China tertinggal dalam pengembangan teknologi perangkat lunak seperti model besar?
Larangan chip AI ini telah menunjukkan karakteristik blokade skala besar. Akankah blokade teknologi ini benar-benar hanya bertahan di bidang chip AI? Akankah kemampuan dasar digital seperti daya komputasi umum, penyimpanan, dan perangkat lunak dasar menjadi target berikutnya?
Secara keseluruhan, larangan chip AI adalah permainan yang disiapkan untuk China, bukan serangan mendadak. Jika Anda ingin berhasil melewati level ini, Anda juga perlu memainkan setiap kartu di tangan Anda dengan baik dan memainkannya bersama, sehingga dapat mengurangi intensitas kerusakan dan meningkatkan tingkat kemenangan dalam jangka panjang.
Saat ini, komputasi AI China memiliki tiga "rencana terobosan" yang harus dikerjakan pada saat bersamaan.
Opsi 1: Manfaatkan identitas "pembeli" dengan baik
Ada kebenaran sederhana, logika perilaku pasar komersial ditentukan oleh penawaran dan permintaan. Namun, dalam perdagangan teknologi antara Cina dan Amerika Serikat, diwakili oleh chip, kita sering jatuh ke dalam kesalahan berpikir: kita berpikir bahwa sebagian besar aturan permainan ditetapkan oleh pemerintah dan perusahaan AS, dan mereka ingin menjual kita, kita akan membeli, dan mereka tidak akan mau membeli kita.
Sebagai "pembeli" terbesar pasar chip global, perusahaan China tidak memiliki hak untuk berbicara, yang sangat tidak masuk akal.
Bahkan, larangan chip AI di pasar China telah secara langsung merugikan raksasa teknologi Amerika yang diwakili oleh Nvidia. Saat ini, permintaan pasar terbesar untuk chip AI NVIDIA berasal dari China. Sebelumnya, CEO Nvidia Jensen Huang menjelaskan bahwa "jika kita kehilangan pasar China, kita tidak memiliki tindakan darurat, dan tidak ada China lain di dunia."
Dalam konteks ini, kita dapat melihat kontradiksi tajam antara perusahaan teknologi Amerika, yang mengejar kepentingan komersial, dan pemerintah AS, yang mengejar kepentingan politik. Perusahaan teknologi AS selalu mencari cara untuk menentang dan menghindari larangan tersebut, seperti Nvidia, yang meluncurkan versi GPU khusus China sebagai tanggapan atas embargo tahun lalu.
Pasar Cina mencerna sekitar sepertiga dari kapasitas produksi perusahaan teknologi AS, dan hubungan penawaran dan permintaan antara keduanya tidak dapat terputus untuk waktu yang lama. Dalam menghadapi larangan teknologi keseluruhan yang semakin jelas di Amerika Serikat, pasar Cina juga harus secara aktif memanfaatkan status "pembeli" untuk membuat perilakunya sendiri lebih berbeda dan dapat diprediksi.
Hindari membuat semacam kinerja dan kesan "selamat datang jika Anda menjual, hanya tidak berdaya jika Anda tidak menjual".
"Identitas pembeli" harus menjadi salah satu yang memiliki posisi, kekuasaan, dan kemarahan.
Skema 2: Ganti kartu dengan cloud, dan daya komputasi terkonsentrasi
Untuk jangka waktu yang lama, larangan AS terhadap chip AI China hanya dapat diperkuat, dan waktu ini bertepatan dengan tahap kritis pengembangan model besar AI. Banyak orang di industri percaya bahwa meskipun pengembangan model besar cepat, itu belum menunjukkan situasi cepat dari outlet ilmiah dan teknologi lainnya sebelumnya, dan kurangnya uang untuk investasi dan kurangnya kartu untuk komputasi adalah alasan utama.
Jadi bagaimana mengatasi masalah kesenjangan daya komputasi di industri AI China di bawah larangan tersebut? Rencana darurat pertama adalah bagi perusahaan untuk meningkatkan alokasi dan investasi daya komputasi cloud AI dan mempromosikan penggunaan cloud untuk menggantikan kartu.
Faktanya, di bawah tren umum bahwa chip AI kelas atas dapat dilarang, beberapa produsen cloud publik besar di China telah membuat langkah untuk meningkatkan penimbunan GPU kelas atas Nvidia. Di satu sisi, ini karena vendor cloud sendiri perlu meningkatkan investasi dalam model besar dan membuka pasar MaaS, sehingga ada permintaan langsung untuk daya komputasi AI. Di sisi lain, itu juga karena GPU dapat digunakan kembali untuk waktu yang lama setelah diubah menjadi kumpulan sumber daya cloud, yang merupakan situasi di mana vendor cloud dapat menyerang dan mundur. Oleh karena itu, pada paruh pertama tahun ini, ada situasi di mana semua chip AI kelas atas di pasaran mengalir ke produsen cloud, dan sulit bagi perusahaan kecil dan menengah untuk menemukan kartu.
Dari sudut pandang obyektif, perpindahan chip AI kelas atas ke cloud ini bermanfaat bagi seluruh pasar China untuk menangani larangan chip AI, dan juga sejalan dengan pemikiran strategis Eastern Data dan Western Computing.
Tren lain yang bagus untuk daya komputasi cloud AI adalah meningkatnya jumlah parameter model besar dan jumlah data yang digunakan. Pelatihan kumpulan kartu lokal menjadi semakin ketat. Pelatihan kilokalori dan 10.000 kalori yang harus terjadi di cloud telah menjadi arah pengembangan utama di masa depan, sehingga pengguna perusahaan secara alami akan lebih aktif di cloud.
Pada saat yang sama, daya komputasi cloud AI tidak hanya akan tetap pada tingkat penimbunan GPU NVIDIA. Selanjutnya, ini adalah tren umum untuk daya komputasi AI independen domestik untuk didorong ke cloud. Didorong oleh kebijakan yang relevan, vendor cloud meningkatkan pengadaan chip AI independen. Menurut data IDC, pada paruh pertama tahun 2023, 500.000 chip akselerator AI yang dikembangkan sendiri telah digunakan di server AI China. Dalam hal servitisasi daya komputasi AI otonom, HUAWEI CLOUD telah meluncurkan layanan cloud Ascend AI. Kekuatan komputasi AI, yang menggabungkan cloud dan otonomi, akan sangat dikembangkan dalam konteks larangan chip AI.
Selain itu, dalam beberapa tahun terakhir, sejumlah besar pusat komputasi AI yang menggunakan daya komputasi AI independen telah didirikan di berbagai tempat dalam konteks Data Timur dan Komputasi Barat, dan secara keseluruhan, kekuatan komputasi AI cloud China stabil dan dapat diandalkan.
Namun, banyak perusahaan masih lebih suka membeli daya komputasi AI lokal. Di satu sisi, ini karena pasar GPU NVIDIA kekurangan pasokan, dan retensi nilainya sangat baik, dan bahkan dapat digunakan sebagai aset inti perusahaan. Di sisi lain, daya komputasi cloud AI sering mengalami masalah seperti antrian, downtime, dan kurangnya layanan perangkat lunak.
Cara lebih meningkatkan pengalaman pengembang menggunakan daya komputasi cloud AI adalah arah berikutnya yang perlu menjadi fokus vendor cloud publik.
Solusi 3: Biarkan daya komputasi AI domestik tumbuh secara eksplosif
Dalam menghadapi babak baru larangan chip AI, apa kepercayaan terbesar industri AI China? Apakah itu kebiasaan setelah bertahun-tahun, atau apakah ada kelebihan makanan di rumah setelah sejumlah besar tunka? Tidak. Simpul yang paling kritis adalah bahwa setelah bertahun-tahun pengembangan, industri chip AI China telah berkembang pesat. GPU high-end Nvidia masih penting, tetapi tidak seperti tidak ada alternatif.
Menurut data yang sebelumnya dirilis oleh IDC, pengiriman kartu akselerator AI China pada tahun 2022 akan menjadi sekitar 1,09 juta, di mana pangsa pasar Nvidia akan mencapai 85%, pangsa pasar Ascend Reality Huawei akan mencapai 10%, Baidu Kunlun akan menjadi 2%, dan Cambrian dan Suiyuan Technology keduanya akan menjadi 1%.
Dapat dilihat bahwa daya komputasi AI domestik telah mencapai tingkat pangsa pasar tertentu, tidak hanya "di atas kertas" dalam konsep dan teori. Pada saat yang sama, perlu juga dicatat bahwa chip AI domestik masih belum ideal dalam hal kinerja inti, ekologi perangkat lunak, dan kapasitas pengiriman, dan jalan masih panjang. Di bawah kondisi obyektif larangan NVIDIA, daya komputasi AI domestik harus mengatasi kesulitan-kesulitan ini dalam jangka pendek dan mempercepat siklus pertumbuhan dan kematangannya sendiri.
Untuk mencapai tujuan ini, beberapa hal sangat penting:
**1. Bentuk konsensus industri untuk menghindari kebingungan konsep. **
Ketika berbicara tentang chip AI, kami sering mengatakan bahwa ia memiliki banyak cara untuk menerapkannya, dan ada banyak merek independen yang berpartisipasi di pasar ini, yang tampaknya makmur. Misalnya, chip AI termasuk GPU, FPGA, ASIC, integrasi penyimpanan dan komputasi dan chip seperti otak, dll., Dan produsen chip akselerasi AI domestik termasuk Alibaba, Baidu, Huawei, Kambrium, Informasi Haiguang, Teknologi Suiyuan, Tiantian Zhixin, Teknologi Biqian, Moore Threads, Loongson Zhongke, dll.
"Kemakmuran" semacam ini tidak hanya membingungkan dalam opini publik dan pasar investasi, tetapi juga sering muncul dalam beberapa laporan industri dan analisis kebijakan. Tetapi masalahnya adalah bahwa definisi chip AI umumnya terlalu berlebihan. Misalnya, chip seperti otak hanyalah imajinasi teknis di masa mendatang, dan jika chip seperti otak ditambahkan setiap kali chip AI domestik dibahas, itu hanya akan membuang waktu dan mengalihkan energi. Contoh lain, beberapa produsen chip AI hanya dapat membuat chip untuk digunakan sendiri dan tidak dapat mengirimkannya ke pasar. Beberapa vendor belum memiliki kemampuan untuk mengkomersialkan dan berada dalam tahap konstruksi awal, dan kontribusi mereka terhadap otonomi komputasi AI dalam jangka pendek sangat kecil.
Untuk mengatasi larangan GPU high-end Nvidia, kita perlu fokus pada alternatif GPU yang layak dan efektif, daripada membuat terlalu banyak asosiasi dan divergensi. Hanya dengan membentuk konsensus industri ini kita dapat mengumpulkan kekuatan untuk menyelesaikan masalah. **
**2. Beralih ke penggunaan komersial skala besar dan hindari pembuatan inti PPT. **
Faktanya, tidak peduli dari perspektif chip akselerasi AI atau mesin server, sangat sedikit produsen chip AI yang dapat mengirim di China. Terutama terkonsentrasi di Huawei dan Baidu, Teknologi Suiyuan dan Informasi Haiguang juga memiliki pengiriman tertentu. Sejumlah besar produsen semikonduktor dan perusahaan AI masih terjebak dalam rencana dan visi membangun chip. Hal ini menyebabkan stagnasi sejumlah besar chip AI domestik yang telah didukung oleh kebijakan dan ekspektasi pasar investasi, dan bahkan ada kecurigaan untuk tetap pada tahap ini untuk menikmati dividen pasar keuangan.
** Orientasi industri berikutnya harus beralih dari pembentukan chip AI ke pengiriman chip AI, membantu produsen chip AI mendapatkan umpan balik bisnis langsung, menerima pengujian pasar produk dan kapasitas produksi, dan secara bertahap membentuk arus kas positif. **
Alasan mengapa GPU NVIDIA penting tidak hanya dalam kinerja perangkat keras, tetapi juga dalam kemampuan ekologis perangkat lunak dengan CUDA dan PyTorch sebagai intinya, sehingga pengembangan chip AI domestik tidak boleh meremehkan kemampuan perangkat lunak. Sambil memperkuat pembangunan ekosistem perangkat lunak independen, perlu juga memperhatikan kemampuan migrasi dan biaya migrasi untuk membangun model AI berdasarkan ekosistem NVIDIA.
Untuk tujuan ini, sejumlah besar produsen telah menjelajah, seperti DCU Informasi Haiguang, yang sangat mirip dengan CUDA dalam hal ekologi dan lingkungan pemrograman, dan pengguna CUDA dapat dengan cepat bermigrasi ke platform ROCm Haiguang dengan biaya rendah. Sebelumnya, PyTorch 2.1 mengumumkan dukungan untuk Huawei Ascend. Dapat dilihat bahwa chip AI domestik memiliki pengaruh skala tertentu dan dapat lebih terintegrasi ke dalam ekosistem perangkat lunak global.
**Di masa depan, jika Anda ingin mewujudkan ledakan komputasi AI domestik, Anda tidak dapat meninggalkan wabah ekologi perangkat lunak dasar AI domestik. **
Untuk chip AI Amerika, selain GPU NVIDIA, apa lagi yang Anda ketahui? Bahkan jika pertanyaan ini ditanyakan kepada beberapa pengembang AI, jawabannya sebagian besar tidak jelas atau belum dicoba. Dapat dilihat bahwa komputasi AI, seperti halnya komputasi umum dan komputasi grafis, memiliki probabilitas tinggi bahwa satu atau dua "merek utama" pada akhirnya akan muncul. Ini milik hukum obyektif pasar, dan tidak perlu mencapai situasi "membiarkan seratus bunga mekar" dengan cara menarik bibit untuk membantu mereka tumbuh.
Bahkan sejauh komputasi AI China harus mempercepat kematangannya dan menyelesaikan tujuan substitusi otonom, adalah hal yang baik untuk mencapai situasi satu super dan banyak yang kuat sesegera mungkin. Ini dapat menghindari fragmentasi ekologis dan pemborosan sejumlah besar investasi TI yang disebabkan oleh ayunan industri. Proses ini harus diserahkan kepada pasar untuk memilih, perlahan-lahan mulai terbentuk. Namun, dalam konteks larangan chip, kebangkitan komputasi AI domestik telah berakhir, daripada membiarkan 100 jenis chip AI perlahan-lahan matang dan perlahan dikocok, seperti mempercepat pembentukan situasi penggantian cepat "merek utama".
Dilihat dari situasi saat ini, Ascend adalah kekuatan yang paling mungkin untuk menjadi merek utama daya komputasi AI domestik. Liu Qingfeng, pendiri dan ketua iFLYTEK, sebelumnya mengatakan bahwa GPU Huawei telah dibandingkan dengan NVIDIA A100. Menurut data, daya komputasi presisi bilangan bulat Ascend 310 mencapai 16 TOPS, dan daya komputasi presisi bilangan bulat Ascend 910 mencapai 640 TOPS. Ini berarti bahwa kinerja Ascend 910 mendekati NVIDIA A100.
Pada saat yang sama, Ascend saat ini adalah satu-satunya kekuatan komputasi AI domestik yang memiliki pangsa pasar yang stabil, dan telah menginkubasi arsitektur komputasi heterogen CANN yang mirip dengan NVIDIA CUDA dan kerangka komputasi AI MindSpore dalam perangkat lunak. Dalam hal kinerja inti, ekosistem perangkat lunak, dan pangsa pasar, Ascend memiliki kelayakan untuk mempercepat pertumbuhan dan mewujudkan lokalisasi skala besar daya komputasi AI.
** Standardisasi standar industri, memperkuat konstruksi perangkat lunak, dan meningkatkan dukungan merek independen adalah cara utama untuk mempromosikan pertumbuhan pesat daya komputasi AI domestik dalam jangka pendek. **
Larangan Nvidia adalah masalah yang umumnya tidak ingin dilihat oleh industri AI China, coba hindari, dan bahkan saat ini agak rahasia. Namun, situasinya lebih kuat daripada manusia, dan dalam proses percepatan de-globalisasi dan perlombaan AI, ada kemungkinan besar bahwa larangan serupa hanya akan jauh lebih mungkin terjadi di masa depan.
Penghindaran, jalan memutar, dan keheningan tidak dapat menyelesaikan masalah, dan hanya dengan tenang mengatasinya dan berjuang untuk perbaikan diri kita dapat secara mendasar menyelesaikan masalah dikendalikan oleh orang lain.
Di bawah larangan tersebut, ke mana perginya komputasi AI China dari sini?
Jawabannya adalah kita tidak punya pilihan, jadi kita harus memberi dunia pilihan kedua.