Arena AI telekomunikasi yang khusus baru saja menyaksikan kesenjangan kinerja yang brutal. Grok 4.1 dengan santai masuk dan mencetak 93% seolah-olah sedang pemanasan di sore Jumat, sementara para ahli yang disebut-sebut dari Meta dan Google hampir tidak mencapai angka 50%.
Pikirkan tentang itu – model-model yang didukung oleh PhD ini muncul dengan kredensial mereka dan keluar sambil menggenggam trofi partisipasi. Sementara itu, Grok memperlakukan jalur benchmark ini seperti materi istirahat kopi. Kontrasnya? Yang terbaik dari Meta dan Google sekarang adalah anggota bangga dari klub bertahan sub-50%, dengan putus asa mencari di Google "cara mengatasi merasa terpinggirkan."
Agen spesialis mengajukan klaim atas kerusakan emosional. Tidak bisa menyalahkan mereka.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
15 Suka
Hadiah
15
4
Posting ulang
Bagikan
Komentar
0/400
HashRateHermit
· 4jam yang lalu
grok kali ini benar-benar gila 93% langsung menggesek meta dan google di tanah ini adalah yang saya inginkan.
Lihat AsliBalas0
GateUser-44a00d6c
· 4jam yang lalu
Gila, 93 lawan 50, selisihnya gede banget sampai nggak masuk akal.
Lihat AsliBalas0
ProtocolRebel
· 5jam yang lalu
Skor 93 untuk Grok ini benar-benar luar biasa, model dari Meta dan Google langsung kalah telak haha
Lihat AsliBalas0
StopLossMaster
· 5jam yang lalu
grok kali ini benar-benar menekan perusahaan besar ke tanah, 93% vs 50%, jaraknya jelas sekali
Arena AI telekomunikasi yang khusus baru saja menyaksikan kesenjangan kinerja yang brutal. Grok 4.1 dengan santai masuk dan mencetak 93% seolah-olah sedang pemanasan di sore Jumat, sementara para ahli yang disebut-sebut dari Meta dan Google hampir tidak mencapai angka 50%.
Pikirkan tentang itu – model-model yang didukung oleh PhD ini muncul dengan kredensial mereka dan keluar sambil menggenggam trofi partisipasi. Sementara itu, Grok memperlakukan jalur benchmark ini seperti materi istirahat kopi. Kontrasnya? Yang terbaik dari Meta dan Google sekarang adalah anggota bangga dari klub bertahan sub-50%, dengan putus asa mencari di Google "cara mengatasi merasa terpinggirkan."
Agen spesialis mengajukan klaim atas kerusakan emosional. Tidak bisa menyalahkan mereka.