Hasil benchmark AI terbaru baru saja keluar, dan satu model benar-benar mendominasi. Dengan skor 1483 pada sistem peringkat Elo, Grok 4.1 saat ini berada di puncak papan peringkat dengan jarak nyaman 31 poin dari pesaing terdekatnya.
Itu bukan sekadar menang—itu menciptakan jarak.
Kesenjangan ini berbicara banyak tentang di mana perkembangan AI berada saat ini. Ketika Anda unggul sejauh itu dalam pengujian terstandarisasi, itu menandakan adanya terobosan dalam arsitektur atau optimasi serius di balik layar. Bagaimanapun juga, angka tidak berbohong: ini beroperasi di level yang berbeda dibandingkan dengan yang lain di luar sana.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Hasil benchmark AI terbaru baru saja keluar, dan satu model benar-benar mendominasi. Dengan skor 1483 pada sistem peringkat Elo, Grok 4.1 saat ini berada di puncak papan peringkat dengan jarak nyaman 31 poin dari pesaing terdekatnya.
Itu bukan sekadar menang—itu menciptakan jarak.
Kesenjangan ini berbicara banyak tentang di mana perkembangan AI berada saat ini. Ketika Anda unggul sejauh itu dalam pengujian terstandarisasi, itu menandakan adanya terobosan dalam arsitektur atau optimasi serius di balik layar. Bagaimanapun juga, angka tidak berbohong: ini beroperasi di level yang berbeda dibandingkan dengan yang lain di luar sana.