Begitu banyak pengganda! Senang melihat bahwa Grok2 dilatih menggunakan μP.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
16 Suka
Hadiah
16
5
Posting ulang
Bagikan
Komentar
0/400
MultiSigFailMaster
· 08-27 20:01
Tidak heran pelatihan multi-model sangat hebat
Lihat AsliBalas0
NewDAOdreamer
· 08-27 09:18
Aduh, diferensial ini terlalu keren ya~
Lihat AsliBalas0
GateUser-26d7f434
· 08-25 07:11
Kinerja sebaik ini sangat mengesankan
Lihat AsliBalas0
PrivateKeyParanoia
· 08-25 06:59
Meskipun ada kemajuan, masih jauh dibandingkan dengan sage.
Lihat AsliBalas0
LayerZeroHero
· 08-25 06:57
Apa yang harus dilakukan dengan GPT3, sudah hampir selesai.
Begitu banyak pengganda! Senang melihat bahwa Grok2 dilatih menggunakan μP.