¡Tantos multiplicadores! Es genial ver que Grok2 fue entrenado usando μP.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
16 me gusta
Recompensa
16
5
Republicar
Compartir
Comentar
0/400
MultiSigFailMaster
· 08-27 20:01
No es de extrañar que el entrenamiento de múltiples modelos sea alcista, ¡increíble!
Ver originalesResponder0
NewDAOdreamer
· 08-27 09:18
Ay, ¡este diferencial es demasiado impresionante!
Ver originalesResponder0
GateUser-26d7f434
· 08-25 07:11
Rendimiento tan alto, alcista.
Ver originalesResponder0
PrivateKeyParanoia
· 08-25 06:59
Aunque ha habido avances, todavía está lejos de sage.
¡Tantos multiplicadores! Es genial ver que Grok2 fue entrenado usando μP.