Anthropic finalmente lanzó la versión segura del modelo Mythos, Fable-5.


Ya se ha hablado mucho en línea sobre estos parámetros, así que no los repetiré.
Lo que vale más la pena ver, en realidad, es la prueba de tareas reales realizada por la herramienta de programación de terceros Augment Code.
Este conjunto de pruebas ejecutó un total de 489 tareas de programación, y los resultados son bastante interesantes:
Fable-5 destaca claramente en rendimiento general y precisión.
La puntuación general +0.224, la precisión +0.191, realmente es la categoría más fuerte hasta ahora.
Pero otro detalle también es muy importante: GPT-5.5 todavía supera con firmeza a Opus-4.8.
La puntuación general de GPT-5.5 es +0.164, mientras que Opus-4.8 es +0.128;
la precisión de GPT-5.5 es +0.141, y Opus-4.8 es +0.092.
Esto también explica mi sensación reciente: después de que salió Opus-4.8, no sentí claramente que fuera más fuerte que GPT-5.5,
al menos en tareas de programación reales, esa sensación no es una ilusión.
Lo más realista es el problema del costo.
Aunque Fable-5 es fuerte, también consume muchos tokens y tiene un costo alto: aproximadamente 14.6k tokens por tarea, con un costo de $3.09;
en comparación, GPT-5.5 usa 7.5k tokens y cuesta $1.52.
Ser fuerte es una cosa, pero caro también lo es.
Así que al final, como siempre, la misma frase: espero que GPT-5.6 llegue pronto.
Si Fable-5 solo puede usarse durante 10 días en el plan de suscripción, y luego hay que usarlo al precio original de la API,
probablemente no será una herramienta de productividad diaria para usuarios comunes, sino más bien un “modelo de lujo” para unos pocos y en pocos escenarios.
El uso de modelos de IA realmente puede comenzar a dividirse en clases.
Ver original
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado