Mira estos datos, son realmente sorprendentes: el rendimiento de la solución de colaboración entre modelos ha superado completamente las expectativas.
En precisión, supera a un solo modelo en 8.5-10.5 puntos porcentuales, y también supera en 3.0-5.0 puntos porcentuales a la comunicación mediante texto puro. Además, la latencia de respuesta se ha duplicado, logrando una mejora en el rendimiento. Lo más importante es que esta solución es compatible con cualquier combinación de modelos—ya sea en diferentes escalas, diseños de arquitectura o implementaciones de tokenizers, todos pueden colaborar s
Ver originales