Google Gemini habilita la API de Interacciones: reestructura el agente inteligente, pone fin a las «facturas fantasma»

robot
Generación de resúmenes en curso
MI AI Mensaje, según la monitorización de Beating, Google ha establecido oficialmente la API de Interacciones como la interfaz predeterminada en Gemini API y Google AI Studio, mientras que la interfaz original generateContent entra en período de mantenimiento. La nueva interfaz empaqueta en un solo paquete las conversaciones multironda, el pensamiento del modelo, las llamadas a herramientas y los resultados de ejecución, y los guarda en el servidor como recursos de Interacción. La ventaja más directa es ahorrar dinero y esfuerzo. Debido a que el estado de la conversación se guarda automáticamente en el servidor, en chats multironda, el cliente solo necesita enviar el ID de interacción de la última interacción, y Google puede reutilizar automáticamente y mejorar la tasa de aciertos en la caché, reduciendo significativamente los costos de tokens. Para tareas que consumen mucho tiempo, como la ejecución en sandbox de código o búsquedas profundas, los desarrolladores pueden activar el modo en segundo plano, permitiendo que el trabajo se realice de forma asíncrona en segundo plano. Además, los pasos intermedios como el pensamiento del modelo y las llamadas a herramientas son completamente visibles, facilitando la detección en tiempo real de errores en la ejecución del agente inteligente. La reestructuración subyacente resolvió directamente la crisis de facturación que estalló a principios de junio. En ese momento, tras eliminar manualmente la caché y debido a la demora en la sincronización en la nube, los recursos ya cancelados seguían funcionando en segundo plano, lo que provocó que algunas cuentas tuvieran deducciones anómalas cercanas a 27,000 yuanes en 12 horas. Además, cuando el modelo realiza búsquedas en línea, tiende a caer en bucles de pensamiento, y en estado de «salida cero» sin ninguna respuesta, aún se factura con base en 64,000 tokens completos. La API de Interacciones reemplaza la eliminación manual con una «caché implícita» alojada en el servidor, y permite a los desarrolladores monitorear y abortar los pasos de pensamiento, proporcionando una defensa más segura contra la facturación indebida. Debido a que los futuros modelos de vanguardia y funciones de agentes inteligentes de Google (como Deep Research) solo soportarán la API de Interacciones, la compañía recomienda a los desarrolladores completar la adaptación lo antes posible. (Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado