DeepSeek lanza DeepSeek-OCR 2, la IA puede "ver" una imagen en el mismo orden lógico que los humanos

PANews informó el 27 de enero que DeepSeek lanzó un nuevo modelo DeepSeek-OCR 2, utilizando el innovador método DeepEncoder V2, que permite a la IA reorganizar dinámicamente partes de una imagen según el significado de la imagen, en lugar de limitarse a escanear mecánicamente de izquierda a derecha. Este enfoque simula el flujo lógico que los humanos siguen al observar una escena. En última instancia, el modelo supera a los modelos tradicionales de visión y lenguaje al procesar imágenes con diseños complejos, como documentos o diagramas, lo que permite una comprensión visual del razonamiento más inteligente y causal.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios