La era de reemplazar una computadora basada solo en el rendimiento de la CPU / GPU ha pasado

Fuente original: Silicon Star People

Fuente de la imagen: Generado por Unbounded AI

La semana pasada, un nuevo dispositivo "pequeño" encendió el entusiasmo de la comunidad tecnológica mundial. Es el primer hardware de IA real en la historia de la humanidad invertido por el CEO de OpenAI, Sam Altman: AI Pin.

El Pin AI se fija directamente en el pecho cuando se usa De: Humane Official

Este hardware, prendido en el pecho y apodado el "iPhone en la era de la IA" por muchos medios, destaca un diseño "radical", cortando directamente la pantalla que los dispositivos móviles centrales debían tener en el pasado, y que debe funcionar independientemente de los teléfonos inteligentes.

En la demostración oficial, AI Pin puede calcular directamente cuántos gramos de proteína hay en las almendras en tu mano De: Humane Official

A nivel de aplicación, el asistente de IA impulsado por GPT4 es tanto el sistema como la única aplicación. Los comandos de voz del usuario son el control principal. El resto de la proyección láser y el reconocimiento de gestos solo se utilizan como complemento de todo el sistema interactivo, proporcionando a los usuarios información, clima, hora, fecha, navegación y otros contenidos con una interfaz y control muy sencillos.

Steven Tey, un conocido desarrollador, dijo que el AI Pin le recordaba al lanzamiento del iPhone en ese entonces

Esta subversión de la lógica de interacción de toda la era de Internet móvil ha hecho que AI Pin sea amado por muchos usuarios geek.

La idea de la mayoría de los usuarios comunes es que "esperan integrar esta interacción y capacidad en sus teléfonos inteligentes" para actualizar sus teléfonos inteligentes nuevamente.

Obviamente, con la implementación gradual de varias capacidades de los modelos grandes, los consumidores están a punto de entrar en una era en la que consideran si sus dispositivos móviles pueden ejecutar las capacidades de IA sin problemas, en lugar de solo el rendimiento absoluto de las CPU y GPU. Y esto inevitablemente traerá nuevos desafíos y oportunidades.

¿Cuáles son los desafíos de popularizar los modelos de IA en terminales móviles?

En primer lugar, son los nuevos requisitos de potencia de cálculo que propone el modelo de IA.

A diferencia de los teléfonos móviles y las computadoras portátiles que se enfrentaron a varios sistemas y cargas de software, los modelos grandes se han multiplicado por docenas en términos de escala neuronal, capacidad de cómputo, espacio de almacenamiento y velocidad de lectura y escritura en comparación con las aplicaciones de IA anteriores.

Comparación de las escalas de parámetros GPT-3 y GPT-4 desde: medio

Tomando como ejemplo el último modelo GPT-4 de OpenAI, según los rumores de la industria, hay hasta 1,8 billones de parámetros, mientras que su GPT-1 lanzado en 2018 solo tiene 110 millones de parámetros. La diferencia de escala es de 10.000 veces.

Incluso si el modelo se reduce en la etapa de aplicación de modelos móviles grandes, el número de parámetros del modelo de inferencia en la aplicación real será tan alto como 7 mil millones a 10 mil millones de parámetros. Confiar en el método anterior de actualizar las especificaciones de hardware de la CPU y la GPU en los terminales móviles definitivamente no podrá satisfacer la demanda de computación de IA que ha aumentado varias veces o incluso docenas de veces.

Solo hay dos formas de resolver la nueva demanda, o conectarse a Internet, y utilizar la red para "transferir" el proceso informático a la nube. O encuentre una manera de mejorar la potencia de cálculo y calcular los resultados directamente localmente.

El AI Pin presentado al principio del producto está empaquetado e integrado con los servicios de red de los operadores estadounidenses, y su alquiler mensual de 24 dólares no es solo para pagar las capacidades de servicio de OpenAI, sino también para gastar en redes móviles.

Este enfoque aparentemente "conciso" también tiene muchas preguntas.

El primero es el problema de privacidad más peligroso, que conducirá a riesgos de seguridad de datos si los datos personales, la mayoría de las partes de la vida del individuo e incluso alguna información extremadamente privada se cargan en hardware como AI Pin.

Dando un paso atrás, la calidad de la red que pone todas las necesidades informáticas de IA en la nube, carga los datos localmente y luego los descarga, afectará en gran medida la experiencia del usuario final. Especialmente en el extranjero, donde la cobertura de la red móvil no es tan buena como la de China, existe una alta probabilidad de retraso o incluso de que no haya respuesta.

También vale la pena prestar atención al desafío de los costos, aunque la inversión inicial de la compra única de potencia informática local es mayor que la de la potencia de computación en la nube suscrita continuamente, pero todo el ciclo de vida suele ser mucho más rentable. Tomemos AI Pin como ejemplo, con un precio inicial de $ 699 y un alquiler de $ 24 por mes, no es barato.

Integrando los tres puntos anteriores, no es difícil llegar a una conclusión: la localización de grandes modelos de IA en dispositivos móviles es la solución óptima.

En consecuencia, la industria de los dispositivos móviles necesita llevar a cabo una actualización integral del hardware subyacente al ecosistema de alto nivel.

Qualcomm en la era de la IA

Mirando hacia atrás en todo el mercado móvil, solo hay unos pocos jugadores que tienen la capacidad de promover esta actualización integral, y Qualcomm es uno de ellos.

En la MWC2023 a principios de año, Qualcomm demostró Stable Diffusion, un modelo de IA generativa, en acción en teléfonos inteligentes impulsados por el Snapdragon 8 de segunda generación. Con una escala de 1.000 millones de parámetros, el modelo de difusión estable puede realizar 20 pasos de inferencia en 15 segundos, generando un mensaje de texto en una imagen.

Aspectos destacados de la plataforma móvil Snapdragon 8 de 3.ª generación

En la nueva plataforma móvil insignia de Qualcomm, el Snapdragon 8 de tercera generación, el núcleo del motor de IA de Qualcomm, Hexagon NPU, se ha actualizado nuevamente, con un rendimiento general mejorado en un 98% y una eficiencia energética mejorada en un 40%.

En una dimensión más granular del rendimiento, la última NPU de Hexagon mejora su rendimiento de IA hasta 3,5 veces mediante la integración de un concentrador de sensores Qualcomm más potente, que incluye 2 ISP siempre activos, 1 DPS, 2 micro NPU, un 30% más de memoria y soporte para el modo informático INT4.

El resultado intuitivo es que el Snapdragon 8 de tercera generación es capaz de ejecutar modelos de IA generativa con hasta 10 mil millones de parámetros y modelos de lenguaje grandes a 20 tokens/s. Y no son solo los números los que se admiten, sino las capacidades que ya se pueden alcanzar.

Con un rendimiento tan potente, el Snapdragon 8 de tercera generación ha sido capaz de ejecutar muchas aplicaciones relacionadas con grandes modelos de IA localmente.

Zhao Ming, CEO de Honor Mobile, demostró el caso de uso de IA generativa en teléfonos móviles en la Cumbre Snapdragon, que puede respaldar la creación de videos temáticos en teléfonos móviles. El sistema de telefonía móvil puede recuperar imágenes y videos con el mismo tema en la biblioteca multimedia local por sí mismo, y luego dejar que el modelo grande de IA edite el video.

Más tarde, los usuarios pueden cambiar la música de fondo y la plantilla hablando con la IA, y todo este proceso será completamente local en el futuro, sin preocuparse por la fuga accidental de datos privados de fotos y videos después de cargarlos en la nube.

En la serie Xiaomi 14, el WPS ya adaptado no solo genera presentaciones PPT con un solo clic con el tema de entrada, sino que también reconoce imágenes y artículos con texto, realiza el escaneo y la lectura de "un vistazo y diez líneas", extrae los puntos clave y los usuarios pueden hacer preguntas directamente a la IA de acuerdo con las preguntas que más desean saber.

Demostración de la funcionalidad WPS en Xiaomi 14

En el caso de documentos, como papeles, contratos y material didáctico, WPS AI puede ayudar a los usuarios a comprender, analizar y resumir el texto completo mediante el escaneo y el reconocimiento, y proporcionar funciones de trazabilidad de documentos para garantizar la precisión y la autenticidad.

Además de la potente plataforma móvil Snapdragon 8 de tercera generación, Qualcomm también presentó su procesador informático más potente para PC hasta la fecha: el Snapdragon X Elite.

Entre ellos, en la parte de CPU, Qualcomm ofreció una CPU Oryon completamente reconstruida bajo la premisa de compatibilidad con el conjunto de instrucciones ARM, el funcionario dijo que su rendimiento de un solo núcleo está aproximadamente un 14% por delante del Apple M2 Max, y el consumo de energía se reduce en un 30%; Al mismo tiempo, el rendimiento de un solo hilo de la CPU supera al del i9-13980HX, que está especialmente diseñado para terminales de juegos de alto rendimiento, y el consumo de energía se reduce en un 70% con el mismo nivel de rendimiento.

El rendimiento de la GPU Adreno también se ha mejorado a 4,6 billones de operaciones de coma flotante (TFLOPS), al tiempo que admite pantallas 4K@120Hz HDR10 y se expande a tres pantallas externas UHD o dos pantallas externas 5K.

En comparación con la plataforma móvil, la potencia de cómputo heterogénea de X Elite se ha mejorado aún más, alcanzando los 75TOPS, de los cuales Hexagon NPU soporta la potencia de cómputo de 45TOPS. Gracias a su excelente rendimiento, ha sido capaz de ejecutar un modelo de 13 mil millones de parámetros localmente, y un modelo de lenguaje grande de 7 mil millones de parámetros puede generar 30 tokens por segundo.

En el Snapdragon Summit, Blackmagic Design, el productor del conocido software de edición de video Leonardo da Vinci, también dio una imagen del uso de Snapdragon X Elite en IA: para la Magic Mask de computación intensiva habilitada para IA, el Snapdragon X Elite es 1,7 veces más rápido que el procesador Windows de 12 núcleos de gama alta con GPU integrada, y Magic Mask se ejecuta en la NPU integrada, que es 3 veces más rápida que ejecutarse en el mismo procesador de 12 núcleos.

Aspectos destacados del chip Snapdragon X Elite de un vistazo

Detrás del excelente rendimiento de los teléfonos móviles y las computadoras portátiles, además del potente rendimiento de los chips de Qualcomm, también tiene el crédito de la pila general de software de IA de Qualcomm. Por ejemplo, en esta cumbre, Qualcomm anunció la adición de soporte para el acceso rápido de ONNX Runtime a los chips Snapdragon y soporte para el modelo de controlador de cómputo (MCDM) de Microsoft.

El primero es un marco de inferencia lanzado por Microsoft, que soporta una variedad de backends en ejecución, para que los desarrolladores puedan ser más eficientes a la hora de realizar las correspondientes aplicaciones de inferencia; en cuanto al soporte para MCDM, la futura NPU de Qualcomm será más eficiente y directa en el sistema Windows.

Los esfuerzos de Qualcomm en el ecosistema no solo ayudan a los socios proveedores de terminales a crear productos excelentes, sino que también atraen a más y más proveedores de software independientes (ISV) y desarrolladores para que se unan al ecosistema de Qualcomm para promover la implementación y promoción de aplicaciones de modelos grandes de IA en las plataformas de Qualcomm.

Qualcomm sigue acelerando

Desde el lanzamiento de su primer proyecto de investigación de IA, Qualcomm ha estado profundamente comprometida en el campo de la IA durante más de diez años. Años de acumulación de tecnología en plataformas móviles, así como la exploración continua de las capacidades de IA, finalmente explotaron en el momento en que aterrizó el modelo de IA.

De acuerdo con el ciclo de desarrollo de chips en la industria de semiconductores de aproximadamente 3 años, la plataforma móvil Snapdragon 8 de tercera generación recientemente debutada y Snapdragon X Elite con un excelente rendimiento han entrado en el proceso de desarrollo alrededor de 2020, lo que muestra el profundo conocimiento y comprensión de Qualcomm de las industrias de dispositivos móviles e inteligencia artificial.

Esta búsqueda de tecnología de vanguardia y la intención original de brindar la mejor experiencia a los usuarios impulsan a Qualcomm a seguir avanzando. También permitió a Qualcomm, que ha salido de la era 3G/4G con la tecnología de comunicación y la plataformización de SoC de telefonía móvil, aprovechar de nuevo la rara oportunidad de los grandes modelos de IA.

De este modo, Qualcomm se convertirá naturalmente en la primera opción para los consumidores que ya no sólo se centran en el rendimiento de procesamiento básico de los dispositivos móviles, sino que prestan más atención al rendimiento de la IA.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)