El teléfono está lleno de modelos grandes, y es solo el comienzo

Fuente original: Photon Planet

Fuente de la imagen: Generado por Unbounded AI

Los fabricantes de teléfonos móviles, que necesitan urgentemente encontrar un nuevo volante de inercia, están mirando modelos grandes.

En la conferencia de desarrolladores a principios de agosto, Huawei anunció que integraría Xiaoyi, un asistente de IA en HarmonyOS 4, en el modelo grande, y lo invitó a probarlo a fines de agosto. Xiaomi también abrió la prueba de invitación de su asistente de IA Xiaoai para acceder al modelo grande casi al mismo tiempo. Le siguieron OPPO y vivo, que comenzaron a experimentar con grandes modelos de teléfonos móviles en noviembre.

"Meter modelos grandes en teléfonos móviles" no es algo nuevo en la industria,Sin mencionar vivo, que se ha calentado intensamente desde mediados de octubre,Rongmi O tres han revelado noticias relevantes en la conferencia de prensa celebrada este año。 La opinión general en la industria es que la parte de hardware de la pista del teléfono inteligente es casi imposible de enrollar, y la mayoría de los modelos grandes que se ejecutan en la nube son solo una variable que está libre del hardware.

Cabe señalar que la implementación del lado del dispositivo también es una tendencia de la industria para pistas de modelos grandes. Tomando ChatGPT como ejemplo, como representante típico del modelo grande del lado de la nube, su entrenamiento e inferencia se ejecutan en Azure de Microsoft, y los usuarios obtienen resultados a través de navegadores o aplicaciones. Entre la entrada-salida y el ida y vuelta, no solo hay un retraso que afecta a la experiencia del usuario, sino también a los costes de la nube, como el consumo de energía y la potencia informática.

Desde la perspectiva de los escenarios y necesidades reales, muchas necesidades pueden ser satisfechas por los dispositivos de borde, especialmente los terminales que se utilizan ampliamente, como los teléfonos móviles, los PC y los vehículos de nueva energía.

Como resultado, el despliegue del lado final de los modelos grandes se ha convertido gradualmente en un consenso, no solo los fabricantes de teléfonos móviles han remachado sus esfuerzos para entrenar modelos, sino que también Lenovo en la pista de PC y Qualcomm en la pista de chips han lanzado soluciones relevantes para la IA del lado final hace algún tiempo. En particular, los recién lanzados Qualcomm Snapdragon 8 Gen3 y MediaTek Dimensity 9300, se puede decir que la mejora de su rendimiento de IA es la base del modelo grande en el teléfono móvil.

Se han satisfecho las necesidades de la industria y las condiciones de hardware, y el modelo grande finalmente puede ingresar al teléfono móvil. Lo que es bastante sorprendente es que el primer fabricante de teléfonos móviles en sacar un "producto completo" sea vivo.

**¿Cuál es el estado del modelo vivo large? **

El 1 de noviembre, vivo celebró una conferencia de desarrolladores, en la que lanzó la matriz de modelos grandes de desarrollo propio "BlueLM", que incluye 1.000 millones, 10.000 millones, 100.000 millones y otras escalas de parámetros diferentes. Al mismo tiempo, también lanzó OriginOS 4, un sistema operativo de desarrollo propio adaptado a su modelo grande.

Frente a la "tierra prometida" de los grandes modelos, el afán de vivo está casi escrito en su cara.

Según los últimos datos publicados por Canalys, una agencia de investigación de mercado, el 26 de octubre, los envíos y envíos de vivo disminuyeron, y el ranking también cayó. vivo necesita urgentemente modelos grandes y OriginOS 4 para cambiar el rumbo, y no es de extrañar que sea el primero en "abrir el libro".

Y en comparación con el modelo grande, el período de actualización de OriginOS 4 lanzado por vivo esta vez es ligeramente débil. En la discusión de dominio público, no solo la iteración de su tarjeta gráfica virtual, el espacio informático heterogéneo y liviano no es como se esperaba, sino que también los módulos como la notificación atómica, que es bastante ruidosa entre los usuarios de vivo, no se han actualizado. Es decir, la gran maqueta es la protagonista de esta conferencia.

Desde la perspectiva del modelo de negocio, la ruta de vivo en esta conferencia de prensa es similar a la de otros actores de la industria antes, con el asistente de inteligencia artificial como portador, adoptando un método de implementación híbrido del lado del dispositivo + lado de la nube, en el que el modelo grande del lado del dispositivo, que es la jugada principal, presenta las características obvias de localización y ligereza.

El propósito de esto es obvio, el consumo de energía y la potencia de cómputo que proporciona el pequeño mundo de los teléfonos móviles no son los mismos que los de la sala de ordenadores. Es solo cómo combinar la capacidad del modelo con la profundidad del teléfono móvil se ha convertido en el "know-how" que los fabricantes de teléfonos móviles necesitan urgentemente para abrirse paso.

En este sentido, la solución de vivo es lanzar un modelo de especificación multiparamétrica, de los cuales 1.000 millones de especificaciones son principalmente para escenarios de texto y 7.000 millones de especificaciones para el diálogo natural y el teleobjetivo de preguntas y respuestas de conocimiento son los aspectos más destacados del despliegue del lado del dispositivo. En la introducción oficial, las especificaciones de 1.000 millones están orientadas por separado al lado del dispositivo, y las especificaciones de 7.000 millones están configuradas para ser de doble propósito para el dispositivo y la nube, y todas se han implementado en la nube desde 70 mil millones, lo que también refleja la idea matricial de vivo de "dejar que Dios regrese a Dios y César a César" en la colaboración dispositivo-nube.

Esto es lo mismo que la conferencia de desarrolladores I/O de Google en mayo de este año, cuando Google lanzó un modelo grande PaLM2 con cuatro especificaciones de parámetros, de los cuales el modelo de parámetros pequeños puede procesar 20 tokens por segundo en estado fuera de línea, lo que es adecuado para el uso fuera de línea de terminales.

Si piensas que vivo está "hurgando los dientes de la gente", es demasiado duro. De hecho, vivo se propuso crear un equipo interno de IA ya en 2017 y, en la actualidad, el Instituto de Investigación de IA de vivo cuenta con más de 1.000 investigadores.

A pesar de que su precipitación técnica es generalmente inferior a la del primer escalón como Ali y Baidu, la existencia de la comunidad de código abierto también permite a los jugadores que ingresan al mercado un poco más tarde ponerse rápidamente al día con el gran ejército. El Instituto de Investigación de Grafos de Conocimiento, creado por vivo en 2018, también puede reforzar en cierta medida la falta de datos de entrenamiento que puede encontrar como fabricante de teléfonos móviles.

En cuanto a la capacidad del modelo, vivo entregó una buena hoja de respuestas durante el período de calentamiento. Se informa que BlueLM ganó el primer lugar en la categoría de "modelo de acceso restringido" en el conjunto de evaluación de terceros C-del modelo chino grande. De acuerdo con su anuncio oficial, BlueLM es el primer modelo grande del lado del dispositivo 7B de la industria.

Sin embargo, no son pocos los modelos que han obtenido puntuaciones altas en la evaluación, pero que tienen un rendimiento real insatisfactorio, y algunas personas de la industria dicen que esta lista ha sido "ignorada" en el último período de tiempo, lo que sólo puede representar la capacidad del modelo para "hacer preguntas" y no puede reflejar la capacidad de razonamiento, seguridad y adaptabilidad. Desde este punto de vista, está claro que los resultados comerciales de vivo necesitan pruebas más prácticas.

Además, las capacidades actuales del modelo en la nube de vivo, como el diagrama de Wensheng y la interacción, no han salido de la trampa de los modelos grandes, y la novedad es limitada. Además, su capacidad de modelo del lado del dispositivo como una jugada importante aún se encuentra en la etapa de prueba, y la visualización de las capacidades del lado final está inevitablemente limitada por el hardware del teléfono móvil.

Nos enteramos de que muchos usuarios que fueron invitados a participar en las pruebas internas de Blue Heart están usando teléfonos insignia representados por X90 Pro, y estos modelos también son los más altos en el calendario de adaptación beta pública para aplicaciones de modelos a gran escala lanzadas por vivo.

Por favor, introduzca el diagrama para decir

No cabe duda de que los modelos grandes se están convirtiendo en el segundo campo de batalla para que los fabricantes de teléfonos móviles abran la gama alta, y también son una variable importante para revitalizar a los usuarios y activar el IoT. A pesar de ello, todavía hay muchas variables en la intención de vivo de aumentar el valor de los productos de alta gama apoyándose en modelos grandes

En última instancia, el lanzamiento del modelo grande no solo es la nueva piedra angular de la gama alta de vivo, sino también su intento de tirar de nuevas máquinas y productos de alta gama.

Los modelos de gama baja son naturalmente difíciles de hacer frente a esta guerra de gama alta. Tomemos como ejemplo el modelo básico Y100 lanzado por vivo antes de esta conferencia de prensa, este es uno de los últimos modelos en el plan de adaptación mencionado anteriormente, y detrás de un movimiento de "puñalada por la espalda" similar está la esperanza del "pequeño ábaco" de vivo de volver al trono con productos de alta gama.

Aun así, el lanzamiento de modelos grandes todavía no es un plus para los productos de gama alta de vivo.

Wang Yang (seudónimo), un emprendedor de la comunidad de código abierto del modelo grande del lado del dispositivo, le dijo a Photon Planet que la capacidad del modelo grande en el lado del dispositivo radica en el rendimiento de la IA que aporta su NPU (procesador especialmente diseñado para la computación de redes neuronales profundas). Sin embargo, en los modelos anteriores de vivo, no prestaba atención a las capacidades de la NPU, por lo que es probable que sea difícil para los modelos más antiguos ejecutar modelos grandes sin problemas.

En cuanto al próximo lanzamiento, el nuevo modelo vivo de la serie X100 equipado con el chip insignia MediaTek Dimensity 9300 y una nueva generación de procesadores de IA puede ser capaz de utilizar las capacidades del modelo sin problemas, pero en el caso de que ya existan en el mercado aplicaciones de modelos grandes como Wenxin Yiyan e iFLYTEK Xinghuo, el espacio que queda para el teléfono móvil no es tan grande como se imagina. En comparación con la habilidad, quizás la jugabilidad mostrada por vivo esta vez sea más digna de un estudio en profundidad.

**¿Hacer que tu teléfono sea más inteligente? **

Kevin Scott, CTO de Microsoft, quien empujó a Microsoft a convertirse en un inversor ángel en OpenAI, ha declarado públicamente que el modelo en sí no es un producto, sino una infraestructura. La implicación es que después de que la capacitación afina la base del modelo, la exploración de la productización es el núcleo del "segundo emprendimiento" de muchos jugadores.

La "reproductización" de los modelos grandes en los teléfonos móviles es una cuestión de rutina, pero los modelos grandes desplegados en los teléfonos móviles aún necesitan ser producidos aún más. A juzgar por la información expuesta hasta ahora, vivo se dará cuenta de la capacidad del modelo grande a través de una aplicación llamada asistente Xiao V, y la ruta principal actual en la industria es integrar la capacidad del modelo grande en el asistente de inteligencia artificial existente.

Los usuarios de teléfonos inteligentes tienen una necesidad real de tener la capacidad de comprender modelos grandes, ya sea un asistente inteligente llamado en broma "discapacidad intelectual artificial" o una aplicación y datos cada vez más inflados bajo la explosión de capacidad, los teléfonos móviles deben poder comprender mejor la interacción y ayudar a los usuarios a clasificar la información. La adición de modelos grandes es esencialmente para llevar las capacidades de comprensión del lenguaje natural a los teléfonos móviles.

En el caso de una implementación no implementada, los problemas de la experiencia del usuario, como el consumo de energía, la disipación de calor y la latencia que pueden ocurrir en el modelo del lado del dispositivo, se pueden ignorar por el momento. En opinión de Wang Yang, el principal problema al que se enfrenta el modelo vivo es cómo distinguir los límites de capacidad de los diferentes modelos y cómo llamarlos cuando se utilizan varios modelos juntos, "lo que está relacionado con la forma y la presentación del producto final".

Frente a la cara C con escenarios generalizados y requisitos complejos, los modelos invocados por los diferentes requisitos son diferentes. Por ejemplo, el modelo de especificación de 1.000 millones y el modelo de especificación de 7.000 millones en el lado del dispositivo deben aprender de los datos locales del usuario en un intento de "comprender mejor al usuario". Por lo tanto, el hecho de que la capacidad del modelo y el sistema operativo adaptado a ella puedan utilizarse para implementar instrucciones complejas en el teléfono móvil es un indicador importante.

Hasta ahora, la compleja función de comando demostrada por BlueLM es bastante destacada. En el recién lanzado OriginOS 4, el asistente V reside en la esquina inferior derecha de la barra lateral y se puede mostrar haciendo clic en él. No solo la lógica de operación es más corta que la del modelo del lado de la nube, que es más adecuado para el uso de teléfonos móviles, sino también algunas instrucciones complejas en el sistema operativo, como la búsqueda inteligente de álbumes, la finalización preliminar de comandos de aplicaciones de terceros y la configuración del sistema operativo.

Vale la pena mencionar que el asistente de V pequeña está aislado de la voz Jovi existente de vivo en términos de función y ruta, y los dos son independientes entre sí, lo que obviamente es diferente de la ruta del modelo grande del lado del dispositivo propuesta por otros fabricantes antes.

Desde el punto de vista funcional, el pequeño asistente V básicamente puede lograr una cobertura completa de la voz de Jovi, por lo que es probable que el propósito de distinguir los dos sea facilitar que los usuarios sientan la diferencia entre los dos. Además, la lógica del producto del asistente en V pequeña es similar a la de Copilot que se lleva en el cubo de la familia de Microsoft, y es probable que las dos rutas diferentes se integren en el futuro.

Esto también refleja que el BlueLM actual todavía se encuentra en la etapa de prueba, y la forma del producto es difícil de decir madura.

De acuerdo con los comentarios de quienes participaron en la prueba interna de BlueLM, con la capacidad del modelo insignia de vivo, todavía hay un retraso de 2 s ~ 5 segundos en el requisito de generación de texto sin formato dentro de 20 tokens, lo que no es una buena noticia para la implementación posterior: el retraso del modelo del lado de la nube no se ha resuelto bien. Esto puede mejorarse en los modelos equipados con los últimos chips de IA de los fabricantes de chips, pero para los consumidores, esto no constituye una razón para cambiar sus teléfonos.

Además, como el primer modelo de teléfono móvil de la industria, la capacidad del modelo del lado de la nube de vivo también se enfrenta al "cerco" de los grandes modelos de muchos proveedores de la nube.

Por ejemplo, vivo anunció que lanzará el robot conversacional Lanxin Qianxun en la tienda de aplicaciones, y las especificaciones de 175 mil millones de parámetros no son llamativas en comparación con los grandes modelos en las tiendas de aplicaciones actuales. Entre los proveedores de la nube, Baidu ya ha cobrado por la versión profesional Wenxin 4.0 recientemente lanzada para probar las aguas, mientras que Lanxin Qianxun parece ser un miembro no tan llamativo del ecosistema de modelos grandes de vivo, y su camino es obviamente obstructivo y largo.

Hay que mencionar que vivo es un recién llegado, y la brecha en la precipitación de tecnología también limitará el avance de su negocio de modelos a gran escala.

En términos de software, el modelo vivo large se ha convertido en el material promocional de la plataforma de aprendizaje automático Pai de Alibaba Cloud, e incluso podemos encontrar la sombra de "Tongyi Qianwen" del nombre de "Blue Heart Qianwen". Correr en la nube significa costos a largo plazo, y esto se refleja más vívidamente en OpenAI. Desde el punto de vista de los costes, si vivo quiere convertir BlueLM en un ecosistema a largo plazo, el IDC de construcción propia es obviamente más propicio para el desarrollo a largo plazo que la migración a la nube.

En términos de hardware, Huawei y Apple, los dos principales fabricantes, ya han integrado capacidades de NPU de desarrollo propio en sus líneas de productos existentes, mientras que vivo todavía necesita depender de los fabricantes de chips. A pesar de que se pueden construir ciertas barreras en el entrenamiento y el ajuste del modelo, la brecha de hardware como núcleo todavía conduce a varios puestos con los principales fabricantes.

Batalla de terminal de modelo grande

La adición del modelo grande nos hace volver a darnos cuenta de que la esencia del teléfono inteligente es un terminal inteligente que integra múltiples capacidades y tiene entradas tanto de hardware como de sistema operativo. Las condiciones únicas hacen que sea natural que los teléfonos móviles se combinen con modelos grandes.

Entonces, ¿se pueden conectar otros terminales al modelo grande y redefinir los límites de capacidad del terminal al igual que rehacer la aplicación?

La exploración de este problema se remonta al estallido de las redes de aprendizaje profundo, y la discusión sobre la posibilidad de modelos del lado final también se deriva de los problemas "cliché" de latencia, consumo de energía, privacidad y otros problemas en la industria.

De hecho, mucho antes del inicio oficial de esta moda de meter modelos grandes en los teléfonos móviles, los vehículos de nueva energía con conducción autónoma ya se han convertido en un terminal de modelos grandes. No hay escasez de imaginación en la industria de que los dispositivos portátiles inteligentes estén equipados con modelos grandes, pero los teléfonos móviles parecen estar a punto de ser los primeros con la diversidad de escenas y la comodidad de la red.

Además, cuando los fabricantes de teléfonos móviles lancen de forma intensiva modelos grandes y los pongan en uso, será un excelente campo de entrenamiento para los modelos finales. También podemos discutir la metodología de una variedad de terminales equipados con modelos grandes desde el aterrizaje de modelos grandes de teléfonos móviles.

Al fin y al cabo, por muy bueno que sea el modelo del teléfono, el mejor rendimiento que se puede conseguir en un corto periodo de tiempo no es más que una "secretaria" en el ámbito de la vida del usuario. La imaginación que aporta el gran modelo de otros terminales inteligentes es, sin duda, mayor.

Por ejemplo, los cajeros automáticos, que se están retirando gradualmente de la etapa histórica debido al pago móvil, pueden apoyarse en modelos grandes para permitir a los usuarios saltarse el banco para hacer cola para hacer negocios en profundidad; También es una cámara inteligente que pertenece al escenario B-end, que identifica los signos básicos de los pacientes en el campo médico, la inspección rápida de calidad en el campo industrial y el riego inteligente en el campo agrícola. Ahora, el mercado del extremo B, que no se ha abierto ampliamente al confiar en el modelo del lado de la nube, también puede marcar el comienzo de la variable del lado final.

Esta es también la razón por la que vivo mostrará el sistema operativo Blue River (BlueOS) equipado con el nuevo vivo Watch en esta conferencia de prensa cuando su ecología no es tan perfecta como la de Huawei y Xiaomi. Como sistema cross-terminal desarrollado por vivo para la era de la inteligencia artificial general, su lanzamiento tiene como objetivo impulsar una serie de productos IoT a través de teléfonos móviles, que sin duda tiene una buena imaginación.

vivo también anunció el código abierto de su modelo de especificación 7B y lanzó el kit de desarrollo BlueKit, que es una clara ambición para la construcción ecológica. Tal vez en la actualidad, vivo solo ha llegado a la etapa de permitir que IoT entienda las instrucciones, pero esto es muy importante para las futuras estrategias ecológicas, ecológicas y de gama alta de vivo.

Las capacidades del modelo de teléfono móvil son desconocidas, y hay muchos desafíos, y después del lanzamiento oficial y el aterrizaje, seguramente traerá más direcciones de "volumen abierto" a la industria. Posturas de aterrizaje más extrañas están esperando a ser desbloqueadas por la industria.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)