Le téléphone est bourré de grands modèles, et ce n’est que le début

Source originale : Photon Planet

Source de l’image : Généré par Unbounded AI

Les fabricants de téléphones portables, qui ont un besoin urgent de trouver un nouveau volant d’inertie, lorgnent sur les grands modèles.

Lors de la conférence des développeurs au début du mois d’août, Huawei a annoncé qu’il intégrerait Xiaoyi, un assistant d’IA dans HarmonyOS 4, dans le grand modèle, et l’a invité à le tester à la fin du mois d’août. Xiaomi a également ouvert le test d’invitation de son assistant IA Xiaoai pour accéder au grand modèle à peu près au même moment. OPPO et vivo ont suivi, qui ont tous deux commencé à expérimenter de grands modèles de téléphones mobiles en novembre.

« Fourrer de grands modèles dans les téléphones portables » n’est pas une chose nouvelle dans l’industrie,Sans parler de vivo, qui a été intensément réchauffé depuis la mi-octobre,Rongmi O trois ont révélé des nouvelles pertinentes lors de la conférence de presse tenue cette année。 L’opinion générale dans l’industrie est que la partie matérielle de la piste du smartphone est presque indéroulable, et la plupart des grands modèles fonctionnant dans le cloud ne sont qu’une variable qui est libre du matériel.

Il convient de noter que le déploiement côté appareil est également une tendance de l’industrie pour les pistes de grands modèles. Si l’on prend l’exemple de ChatGPT, en tant que représentant typique du grand modèle côté cloud, son entraînement et son inférence s’exécutent sur Azure de Microsoft, et les utilisateurs obtiennent des résultats via des navigateurs ou des applications. Entre les entrées-sorties et les allers-retours, il y a non seulement un délai qui affecte l’expérience utilisateur, mais aussi les coûts du cloud tels que la consommation d’énergie et la puissance de calcul.

Du point de vue des scénarios et des besoins réels, de nombreux besoins peuvent être satisfaits par les appareils de périphérie, en particulier les terminaux largement utilisés tels que les téléphones portables, les PC et les véhicules à énergie nouvelle.

En conséquence, le déploiement de bout en bout de grands modèles est progressivement devenu un consensus, non seulement les fabricants de téléphones mobiles ont rivé leurs efforts pour former les modèles, mais aussi Lenovo sur la piste PC et Qualcomm sur la piste des puces ont publié des solutions pertinentes pour l’IA de bout en bout il y a quelque temps. En particulier, le Qualcomm Snapdragon 8 Gen3 et le MediaTek Dimensity 9300 qui viennent de sortir, l’amélioration de leurs performances en matière d’IA peut être considérée comme la base du grand modèle sur le téléphone mobile.

Les besoins de l’industrie et les conditions matérielles ont été satisfaits, et le grand modèle peut enfin entrer dans le téléphone mobile. Ce qui est assez surprenant, c’est que le premier fabricant de téléphones mobiles à sortir un « produit complet » est vivo.

**Quel est l’état du grand modèle vivo ? **

Le 1er novembre, vivo a organisé une conférence de développeurs, au cours de laquelle elle a publié la matrice de grands modèles « BlueLM » qu’elle a elle-même développée, comprenant 1 milliard, 10 milliards, 100 milliards et d’autres échelles de paramètres différentes. Dans le même temps, il a également publié OriginOS 4, un système d’exploitation auto-développé adapté à son grand modèle.

Face à la « terre promise » des grands modèles, l’empressement de vivo se lit presque sur son visage.

Selon les dernières données publiées par Canalys, une agence d’études de marché, le 26 octobre, les expéditions et les expéditions de vivo ont diminué, et le classement a également chuté. vivo a un besoin urgent de grands modèles et d’OriginOS 4 pour inverser la tendance, et il n’est pas surprenant qu’il soit le premier à « ouvrir le livre ».

Et par rapport au grand modèle, la durée de mise à jour d’OriginOS 4 lancé par vivo cette fois-ci est légèrement faible. Dans la discussion sur le domaine public, non seulement l’itération de sa carte graphique virtuelle, l’espace de calcul hétérogène et la légèreté ne sont pas comme prévu, mais aussi les modules tels que la notification atomique, qui est assez bruyante parmi les utilisateurs de vivo, n’ont pas été mis à niveau. En d’autres termes, la grande maquette est le protagoniste de cette conférence.

Du point de vue du modèle d’affaires, le parcours de vivo lors de cette conférence de presse est similaire à celui d’autres acteurs de l’industrie auparavant, avec l’assistant d’intelligence artificielle comme porteur, adoptant une méthode de déploiement hybride côté appareil + côté cloud, dans laquelle le grand modèle côté appareil, qui est le jeu principal, présente les caractéristiques évidentes de localisation et de légèreté.

Le but est évident, la consommation d’énergie et la puissance de calcul fournies par le petit monde des téléphones portables ne sont pas les mêmes que celles de la salle informatique. C’est juste la façon de combiner la capacité du modèle avec la profondeur du téléphone mobile est devenu le « savoir-faire » dont les fabricants de téléphones mobiles ont besoin de toute urgence pour percer.

À cet égard, la solution de vivo consiste à lancer un modèle de spécification multiparamètre, dont 1 milliard de spécifications sont principalement destinées à des scénarios textuels et 7 milliards de spécifications pour le dialogue naturel et le téléobjectif de questions-réponses de connaissances sont les points forts du déploiement côté appareil. Dans l’introduction officielle, les spécifications de 1 milliard sont orientées séparément du côté de l’appareil, et les spécifications de 7 milliards sont définies pour être à double usage pour l’appareil et le cloud, et elles ont toutes été déployées dans le cloud depuis 70 milliards, ce qui reflète également l’idée matricielle de vivo de « laisser Dieu revenir à Dieu, et César à César » dans la collaboration appareil-cloud.

C’est la même chose que la conférence des développeurs I/O de Google en mai de cette année, lorsque Google a publié un grand modèle PaLM2 avec quatre spécifications de paramètres, dont le modèle de petit paramètre peut traiter 20 jetons par seconde à l’état hors ligne, ce qui convient à l’utilisation hors ligne des terminaux.

Si vous pensez que vivo « arrache les dents des gens », c’est trop dur. En fait, vivo a entrepris de mettre en place une équipe interne d’IA dès 2017, et aujourd’hui, l’Institut de recherche en IA vivo compte plus de 1 000 chercheurs.

Même si sa précipitation technique est généralement inférieure à celle du premier échelon comme Ali et Baidu, l’existence de la communauté open source permet également aux acteurs qui entrent sur le marché un peu plus tard de rattraper rapidement la grande armée. L’institut de recherche Knowledge Graph créé par vivo en 2018 peut également renforcer dans une certaine mesure le manque de données d’entraînement qu’il peut rencontrer en tant que fabricant de téléphones portables.

En ce qui concerne la capacité du modèle, vivo a remis une bonne feuille de réponses pendant la période d’échauffement. Il est rapporté que BlueLM a remporté la première place dans la catégorie « modèle d’accès restreint » dans l’ensemble d’évaluation tiers C-of Chinese grand model. Selon son annonce officielle, BlueLM est le premier grand modèle 7B côté appareil de l’industrie.

Cependant, il n’y a pas peu de modèles qui ont obtenu des scores élevés dans l’évaluation, mais qui ont des performances réelles insatisfaisantes, et certaines personnes dans l’industrie disent que cette liste a été « balayée » au cours de la dernière période, ce qui ne peut représenter que la capacité du modèle à « poser des questions » et ne peut pas refléter la capacité de raisonnement, la sécurité et l’adaptabilité. De ce point de vue, il est clair que les résultats commerciaux de vivo nécessitent davantage de tests pratiques.

De plus, les capacités actuelles des modèles cloud de vivo, telles que le diagramme de Wensheng et l’interaction, ne sont pas sorties du piège des grands modèles, et la nouveauté est limitée. De plus, sa capacité de modèle côté appareil en tant que jeu majeur est encore au stade des tests, et l’affichage des capacités côté extrémité est inévitablement limité par le matériel de téléphonie mobile.

Nous avons appris que de nombreux utilisateurs qui ont été invités à participer aux tests internes de Blue Heart utilisent des téléphones phares représentés par X90 Pro, et ces modèles sont également les plus élevés dans le calendrier d’adaptation bêta publique pour les applications de modèles à grande échelle publiées par vivo.

S’il vous plaît entrez le diagramme pour dire

Il ne fait aucun doute que les grands modèles sont en train de devenir le deuxième champ de bataille pour les fabricants de téléphones mobiles pour s’ouvrir au haut de gamme, et ils sont également une variable importante pour revitaliser les utilisateurs et activer l’IoT. Malgré cela, il existe encore de nombreuses variables dans l’intention de vivo d’augmenter la valeur des produits haut de gamme en s’appuyant sur de grands modèles

En fin de compte, le lancement du grand modèle n’est pas seulement la nouvelle pierre angulaire du haut de gamme de vivo, mais aussi sa tentative de tirer de nouvelles machines et des produits haut de gamme.

Les modèles bas de gamme sont naturellement difficiles à faire face à cette guerre haut de gamme. Prenons l’exemple du modèle de base Y100 publié par vivo avant cette conférence de presse, il s’agit de l’un des derniers modèles du plan d’adaptation mentionné ci-dessus, et derrière un tel mouvement similaire de « coup de poignard dans le dos » se cache l’espoir de « petit boulier » de vivo de revenir sur le trône avec des produits haut de gamme.

Malgré tout, le lancement de grands modèles n’est toujours pas un plus pour les produits haut de gamme de vivo.

Wang Yang (pseudonyme), un entrepreneur de la communauté open-source du grand modèle côté appareil, a déclaré à Photon Planet que la capacité du grand modèle côté appareil réside dans les performances de l’IA apportées par son NPU (processeur spécialement conçu pour le calcul par réseau neuronal profond). Cependant, les modèles précédents de vivo n’ont pas prêté attention aux capacités NPU, il est donc probable qu’il sera difficile pour les modèles plus anciens de faire fonctionner de grands modèles en douceur.

En ce qui concerne la prochaine version, le nouveau modèle de la série vivo X100 équipé de la puce phare MediaTek Dimensity 9300 et d’une nouvelle génération de processeur AI pourrait être en mesure d’utiliser les capacités du modèle en douceur, mais dans le cas où il existe déjà de grandes applications de modèles telles que Wenxin Yiyan et iFLYTEK Xinghuo sur le marché, l’espace laissé pour le téléphone mobile n’est pas aussi grand qu’imaginé. Par rapport à la capacité, peut-être que le gameplay montré par vivo cette fois-ci est plus digne d’une étude approfondie.

**Rendre votre téléphone plus intelligent ? **

Kevin Scott, CTO de Microsoft, qui a poussé Microsoft à devenir un investisseur providentiel dans OpenAI, a déclaré publiquement que le modèle lui-même n’est pas un produit, mais une infrastructure. L’implication est qu’une fois que la formation a affiné la base du modèle, l’exploration de la productisation est au cœur du « second entrepreneuriat » de nombreux acteurs.

La « reproductisation » des grands modèles sur les téléphones mobiles va de soi, mais les grands modèles déployés sur les téléphones mobiles doivent encore être davantage produits. À en juger par les informations exposées jusqu’à présent, vivo réalisera la capacité du grand modèle grâce à une application appelée Xiao V Assistant, et la voie courante actuelle dans l’industrie consiste à intégrer la capacité du grand modèle sur l’assistant d’intelligence artificielle existant.

Les utilisateurs de smartphones ont un réel besoin de capacité à comprendre les grands modèles, qu’il s’agisse d’un assistant intelligent appelé en plaisantant « déficience intellectuelle artificielle » ou d’une application et des données de plus en plus gonflées sous l’explosion de la capacité, les téléphones mobiles doivent être en mesure de mieux comprendre l’interaction et d’aider les utilisateurs à trier les informations. L’ajout de grands modèles vise essentiellement à apporter des capacités de compréhension du langage naturel aux téléphones mobiles.

Dans le cas d’une implémentation non implémentée, les problèmes d’expérience utilisateur tels que la consommation d’énergie, la dissipation thermique et la latence qui peuvent se produire dans le modèle côté appareil peuvent être ignorés pour le moment. De l’avis de Wang Yang, le principal problème auquel est confronté le modèle vivo est de savoir comment distinguer les limites de capacité des différents modèles et comment les appeler lorsque plusieurs modèles sont utilisés ensemble, « ce qui est lié à la forme et à la présentation du produit final ».

Face à la face C avec des scénarios généralisés et des exigences complexes, les modèles invoqués par les différentes exigences sont différents. Par exemple, le modèle de spécification de 1 milliard et le modèle de spécification de 7 milliards du côté de l’appareil doivent apprendre des données locales de l’utilisateur pour tenter de « mieux comprendre l’utilisateur ». Par conséquent, la possibilité d’utiliser la capacité du modèle et le système d’exploitation adapté à celui-ci pour mettre en œuvre des instructions complexes sur le téléphone mobile est un indicateur important.

Jusqu’à présent, la fonction de commande complexe démontrée par BlueLM est assez remarquable. Sous le nouveau système d’exploitation OriginOS 4, le V-assistant se trouve dans le coin inférieur droit de la barre latérale et peut être affiché en cliquant dessus. Non seulement la logique de fonctionnement est plus courte que celle du modèle côté cloud, qui est plus adapté à l’utilisation du téléphone mobile, mais aussi certaines instructions complexes dans le système d’exploitation, telles que la recherche intelligente d’albums, l’achèvement préliminaire de commandes d’applications tierces et les paramètres du système d’exploitation.

Il convient de mentionner que le petit assistant V est isolé de la voix Jovi existante de vivo en termes de fonction et de chemin, et que les deux sont indépendants l’un de l’autre, ce qui est évidemment différent du chemin de grand modèle côté appareil proposé par d’autres fabricants auparavant.

D’un point de vue fonctionnel, le petit assistant V peut essentiellement obtenir une couverture complète de la voix de Jovi, de sorte que le but de la distinction entre les deux est probablement de permettre aux utilisateurs de ressentir la différence entre les deux. De plus, la logique du produit du petit assistant V est similaire à celle de Copilot portée dans le compartiment familial de Microsoft, et les deux chemins différents sont susceptibles d’être intégrés à l’avenir.

Cela reflète également le fait que le BlueLM actuel est encore en phase de test et que la forme du produit est difficile à qualifier de mature.

Selon les commentaires de ceux qui ont participé au test interne BlueLM, avec la capacité du modèle phare de vivo, il y a toujours un retard de 2 s ~ 5 s dans l’exigence de génération de texte brut dans les 20 jetons, ce qui n’est pas une bonne nouvelle pour la mise en œuvre ultérieure - le retard du modèle côté cloud n’a pas été bien résolu. Cela peut être amélioré dans les modèles équipés des dernières puces d’IA des fabricants de puces, mais pour les consommateurs, cela ne constitue pas une raison pour changer de téléphone.

De plus, en tant que premier modèle de téléphonie mobile de l’industrie, la capacité de modèle côté cloud de vivo est également confrontée à « l’encerclement » des grands modèles de nombreux fournisseurs de cloud.

Par exemple, vivo a annoncé qu’il lancerait le robot conversationnel Lanxin Qianxun dans l’App Store, et les 175 milliards de spécifications de paramètres ne sont pas remarquables par rapport aux grands modèles des magasins d’applications actuels. Parmi les fournisseurs de cloud, Baidu a déjà fait payer la version professionnelle Wenxin 4.0 récemment publiée pour tâter le terrain, tandis que Lanxin Qianxun semble être un membre moins accrocheur de l’écosystème des grands modèles vivo, et sa route est évidemment obstructive et longue.

Il convient de mentionner que vivo est un retardataire, et que l’écart dans les précipitations technologiques limitera également l’avancement de son activité de modèles modèles à grande échelle.

En termes de logiciel, le grand modèle vivo est devenu le matériel promotionnel de la plate-forme d’apprentissage automatique Pai d’Alibaba Cloud, et nous pouvons même trouver l’ombre de « Tongyi Qianwen » du nom de « Blue Heart Qianwen ». L’exécution sur le cloud implique des coûts à long terme, et cela se reflète de la manière la plus frappante dans OpenAI. Du point de vue des coûts, si vivo veut faire de BlueLM un écosystème à long terme, l’IDC auto-construit est évidemment plus propice au développement à long terme que la migration vers le cloud.

En termes de matériel, Huawei et Apple, les deux principaux fabricants, ont déjà intégré des capacités NPU auto-développées dans leurs gammes de produits existantes, tandis que vivo doit encore s’appuyer sur les fabricants de puces. Même si certains obstacles peuvent être rencontrés lors de l’entraînement et de la mise au point des modèles, l’écart matériel en tant que noyau conduit toujours à plusieurs positions chez les principaux fabricants.

Bataille de terminaux de grand modèle

L’ajout du grand modèle nous fait réaliser à nouveau que l’essence du smartphone est un terminal intelligent qui intègre de multiples capacités, et qu’il a à la fois des entrées matérielles et du système d’exploitation. Les conditions uniques font qu’il est naturel de combiner les téléphones portables avec de grands modèles.

D’autres terminaux peuvent-ils également être connectés au grand modèle et redéfinir les limites de capacité du terminal, tout comme la refonte de l’application ?

L’exploration de ce problème remonte à l’éclosion des réseaux d’apprentissage profond, et la discussion sur la possibilité de modèles de bout en bout découle également des problèmes « clichés » de latence, de consommation d’énergie, de confidentialité et d’autres problèmes dans l’industrie.

En fait, bien avant le début officiel de cet engouement pour l’intégration de grands modèles dans les téléphones portables, les véhicules à énergie nouvelle avec conduite autonome sont déjà devenus un terminal de grands modèles. Il n’y a pas de manque d’imagination dans l’industrie que les appareils portables intelligents sont équipés de grands modèles, mais les téléphones mobiles semblent être sur le point de passer en premier avec la diversité des scènes et la commodité du réseau.

De plus, lorsque les fabricants de téléphones mobiles lanceront de grands modèles et les mettront en service, ce sera un excellent terrain d’entraînement pour les modèles de bout en bout. Nous pouvons également discuter de la méthodologie d’une variété de terminaux équipés de grands modèles à partir de l’atterrissage de grands modèles de téléphones portables.

Après tout, quelle que soit la qualité du modèle sur le téléphone, la meilleure performance qui puisse être obtenue dans un court laps de temps n’est rien de plus qu’une « secrétaire » dans le domaine de la vie de l’utilisateur. L’imagination apportée par le grand modèle d’autres bornes intelligentes est sans aucun doute plus grande.

Par exemple, les distributeurs automatiques de billets, qui se retirent progressivement de l’étape historique en raison du paiement mobile, peuvent s’appuyer sur de grands modèles pour permettre aux utilisateurs d’éviter la banque pour faire la queue pour des affaires approfondies ; Il s’agit également d’une caméra intelligente qui appartient au scénario B-end, qui identifie les signes de base des patients dans le domaine médical, l’inspection rapide de la qualité dans le domaine industriel et l’irrigation intelligente dans le domaine agricole. Aujourd’hui, le marché du B-end, qui n’a pas été largement ouvert en s’appuyant sur le modèle cloud-side, pourrait également inaugurer la variable du end-side.

C’est d’ailleurs pour cette raison que vivo présentera le système d’exploitation Blue River (BlueOS) équipé de la nouvelle vivo Watch lors de cette conférence de presse alors que son écologie n’est pas aussi parfaite que celle de Huawei et Xiaomi. En tant que système cross-terminal développé par vivo pour l’ère de l’intelligence artificielle généraliste, son lancement vise à piloter une série de produits IoT à travers les téléphones mobiles, ce qui a sans aucun doute une bonne imagination.

vivo a également annoncé l’open-source de son modèle de spécification 7B et a lancé le kit de développement BlueKit, qui est une ambition claire pour la construction écologique. Peut-être qu’à l’heure actuelle, vivo n’en est qu’au stade de laisser l’IoT comprendre les instructions, mais c’est très important pour les futures stratégies haut de gamme, écologiques et autres de vivo.

Les capacités du modèle de téléphone mobile sont inconnues, et il y a de nombreux défis, et après la sortie officielle et l’atterrissage, il est tenu d’apporter plus de directions « à volume ouvert » à l’industrie. Des postures d’atterrissage plus bizarres attendent d’être débloquées par l’industrie.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)