Huit mois se sont écoulés, où en est la mise en œuvre du modèle chinois à grande échelle ?

Source originale : Industriel

Source de l’image : Généré par Unbounded AI

8 mois se sont écoulés depuis le jour où ChatGPT a éclaté.

En 8 mois, de nombreux grands modèles en Chine ont vu le jour et ont continué à pénétrer divers scénarios industriels à une vitesse rapide. Mais jusqu’à présent, il n’y a pas eu de scénarios ou d’industries qui ont été vraiment subvertis par de grands modèles.

Les statistiques montrent qu’en ce qui concerne l’application de grands modèles, 45 % des entreprises sont au stade de l’attente, 39 % des entreprises en sont au stade de l’exploration et de l’étude de faisabilité, 16 % des entreprises en sont au stade de l’application pilote et les entreprises dont l’application complète est nulle. **

Une question qui mérite d’être examinée est la suivante : où en est la mise en œuvre des grands modèles sur le sol chinois aujourd’hui ?

Un grand modèle d’atterrissage, la finance, l’énergie d’abord

« S’il vous plaît, aidez-moi à vérifier ma consommation d’électricité en août de cette année, et quel jour vais-je utiliser le plus d’électricité ? » Aidez-moi à détecter les défauts de cette image »... Sur la Southern Artificial Intelligence Innovation Platform, grâce à l’interaction linguistique, une donnée s’affiche clairement devant vous.

Sur cette plate-forme, les travailleurs de l’industrie de l’énergie peuvent donner des instructions au modèle d’alimentation, afin qu’il puisse générer automatiquement des résultats de traitement des données, identifier avec précision les détails de l’image des scènes de défauts et aider le personnel à récupérer et à traiter les données dans le processus d’inspection de l’alimentation.

À l’heure actuelle, dans le domaine du service client de China Southern Power Grid, 60% des problèmes à haute fréquence peuvent être résolus par le modèle d’alimentation, et le modèle d’alimentation est encore meilleur que le manuel pour identifier les fluctuations du sentiment des clients.

De plus, dans le domaine de la transmission et de la distribution d’énergie, le modèle de puissance ** a la capacité de traiter 100 images de problèmes par minute, et peut également identifier 20 types de défauts en même temps, et l’efficacité de reconnaissance est 10 fois supérieure à celle des algorithmes d’IA traditionnels. **

Dans le domaine de la répartition de l’énergie, le modèle d’alimentation peut aider le service de répartition à générer rapidement et automatiquement des plans d’élimination pour les conditions anormales dans le réseau électrique et à répondre aux exigences de la réglementation du marché de l’électricité en temps opportun, ce qui rend les plans plus sûrs, plus efficaces et moins coûteux.

Il s’agit d’un microcosme de la mise en œuvre de grands modèles dans le domaine de l’énergie.

Il est entendu que certains grands fabricants d’énergie ont commencé à coopérer avec des entreprises technologiques dans l’application de grands modèles, en particulier dans le domaine des réseaux électriques et des mines, formant des démonstrations pilotes préliminaires, telles que la planification du réseau électrique, l’enquête sur les défauts / défauts, la surveillance de l’exploitation des mines de charbon et d’autres scénarios.

Outre le domaine de l’énergie, le domaine financier est également l’un des plus grands scénarios d’atterrissage des grands modèles. **

Dans un rapport d’iAnalytics, l’énergie et la banque ont également été répertoriées comme les deux secteurs ayant progressé le plus rapidement dans la mise en œuvre de grands modèles.

Le large éventail de mises en œuvre dans le domaine financier peut également être vu à partir du nombre de grands modèles et de la dynamique d’entreprise. Selon un ensemble de données, en août, le nombre de grands modèles avec des paramètres nationaux supérieurs à 1 milliard atteignait 116, dont environ 18 étaient de grands modèles dans le secteur financier. **

En outre, dans le rapport semestriel, neuf banques, dont la Banque industrielle et commerciale de Chine, la Banque agricole de Chine, la Banque de Chine, la Banque des communications, la Banque des marchands de Chine, la Banque CITIC de Chine, la Banque industrielle, la Banque Huaxia et la Banque Zheshang, ont clairement proposé d’explorer l’application de grands modèles.

Du côté des fabricants de maquettes à grande échelle, la publication de certains modèles industriels intensifs reflète également la rapidité de la mise en œuvre des scénarios financiers.

Par exemple, à la fin du mois de mai, Du Xiaoman a publié le modèle chinois de niveau 100 milliards « Xuanyuan » ; en juin, Tencent Cloud s’est associé à DCIS pour mener à bien une coopération en matière de modèles financiers, Agricultural Bank of China a lancé l’application de grands modèles de type ChatGPT, ChatABC, et Industrial and Commercial Bank of China a publié un modèle général pour le secteur financier basé sur Ascend AI.

De juillet à août, avec la mise en œuvre officielle des « Mesures provisoires pour la gestion des services d’intelligence artificielle générative », de nombreuses entreprises, dont Tencent, Baidu, iFLYTEK, Huawei, ByteDance et d’autres, ont successivement publié les dernières avancées en matière de modèles à grande échelle ; En septembre, Ant Group a également officiellement publié son modèle financier et CodeFuse, une plateforme de programmation d’IA générative open source.

**Le domaine financier est sans aucun doute l’un des scénarios les plus propices à l’atterrissage des grands modèles. **

Que ce soit dans le domaine de l’énergie ou dans le domaine financier, la raison pour laquelle nous pouvons réaliser l’atterrissage de grands modèles provient de certains points communs entre ces deux industries. **

Tout d’abord, les secteurs de l’énergie et de la banque sont des industries fortement axées sur les données, avec une bonne base de données et un environnement numérique, qui offre des conditions favorables à la formation et à l’application de grands modèles. **

Deuxièmement, les deux industries ont un grand nombre de besoins en matière de traitement des données et de prise de décision, et les technologies d’apprentissage automatique et d’apprentissage profond à grande échelle peuvent aider l’industrie à résoudre ces problèmes et à améliorer l’efficacité et la précision de la prise de décision.

En outre, le modèle d’affaires des secteurs de l’énergie et de la banque est relativement mature et a une valeur commerciale élevée, de sorte que la demande de technologie de grands modèles dans ces industries est également relativement importante, ce qui favorise l’application de grands modèles.

On peut voir que les deux principales industries de l’énergie et de la banque sont relativement rapides dans la mise en œuvre de grands modèles, principalement en raison de l’effet global de nombreux facteurs tels qu’une bonne base de données, une forte demande technique et une valeur commerciale élevée. **

Il convient de noter que même dans les deux scénarios d’atterrissage de la finance et de l’énergie, il existe encore des problèmes difficiles à surmonter pour les grands modèles.

2 Échec de la réalisation de la valeur attendue de la scène

Dans le secteur financier, le marketing, le contrôle des risques et l’exploitation sont les orientations d’application des grands modèles auxquels de nombreuses banques accordent plus d’attention.

Parmi eux, l’assistant intelligent de questions-réponses, le service client intelligent, la génération automatique d’images marketing et la rédaction de rapports post-prêt sont les subdivisions que les banques et autres institutions financières organisent activement. Cependant, à l’heure actuelle, la valeur des scénarios génératifs tels que l’assistant intelligent de questions-réponses, le service client intelligent et la génération automatique d’images marketing est presque la même que prévu, mais il existe toujours un écart entre les effets attendus et réels de la mise en œuvre de grands modèles dans la prise de décision et les scénarios d’application natifs tels que le réveil des clients endormis et les halls d’affaires numériques.

Par exemple, dans le scénario du service client intelligent, dans le passé, il y avait peu de banques de questions intelligentes et manquait de pertinence. De nos jours, la production de banques de questions personnalisées basées sur de grands modèles peut raccourcir le cycle de formation ; Dans le scénario de génération automatique d’images marketing, les concepteurs avaient l’habitude de sélectionner et de concevoir dans la bibliothèque de matériaux, mais ils peuvent désormais utiliser Midjourney pour les générer automatiquement, ce qui peut réduire les coûts de droits d’auteur et de main-d’œuvre.

Dans le cas d’un réveil somnolent des clients et d’un scénario d’attente de valeur de la salle d’affaires numérique, le premier utilise un grand modèle pour générer automatiquement une stratégie visant à réaliser des stratégies de bout en bout afin d’améliorer l’effet de réveil, tandis que le second utilise un grand modèle pour aider les clients à gérer les affaires, à recommander des produits et à effectuer des transactions, et peut réaliser de nouveaux canaux indépendants de l’APP.

Cependant, à l’heure actuelle, la valeur d’application pratique de ces deux scénarios n’est pas encore connue. **

L’application des modèles à grande échelle dans l’industrie de l’énergie est également similaire.

Dans le secteur de l’énergie, la valeur des applications génératives telles que l’exploitation et l’inspection des équipements, les assistants de connaissances et le service client intelligent est presque la même que prévu. Cependant, dans des scénarios tels que la documentation de maintenance, la réparation des pannes d’équipement et la prévision de la charge électrique, la valeur réelle du scénario est encore inconnue. **

Plus précisément, dans le scénario de l’assistant de connaissances d’exploitation et d’inspection de l’équipement, dans le passé, une base de connaissances structurée a été construite sur la base de la technologie NLP, et avec le soutien du grand modèle, le grand modèle peut être utilisé pour construire l’assistant d’exploitation et d’inspection afin d’améliorer l’efficacité. Dans le scénario du service client intelligent, dans le passé, le service client intelligent basé sur le modèle de Bert était utilisé, mais maintenant le grand modèle est utilisé pour améliorer l’expérience utilisateur du service client intelligent, ce qui peut permettre une compréhension plus précise de l’intention, un langage plus anthropomorphique et une expérience utilisateur améliorée.

Dans les scénarios de génération de documents de maintenance, de maintenance des pannes d’équipement et de prédiction de la charge de puissance, la valeur du grand modèle est de générer rapidement et automatiquement des documents pour améliorer l’efficacité, le grand modèle peut rapidement localiser la cause de la panne et fournir des suggestions et des solutions de maintenance, et incorporer plus de facteurs d’influence pour prédire la charge en temps réel afin d’améliorer la précision de la prédiction.

Cependant, à l’heure actuelle, la valeur des grands modèles dans ces scénarios n’est pas encore connue, et il faut encore du temps pour l’explorer. **On peut constater que, qu’il s’agisse de l’industrie financière ou de l’industrie de l’énergie, le scénario de production est rapide à atterrir et a de nombreuses applications, tandis que le scénario de prise de décision est plus lent et plus difficile à atterrir, et il y a moins d’applications. **

3 « Générer des scénarios > des scénarios de prise de décision » : une productivité difficile à convertir

À l’heure actuelle, la mise en œuvre du grand modèle ** en est encore au stade de l’application pilote et n’est pas entièrement lancée. **

Comme mentionné ci-dessus, les applications de grands modèles d’IA dans le secteur financier, telles que les questions-réponses intelligentes, le service client intelligent, les halls d’affaires numériques, la génération de rapports post-prêt, le réveil des clients endormis et la recommandation de produits financiers, ont été progressivement mises en œuvre, et le service client intelligent, les assistants de connaissances sur l’exploitation et l’inspection des équipements, la génération de documents de maintenance, les plates-formes de simulation de système électrique et la prévision de la charge électrique ont été mis à l’essai dans le secteur de l’énergie.

Cependant, le commerce de détail de biens de consommation, les valeurs mobilières et les médias en sont encore au stade exploratoire, tandis que les sociétés manufacturières et pharmaceutiques sont encore au stade attentiste.

On peut voir que si la mise en œuvre du grand modèle est plus optimiste dans son ampleur, elle est plus difficile dans sa profondeur.

La profondeur d’un grand modèle dépend de ses capacités, de son échelle, de ses ressources de calcul, de la qualité des données, de la connaissance du domaine, etc. Cependant, en ce qui concerne le modèle national actuel, il n’en est qu’à ses débuts, et de nombreuses installations et capacités s’améliorent encore progressivement. **

Limitées par des facteurs tels que les capacités du modèle et les effets de l’application, les applications d’atterrissage actuelles sont principalement basées sur des scénarios de génération. **

Différent du modèle de prise de décision, le modèle génératif est principalement utilisé dans les domaines de la génération de texte, du système de dialogue, de la traduction linguistique, etc., et peut générer une sortie de texte de haute qualité en analysant une grande quantité de données textuelles pour apprendre les règles de génération et les relations sémantiques internes des textes. Les modèles représentatifs des grands modèles génératifs comprennent la série GPT d’OpenAI et Wenxin Yiyan, de Baidu.

Les modèles de prise de décision sont principalement utilisés dans les systèmes de recommandation, l’apprentissage par renforcement et d’autres domaines, et les données à traiter contiennent généralement des variables numériques continues, et il est nécessaire de prendre des décisions ou de prédire les comportements futurs. Les modèles représentatifs des modèles de prise de décision comprennent la série AlphaZero de DeepMind et l’IA Dota2 d’OpenAI.

Par rapport au modèle de prise de décision, le modèle génératif se trouve tout d’abord dans le système de génération de texte et de dialogue, les données peuvent être collectées et organisées à travers un grand nombre de corpus de textes, tandis que dans le système de recommandation et l’apprentissage par renforcement, les données doivent généralement être conçues et construites manuellement, ce qui est relativement complexe.

Deuxièmement, la recherche dans les domaines de la génération de texte et des systèmes de dialogue a été relativement mature, et il existe de nombreux algorithmes et cadres prêts à l’emploi qui peuvent être utilisés, tandis que les domaines des systèmes de recommandation et de l’apprentissage par renforcement nécessitent plus d’exploration et de recherche.

En outre, il existe un large éventail de scénarios d’application dans des domaines tels que la génération de texte et les systèmes de dialogue, tels que les moteurs de recherche, les chatbots, l’écriture automatique, etc., tandis que les systèmes de recommandation et l’apprentissage par renforcement sont principalement utilisés dans le commerce électronique, la publicité, les jeux et d’autres domaines.

C’est un fait que, bien que les scénarios génératifs soient largement utilisés, les scénarios de prise de décision prédictive sont des scénarios à forte valeur ajoutée pour l’avenir. Qu’il s’agisse d’un grand fournisseur de modèles ou d’une entreprise, si vous souhaitez améliorer la valeur commerciale en fonction des capacités des grands modèles, cette dernière est la direction des efforts. **

4 Dans le scénario de l’industrie, regardons le modèle d’IA

**L’atterrissage d’un grand modèle nécessite d’abord la sélection des champs et des scénarios appropriés. Les scénarios dans ce domaine ont de solides capacités numériques et des bases numériques. **

Par exemple, dans le domaine du service client intelligent, de grands modèles peuvent être envisagés pour des scénarios tels que les systèmes de FAQ et les chatbots. Dans le domaine de la recommandation publicitaire, elle peut être appliquée à des scénarios tels que les recommandations personnalisées sur les plateformes de commerce électronique ; Dans le domaine de la surveillance de l’opinion publique, il peut être appliqué à des scénarios tels que la classification de contenu et l’analyse des sentiments des médias d’information.

Deuxièmement, il doit avoir une capacité de modèle et un effet d’application élevés. Du point de vue de la voie principale des utilisateurs actuels de l’entreprise pour mettre en œuvre le grand modèle, l’accent est mis par les entreprises du groupe sur le renforcement des capacités des grands modèles, et l’accent est mis sur l’exploration des scénarios d’application. Le renforcement des capacités des grands modèles est divisé en trois niveaux : la construction de l’infrastructure, la formation des grands modèles et l’application des grands modèles.

Il convient de noter qu’à l’heure actuelle, la direction d’application des grands modèles est principalement divisée en deux types : premièrement, les petits modèles sont le pilier, et les grands modèles améliorent l’efficacité de développement des petits modèles ; **

Cependant, cette trajectoire d’atterrissage limite les capacités du modèle.

Afin de promouvoir la profondeur de l’atterrissage de modèles à grande échelle, les fournisseurs de modèles réduits à grande échelle et les entreprises doivent continuer à explorer les capacités et les modèles de coopération. **

Certaines pistes d’approfondissement de l’atterrissage des grands modèles se dégagent peu à peu.

À l’avenir, avec le développement continu et la popularisation de la technologie des modèles à grande échelle, l’application de la cascade de modèles deviendra de plus en plus étendue.

Par exemple, plusieurs grands modèles peuvent être combinés et mis en cascade pour réaliser des scénarios d’application plus complexes et plus précis tels que la reconnaissance vocale, la reconnaissance d’images et le traitement du langage naturel. Dans le même temps, les grands modèles et les petits modèles peuvent également être mis en cascade pour tirer pleinement parti de leurs avantages respectifs et améliorer les performances et la capacité de généralisation du modèle.

Sur cette base, la profondeur d’application des grands modèles est élargie et l’application de scénarios de prise de décision dans divers domaines est accélérée.

Deuxièmement, les différentes industries ont des besoins spécifiques différents, et les grands modèles doivent se développer dans une direction plus personnalisée à l’avenir. Grâce à l’entraînement de corpus spécifiques à l’industrie, les grands modèles peuvent mieux s’adapter aux scénarios d’application réels de différentes industries.

Deuxièmement, afin de mieux répondre aux exigences d’efficacité et de ressources dans les applications pratiques, les grands modèles doivent être développés dans le sens d’une plus grande légèreté. Des techniques telles que la compression et l’élagage du modèle peuvent réduire la taille et la consommation de ressources informatiques du modèle tout en garantissant les performances du modèle.

En outre, avec l’importance croissante des questions de protection de la confidentialité des données, les grands modèles doivent accorder plus d’attention à la sécurité des données et à la protection de la vie privée.

La personnalisation, la légèreté et la sécurité des données du modèle sont devenues des facteurs importants pour sa mise en œuvre.

L’application du modèle d’IA de la Chine a permis d’obtenir une série de réalisations dans les domaines du service client intelligent, de la recommandation publicitaire et de la surveillance de l’opinion publique. Cependant, ** fait également face à de nombreuses difficultés dans le processus d’atterrissage. À l’avenir, avec le développement de technologies telles que la personnalisation de l’industrie, la légèreté des modèles et la sécurité des données, l’atterrissage et l’application de grands modèles d’IA ouvriront la voie à un espace de développement plus large. **

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)