Wang Yonggang : Fondateur et PDG de SeedV Lab, doyen exécutif d'Innovation Works AI Engineering Institute
Tong Chao : co-fondateur et chef de produit de SeedV Lab
Où sont les scénarios d'application de l'IA générative
Les technologies d'IA génératives telles que Stable Diffusion et ChatGPT ont attiré le plus l'attention du cercle du capital-risque informatique au premier semestre 2023. Lorsque nous nous remettrons de la magnifique vague de nouvelles technologies et que nous commencerons à réfléchir sérieusement au type de scénarios d'application qui sont les meilleures directions de mise en œuvre pour l'IA générative, beaucoup de gens trouveront encore que la relation entre la technologie et le marché est complexe , il est difficile de trier le meilleur chemin pour la mise en œuvre de l'IA générative :
Un investisseur : Ces derniers mois, toutes les institutions de capital-risque de premier plan se sont mobilisées et sont très occupées. Il s'avère qu'à l'exception de quatre ou cinq projets entrepreneuriaux modèles d'envergure et phares, recherchés par tous, d'autres AIGC les projets ne sont pas clairs et n'osent pas investir. , je ne sais pas où les applications d'IA vont se développer à l'avenir.
Un analyste : plusieurs projets de modèles à grande échelle de premier plan ont investi massivement et présentent des risques élevés ; toutes les applications côté B et côté gouvernement sont limitées par le déploiement privé et les données privées, et ont un cycle long et sont difficiles à mettre en œuvre ; la plupart des applications C Les applications secondaires le sont trop C'est trop superficiel et l'homogénéité des projets de génération de texte et d'image est sérieuse ; il est courant de démarrer une entreprise après un ou deux bons articles, mais l'équipe elle-même ne peut pas déterminer la direction spécifique de l'application. ..
Le plus grand point crucial de la réflexion ici est :
La plupart des gens pensent encore inconsciemment à l'IA générative comme un ensemble d'outils pour générer des dialogues, des articles et des images. Selon ce stéréotype : cette chose ne peut qu'aider les rédacteurs et les designers à gagner en efficacité, comment peut-on parler de changement subversif ?
Bien qu'il existe de nombreux signes indiquant que l'IA générative montre l'aube de l'intelligence artificielle générale (IAG), les personnes limitées par des jugements de valeur à court terme diront toujours : et alors ? voir c'est croire. L'IA d'aujourd'hui n'est-elle pas toujours en train de discuter, d'écrire des articles et de dessiner des images ?
Évidemment, il n'est pas conseillé d'analyser les perspectives d'application de l'IA générative uniquement à partir d'une seule perspective ou d'un seul nœud temporel. Existe-t-il un modèle de pensée simple et facile à utiliser qui relie le développement de l'IA générative ?
Construire un modèle de pensée autour de la contrôlabilité
Nous pensons que l'IA générative est une révolution de l'industrie de l'information qui peut être comparée à l'informatique de bureau et à l'informatique mobile, et a même un effet plus subversif. Les changements perturbateurs ne se réalisent jamais du jour au lendemain, mais se réalisent progressivement avec le développement et les progrès continus de l'IA générative. Si vous voulez voir clairement quels nouveaux produits, nouvelles plates-formes, nouveaux marchés et nouvelles opportunités l'IA générative apportera, nous pensons qu'il existe un chemin de réflexion simple et facile à comprendre qui est facile à guider la sélection des produits et la sélection des projets :
**Plus l'IA générative est contrôlable, plus elle perturbera le marché et l'industrie ! **
Ce chemin peut être simplement représenté par un graphique :
À mesure que la contrôlabilité de l'IA générative sur le contenu généré continue de s'améliorer, les scénarios d'application applicables à l'IA générative continueront de s'étendre et de s'approfondir. Le changement quantitatif entraîne un changement qualitatif. Une fois le seuil de domaine franchi, l'IA générative peut complètement transformer l'écologie des produits existants et doter les produits d'éléments véritablement intelligents.
Au cours du processus d'évolution, la contrôlabilité de l'IA générative passera en gros par six étapes. Prenons l'exemple de la génération de texte la plus élémentaire :
Phase 1 : Incontrôlable
Il y a plus de 20 ans, le modèle de langage statistique basé sur l'algorithme des N-grammes pouvait également générer un contenu textuel continu. Cependant, les résultats obtenus sont largement incontrôlables. Une forme aussi précoce d'« IA générative » n'a pratiquement aucune possibilité d'être transformée en produits, et encore moins de subvertir le marché existant.
Phase 2 : La direction générale est contrôlable
De la génération de texte basée sur LSTM ou RNN à la génération de texte GPT (comme GPT-2), l'IA générative a progressivement acquis la capacité de décrire un morceau de langage de type humain. La capacité de décrire à ce stade permet essentiellement d'obtenir des phrases fluides, et le contenu est à peu près conforme aux invites données par les humains.Cependant, parce que les détails, la structure ou la logique sont incontrôlables, il est encore difficile de se transformer en un produit vraiment utile.
Phase 3 : Structure contrôlable ou logique locale
De GPT-3 à ChatGPT (GPT-3.5), pour la première fois, l'IA générative contrôle la structure et la logique locale du contenu généré. La création de texte et les conversations à plusieurs tours sont deux écologies d'application typiques de cette période. Les premiers peuvent prendre en charge des scénarios pratiques tels que la synthèse automatique d'articles, la génération de documents juridiques et la génération de copies marketing, tandis que les seconds peuvent répondre à certains besoins de recherche conversationnelle, d'apprentissage des langues, de service client intelligent, de personnes virtuelles et de personnages de jeu intelligents.
Phase 4 : La chaîne de pensée préliminaire est contrôlable
De GPT-3.5 à GPT-4, la capacité de raisonnement logique de l'IA générative s'est considérablement améliorée. Pour la première fois, l'IA générative possède de puissantes capacités d'analyse (telles que l'extraction de données à partir de reportages et la synthèse des tendances), des capacités de contrôle (telles que la conversion du langage humain en instructions de contrôle système complexes) et des capacités de raisonnement logique préliminaire (telles que la réponse à des questions mathématiques simples , problèmes de logique). Le contenu textuel pouvant être généré s'étend également aux textes structurés et semi-structurés tels que les données, les tableaux, les codes, les séquences d'instructions, les workflows ou les chaînes d'outils. Cela a directement conduit à un grand nombre de nouveaux outils et systèmes caractérisés aujourd'hui par Copilot (littéralement traduit par "copilot").
Phase 5 : Le raisonnement logique complexe est contrôlable
Bien sûr, alors que le GPT-4 d'aujourd'hui génère du texte, la chaîne de pensée logique qui peut être contrôlée en est encore à ses balbutiements. Si tout se passe bien, les humains devraient développer une IA générative de nouvelle génération capable de contrôler avec précision un raisonnement logique complexe dans un avenir pas trop lointain. Une telle IA possède des capacités avancées de raisonnement logique telles que la mémoire, l'apprentissage, la planification et la prise de décision. Ces capacités sont suffisantes pour subvertir complètement la forme d'interaction homme-ordinateur au cours des dernières décennies et redéfinir la relation entre les humains et les ordinateurs dans des scénarios tels que les outils d'efficacité, les plates-formes de contenu, l'automatisation des processus métier, les robots, les systèmes d'exploitation et les appareils intelligents.
Phase 6 : règles ou principes contrôlables
D'un point de vue plus prospectif, les manifestations les plus élevées de la pensée humaine sont : 1. Découvrir des principes et formuler des règles basées sur la pensée inductive 2. Appliquer des principes ou des règles à des scénarios spécifiques basés sur la pensée déductive. La forme évolutive idéale de l'IA générative consiste à approcher le mode de pensée humain, à générer des règles ou des principes comparables à la pensée humaine et à les appliquer. Une fois qu'elle atteindra le "Royaume de la Liberté" où les règles ou les principes sont contrôlables, l'IA générative aura une forte capacité à itérer et à s'améliorer, et pourra concevoir des règles système et des règles mondiales comme les humains, et même mener des recherches scientifiques avec des scientifiques humains. .
Contrôle et sens d'application typique
L'amélioration de la contrôlabilité de l'IA générative a entraîné une expansion substantielle du domaine applicable. Nous utilisons la figure suivante pour résumer la relation entre la contrôlabilité et la meilleure direction d'application de l'IA générative à différents stades de développement :
Basées sur la contrôlabilité, à chaque étape du développement, les orientations applicatives soutenues par l'IA générative continuent de s'étendre et de s'approfondir, de la satisfaction de besoins simples et locaux, au développement progressif pour répondre aux besoins du domaine et de la plate-forme, et enfin au produit et au modèle commercial. changement perturbateur. Que la chaîne de pensée et le raisonnement logique soient contrôlables, et dans quelle mesure ils peuvent être contrôlés avec précision, sont les facteurs les plus critiques dans le processus de changement quantitatif vers le changement qualitatif.
Contrôle et cas d'application spécifiques
Sur la base de la contrôlabilité de l'IA générative, nous divisons les directions d'application les plus appropriées de l'IA générative aujourd'hui et dans un avenir proche en quatre catégories, et utilisons la figure suivante pour comparer les cas d'application typiques dans chaque catégorie avec l'application de l'IA générative. différents stades de développement sont liés :
Outil de création de contenu/Plate-forme de contenu
Les outils de création de contenu sont le scénario le plus direct et le plus rapide pour la mise en œuvre de l'IA générative. Avec l'amélioration de la contrôlabilité de l'IA générative, les tâches de création de contenu passeront de la simple création de texte et d'images à la création automatique complexe de vidéos, 3D, animations, jeux, films et mondes virtuels. Avec l'aide de l'IA, chaque personne ordinaire aura des capacités qui n'appartenaient à l'origine qu'à des équipes professionnelles et à des outils professionnels. Une fois que le désir créatif des gens ordinaires sera grandement libéré, les besoins de plus haut niveau de partage, de visualisation, d'achat et de socialisation sous de nouvelles formes de contenu entraîneront sûrement la naissance, le développement et la croissance d'une nouvelle génération de plateformes de contenu.
** Automatisation des affaires/Services aux entreprises **
Pour des raisons telles que la sécurité des données, le déploiement privé, l'exactitude du contenu et la conformité, les processus métier ont des exigences très élevées en matière de contrôlabilité de l'IA générative. Les domaines d'activité où l'IA générative est la plus appropriée aujourd'hui peuvent inclure la création de contenu dans le marketing et les interfaces utilisateur dans le commerce électronique. En outre, l'IA générative peut également améliorer considérablement l'efficacité de l'entreprise en générant automatiquement des codes intermédiaires tels que SQL, en collectant et en analysant automatiquement les données, en générant automatiquement des rapports et en connectant automatiquement les processus métier. À l'avenir, avec l'amélioration de la contrôlabilité de l'IA générative, davantage de technologies d'IA de pointe seront absorbées dans des processus clés tels que la planification, la prise de décision et l'optimisation des processus métier.
Assistant personnel/Assistant professionnel
Dans les scénarios de la vie personnelle et du bureau, l'IA générative servira progressivement de diverses formes "d'assistants" et établira un nouvel écosystème de collaboration homme-IA d'ici quelques années. Le degré de contrôle de l'IA générative détermine fondamentalement l'intelligence des assistants d'IA dans nos vies ou notre travail et les problèmes qu'ils peuvent nous aider à résoudre. Une fois que l'IA générative aura atteint un niveau équivalent aux secrétaires, chauffeurs, traducteurs, avocats, etc. humains dans certains emplois, les assistants IA deviendront une nouvelle génération de produits électroniques populaires qui remplaceront les ordinateurs et les téléphones portables.
Infrastructure/Outils de développement/OS/Moteurs de recherche
Les capacités de programmation, les capacités de traitement des données, les capacités de conception de systèmes et les capacités de traitement des connaissances de l'IA générative fourniront de nouveaux concepts de conception et de nouvelles fonctions inter-âges pour les outils de développement, les bases de données, les moteurs de recherche et les systèmes d'exploitation. La question de savoir si un système d'exploitation avec l'IA comme noyau et une plate-forme informatique intelligente avec l'IA comme noyau peut voir le jour dans le futur dépend entièrement de la capacité de raisonnement logique complexe de l'IA générative.
Évolution des capacités d'application de l'IA multimodale
Par rapport à la simple génération de texte et à la génération d'images, les systèmes multimodaux comprenant le son, la vidéo, les scènes 3D, l'animation et les scénarios complexes sont plus conformes au bon sens humain et aux besoins originaux, et ont évidemment des perspectives d'application plus larges et de grande envergure. Pour l'état technique et les perspectives de l'IA multimodale, veuillez vous référer à un autre article de l'auteur de cet article :
Dans l'ère post-GPT, la multimodalité est la plus grande opportunité
Dans le domaine de la multimodalité, nous pensons que l'IA générative d'aujourd'hui et de demain évoluera et s'accumulera grosso modo selon le contexte illustré dans la figure ci-dessous, et continuera à donner naissance à de nouvelles applications révolutionnaires, de nouvelles plateformes, voire de nouveaux business models disruptifs :
Autorisation d'utilisation
Les images et le contenu textuel de toutes les feuilles de route d'application ci-dessus sont publiés par SeedV Lab sous licence CC BY 4.0. Sur la base de l'indication de la source originale (laboratoire SeedV), chacun est libre d'utiliser, de modifier et de republier.
Les images de la feuille de route de l'application ci-dessus sont également open source dans les emplacements suivants, bienvenue à visiter (vous pouvez directement cliquer sur [lire le texte original] à la fin de l'article pour visiter):
github.com/SeedV/generative-ai-roadmap
Voir l'original
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
Feuille de route des applications d'IA : la contrôlabilité est la feuille de route la plus solide
Source : Semi-Lumière
Auteur : Wang Yonggang
Où sont les scénarios d'application de l'IA générative
Les technologies d'IA génératives telles que Stable Diffusion et ChatGPT ont attiré le plus l'attention du cercle du capital-risque informatique au premier semestre 2023. Lorsque nous nous remettrons de la magnifique vague de nouvelles technologies et que nous commencerons à réfléchir sérieusement au type de scénarios d'application qui sont les meilleures directions de mise en œuvre pour l'IA générative, beaucoup de gens trouveront encore que la relation entre la technologie et le marché est complexe , il est difficile de trier le meilleur chemin pour la mise en œuvre de l'IA générative :
Le plus grand point crucial de la réflexion ici est :
Évidemment, il n'est pas conseillé d'analyser les perspectives d'application de l'IA générative uniquement à partir d'une seule perspective ou d'un seul nœud temporel. Existe-t-il un modèle de pensée simple et facile à utiliser qui relie le développement de l'IA générative ?
Construire un modèle de pensée autour de la contrôlabilité
Nous pensons que l'IA générative est une révolution de l'industrie de l'information qui peut être comparée à l'informatique de bureau et à l'informatique mobile, et a même un effet plus subversif. Les changements perturbateurs ne se réalisent jamais du jour au lendemain, mais se réalisent progressivement avec le développement et les progrès continus de l'IA générative. Si vous voulez voir clairement quels nouveaux produits, nouvelles plates-formes, nouveaux marchés et nouvelles opportunités l'IA générative apportera, nous pensons qu'il existe un chemin de réflexion simple et facile à comprendre qui est facile à guider la sélection des produits et la sélection des projets :
**Plus l'IA générative est contrôlable, plus elle perturbera le marché et l'industrie ! **
Ce chemin peut être simplement représenté par un graphique :
Au cours du processus d'évolution, la contrôlabilité de l'IA générative passera en gros par six étapes. Prenons l'exemple de la génération de texte la plus élémentaire :
Phase 1 : Incontrôlable
Il y a plus de 20 ans, le modèle de langage statistique basé sur l'algorithme des N-grammes pouvait également générer un contenu textuel continu. Cependant, les résultats obtenus sont largement incontrôlables. Une forme aussi précoce d'« IA générative » n'a pratiquement aucune possibilité d'être transformée en produits, et encore moins de subvertir le marché existant.
Phase 2 : La direction générale est contrôlable
De la génération de texte basée sur LSTM ou RNN à la génération de texte GPT (comme GPT-2), l'IA générative a progressivement acquis la capacité de décrire un morceau de langage de type humain. La capacité de décrire à ce stade permet essentiellement d'obtenir des phrases fluides, et le contenu est à peu près conforme aux invites données par les humains.Cependant, parce que les détails, la structure ou la logique sont incontrôlables, il est encore difficile de se transformer en un produit vraiment utile.
Phase 3 : Structure contrôlable ou logique locale
De GPT-3 à ChatGPT (GPT-3.5), pour la première fois, l'IA générative contrôle la structure et la logique locale du contenu généré. La création de texte et les conversations à plusieurs tours sont deux écologies d'application typiques de cette période. Les premiers peuvent prendre en charge des scénarios pratiques tels que la synthèse automatique d'articles, la génération de documents juridiques et la génération de copies marketing, tandis que les seconds peuvent répondre à certains besoins de recherche conversationnelle, d'apprentissage des langues, de service client intelligent, de personnes virtuelles et de personnages de jeu intelligents.
Phase 4 : La chaîne de pensée préliminaire est contrôlable
De GPT-3.5 à GPT-4, la capacité de raisonnement logique de l'IA générative s'est considérablement améliorée. Pour la première fois, l'IA générative possède de puissantes capacités d'analyse (telles que l'extraction de données à partir de reportages et la synthèse des tendances), des capacités de contrôle (telles que la conversion du langage humain en instructions de contrôle système complexes) et des capacités de raisonnement logique préliminaire (telles que la réponse à des questions mathématiques simples , problèmes de logique). Le contenu textuel pouvant être généré s'étend également aux textes structurés et semi-structurés tels que les données, les tableaux, les codes, les séquences d'instructions, les workflows ou les chaînes d'outils. Cela a directement conduit à un grand nombre de nouveaux outils et systèmes caractérisés aujourd'hui par Copilot (littéralement traduit par "copilot").
Phase 5 : Le raisonnement logique complexe est contrôlable
Bien sûr, alors que le GPT-4 d'aujourd'hui génère du texte, la chaîne de pensée logique qui peut être contrôlée en est encore à ses balbutiements. Si tout se passe bien, les humains devraient développer une IA générative de nouvelle génération capable de contrôler avec précision un raisonnement logique complexe dans un avenir pas trop lointain. Une telle IA possède des capacités avancées de raisonnement logique telles que la mémoire, l'apprentissage, la planification et la prise de décision. Ces capacités sont suffisantes pour subvertir complètement la forme d'interaction homme-ordinateur au cours des dernières décennies et redéfinir la relation entre les humains et les ordinateurs dans des scénarios tels que les outils d'efficacité, les plates-formes de contenu, l'automatisation des processus métier, les robots, les systèmes d'exploitation et les appareils intelligents.
Phase 6 : règles ou principes contrôlables
D'un point de vue plus prospectif, les manifestations les plus élevées de la pensée humaine sont : 1. Découvrir des principes et formuler des règles basées sur la pensée inductive 2. Appliquer des principes ou des règles à des scénarios spécifiques basés sur la pensée déductive. La forme évolutive idéale de l'IA générative consiste à approcher le mode de pensée humain, à générer des règles ou des principes comparables à la pensée humaine et à les appliquer. Une fois qu'elle atteindra le "Royaume de la Liberté" où les règles ou les principes sont contrôlables, l'IA générative aura une forte capacité à itérer et à s'améliorer, et pourra concevoir des règles système et des règles mondiales comme les humains, et même mener des recherches scientifiques avec des scientifiques humains. .
Contrôle et sens d'application typique
L'amélioration de la contrôlabilité de l'IA générative a entraîné une expansion substantielle du domaine applicable. Nous utilisons la figure suivante pour résumer la relation entre la contrôlabilité et la meilleure direction d'application de l'IA générative à différents stades de développement :
Contrôle et cas d'application spécifiques
Sur la base de la contrôlabilité de l'IA générative, nous divisons les directions d'application les plus appropriées de l'IA générative aujourd'hui et dans un avenir proche en quatre catégories, et utilisons la figure suivante pour comparer les cas d'application typiques dans chaque catégorie avec l'application de l'IA générative. différents stades de développement sont liés :
Les outils de création de contenu sont le scénario le plus direct et le plus rapide pour la mise en œuvre de l'IA générative. Avec l'amélioration de la contrôlabilité de l'IA générative, les tâches de création de contenu passeront de la simple création de texte et d'images à la création automatique complexe de vidéos, 3D, animations, jeux, films et mondes virtuels. Avec l'aide de l'IA, chaque personne ordinaire aura des capacités qui n'appartenaient à l'origine qu'à des équipes professionnelles et à des outils professionnels. Une fois que le désir créatif des gens ordinaires sera grandement libéré, les besoins de plus haut niveau de partage, de visualisation, d'achat et de socialisation sous de nouvelles formes de contenu entraîneront sûrement la naissance, le développement et la croissance d'une nouvelle génération de plateformes de contenu.
** Automatisation des affaires/Services aux entreprises **
Pour des raisons telles que la sécurité des données, le déploiement privé, l'exactitude du contenu et la conformité, les processus métier ont des exigences très élevées en matière de contrôlabilité de l'IA générative. Les domaines d'activité où l'IA générative est la plus appropriée aujourd'hui peuvent inclure la création de contenu dans le marketing et les interfaces utilisateur dans le commerce électronique. En outre, l'IA générative peut également améliorer considérablement l'efficacité de l'entreprise en générant automatiquement des codes intermédiaires tels que SQL, en collectant et en analysant automatiquement les données, en générant automatiquement des rapports et en connectant automatiquement les processus métier. À l'avenir, avec l'amélioration de la contrôlabilité de l'IA générative, davantage de technologies d'IA de pointe seront absorbées dans des processus clés tels que la planification, la prise de décision et l'optimisation des processus métier.
Assistant personnel/Assistant professionnel
Dans les scénarios de la vie personnelle et du bureau, l'IA générative servira progressivement de diverses formes "d'assistants" et établira un nouvel écosystème de collaboration homme-IA d'ici quelques années. Le degré de contrôle de l'IA générative détermine fondamentalement l'intelligence des assistants d'IA dans nos vies ou notre travail et les problèmes qu'ils peuvent nous aider à résoudre. Une fois que l'IA générative aura atteint un niveau équivalent aux secrétaires, chauffeurs, traducteurs, avocats, etc. humains dans certains emplois, les assistants IA deviendront une nouvelle génération de produits électroniques populaires qui remplaceront les ordinateurs et les téléphones portables.
Infrastructure/Outils de développement/OS/Moteurs de recherche
Les capacités de programmation, les capacités de traitement des données, les capacités de conception de systèmes et les capacités de traitement des connaissances de l'IA générative fourniront de nouveaux concepts de conception et de nouvelles fonctions inter-âges pour les outils de développement, les bases de données, les moteurs de recherche et les systèmes d'exploitation. La question de savoir si un système d'exploitation avec l'IA comme noyau et une plate-forme informatique intelligente avec l'IA comme noyau peut voir le jour dans le futur dépend entièrement de la capacité de raisonnement logique complexe de l'IA générative.
Évolution des capacités d'application de l'IA multimodale
Par rapport à la simple génération de texte et à la génération d'images, les systèmes multimodaux comprenant le son, la vidéo, les scènes 3D, l'animation et les scénarios complexes sont plus conformes au bon sens humain et aux besoins originaux, et ont évidemment des perspectives d'application plus larges et de grande envergure. Pour l'état technique et les perspectives de l'IA multimodale, veuillez vous référer à un autre article de l'auteur de cet article :
Dans l'ère post-GPT, la multimodalité est la plus grande opportunité Dans le domaine de la multimodalité, nous pensons que l'IA générative d'aujourd'hui et de demain évoluera et s'accumulera grosso modo selon le contexte illustré dans la figure ci-dessous, et continuera à donner naissance à de nouvelles applications révolutionnaires, de nouvelles plateformes, voire de nouveaux business models disruptifs :
Les images et le contenu textuel de toutes les feuilles de route d'application ci-dessus sont publiés par SeedV Lab sous licence CC BY 4.0. Sur la base de l'indication de la source originale (laboratoire SeedV), chacun est libre d'utiliser, de modifier et de republier.
Les images de la feuille de route de l'application ci-dessus sont également open source dans les emplacements suivants, bienvenue à visiter (vous pouvez directement cliquer sur [lire le texte original] à la fin de l'article pour visiter):
github.com/SeedV/generative-ai-roadmap