Un « code de richesse » à bas seuil pour les travailleurs de l’industrie du contenu est en train de lever le mystère.
L’IA, qui semble être « l’ennemi naturel » des praticiens du contenu, est en fait un bon partenaire pour l’avenir. C’est juste que beaucoup de gens n’en sont pas conscients et se battent même contre cela.
Par exemple, lors de la grève de 118 jours à Hollywood, l’impact de l’IA sur l’industrie du divertissement était la priorité absolue dans les discussions sur la grève.
Lors de la discussion sur la nouvelle convention collective, le sujet de l’utilisation de l’IA a été négocié jusqu’à la dernière minute. Le média étranger « Wired » a souligné que les vidéos générées par l’IA n’ont pas encore atteint la qualité d’un film, mais qu’il y aura bientôt une chance d’y parvenir : « Un jour, il sera peut-être plus facile pour les gens ordinaires de faire des émissions de télévision copiées que d’attendre les studios ou les productions multimédias en streaming. » "
Bien que la plupart des outils d’IA avancés soient produits par des entreprises technologiques étrangères, selon les initiés de l’industrie, « les sociétés de cinéma et de télévision étrangères ne sont pas aussi rapides que les entreprises nationales en matière d’IA ». "
En Chine, les images générées par l’IA se sont tranquillement développées en tant que format émergent.
Si l’on prend l’exemple de l’industrie cinématographique, le capital-risque des festivals de films est un scénario d’application qui convient et nécessite des courts métrages basés sur l’IA. Dans le capital-risque, la plupart des quotidiens n’ont qu’à jouer le rôle d'"indication », et il n’y a pas besoin d’une grande précision dans le film fini, qui peut exprimer l’image dans l’esprit du créateur. L’IA crée des échantillons, ce qui peut réduire considérablement le coût de « l’indication ».
Par exemple, dans le cadre du FIRST Surprise Lab, qui s’est achevé à la fin du mois d’octobre, FIRST a organisé un atelier de production de courts-métrages IA pour les créateurs. Après seulement deux ou trois heures de partage, certains créateurs ont produit de manière indépendante un court-métrage sur l’IA, et ont ainsi eu l’occasion de montrer l’esthétique de leur image aux investisseurs et aux juges. Cette initiative est à l’avant-garde du capital-risque des festivals de films nationaux et, dans une certaine mesure, elle a aidé les jeunes créateurs à résoudre un problème de longue date.
Non seulement les festivals de cinéma, mais aussi les scénarios d’application des courts métrages d’IA ne sont pas seulement utilisés pour le « schéma », ils sont depuis longtemps immergés dans la vie des gens ordinaires. Certaines vidéos publicitaires quotidiennes peuvent être des images générées par l’IA. La création de ces images IA pour les annonceurs est en train de devenir une profession émergente. **Les créateurs qui sont entrés dans le jeu tôt peuvent obtenir des dizaines de milliers de yuans en retour pour des courts métrages IA réalisés en une seule journée. **
Qu’est-ce que l’IA va apporter, quels obstacles va-t-elle rencontrer en ce moment, et comment les gens du contenu devraient-ils saisir l’opportunité ?Poison Eye a trouvé un groupe d’IA et de praticiens du contenu pour discuter, essayant de restaurer le vrai visage de l’écologie de la création de l’IA.
Le capital-risque est le « premier » scénario
Le cinéma est un art audiovisuel, mais les dimensions qui peuvent être examinées dans le cadre du capital-risque se limitent souvent aux textes. Comment montrer la capacité d’image du réalisateur à l’employeur d’une manière pratique est l’un des points douloureux que le capital-risque doit résoudre de toute urgence.
Avant l’avènement des outils d’IA, il y avait deux façons principales pour les créateurs de créer des rushes. Le premier est un court-métrage en prises de vues réelles, mais le coût de la prise de vue réelle est élevé, et il n’est pas réaliste pour les jeunes créateurs. Bien que les activités de capital-risque des festivals et des expositions à grande échelle en Chine soutiennent progressivement la possibilité de tourner des films d’échantillons, les fonds totaux sont limités et il est difficile de couvrir tous les participants au capital-risque.
Une autre option consiste à éditer certains clips de films classiques dans des rushes, ce qui est moins cher, mais différents films ont des styles différents, et les rushes ne sont souvent pas en bon état.
Lors de la Golden Rooster Film Venture Capital Conference de cette année, le réalisateur Guo Fan, en tant que juge en chef, a déclaré sur les lieux : « Le montage de clips de films classiques, même s’ils sont bien coupés, est une « bombe fumigène », et le film fini que nous voyons réellement peut être très différent de celui-ci. » J’espère aussi que les futurs créateurs cesseront d’utiliser l’édition. C’est mieux de trouver un moyen de le filmer soi-même, même si ce n’est qu’un storyboard, même si c’est avec un téléphone portable, je pense que c’est bien de montrer nos idées avec notre cœur. "
L’IA est devenue un outil pratique pour « montrer des idées ».
Lors de l’atelier de formation FIRST, Song Donghuan, le fondateur de l’équipe « Story Solitaire », a choisi la combinaison Midjourney + Runway pour enseigner. Ces deux outils sont au niveau des « imbéciles ». Midjourney est un logiciel qui génère des images par le biais de texte, et Runway a publié une nouvelle fonctionnalité en juillet de cette année qui vous permet de générer directement des vidéos pertinentes après avoir saisi du texte, des images ou des descriptions d’images textuelles.
Travail des utilisateurs de la communauté du site officiel de Midjourney
Après avoir écouté le partage, Li Tang, le réalisateur et scénariste de « No Phase », a passé trois ou quatre jours à faire des recherches et a proposé un court-métrage sur l’IA qui a été salué par les juges. Bien qu’il s’agisse d’un genre à suspense, « Wu Xiang » implique de nombreux éléments de la culture populaire, et le protagoniste a toujours eu le sentiment d’être regardé et enveloppé, et ce sentiment est difficile à transmettre avec des mots seuls, et l’IA offre une opportunité de visualisation.
Avant d’en apprendre davantage sur les outils d’IA, comment présenter le monde dans le script de « No Phase » sous forme d’échantillons visuels est son « point de douleur très douloureux ». « J’ai déjà envisagé de tourner des rushes, mais c’est trop cher à réaliser. J’ai également utilisé d’autres films pour couper l’échantillon schématique, mais ce n’est pas précis, et je dois expliquer à la direction quelles parties doivent être ignorées lors de l’examen de ce type d’échantillon schématique. Mais avec l’avènement de l’IA, il est possible de le rendre un peu plus précis. Il a dit à Poison Eyes.
Par rapport au tournage réel, l’échantillon de film généré par l’IA ne peut pas montrer le contenu de la performance de l’acteur, ce qui est un grand regret que Li Tang pense qu’il s’agit d’un échantillon de capital-risque. Mais s’il n’est utilisé que comme référence en termes de texture et d’atmosphère, il estime que les images générées par l’IA ont atteint six ou sept pour cent des échantillons réels.
La valeur de l'« indication » peut non seulement faciliter la communication entre les investisseurs et les créateurs dans le domaine du capital-risque, mais aussi faciliter la communication de divers types d’œuvres dans la production cinématographique. Li Tang a mentionné : « Par exemple, au début d’un projet, lorsque je parlais à tous les types de travail du type de sentiment que je voulais, je ne pouvais le décrire qu’avec des mots auparavant, et peut-être que les partenaires qui travaillaient avec plus de personnes pouvaient pleinement comprendre ce que je voulais. » Mais maintenant, avec l’IA pour faire un schéma, c’est très intuitif et permet d’économiser beaucoup de coûts de communication. "
Mais en ce qui concerne l’application directe d’images générées par l’IA à des œuvres cinématographiques, selon Li Tang, sa précision est loin d’être suffisante.
Distance du film
De l’avis de Song Donghuan, ce n’est pas le cas, et après avoir utilisé une combinaison d’outils relativement plus complexe, l’IA a également la capacité de générer directement des films de haute précision.
Il a mentionné : « Par exemple, en termes de précision d’image, il est vrai que la méthode Midjourney+Runway ne peut générer que des images au niveau schématique, mais si d’autres outils sont ajoutés au processus de production pour poursuivre l’optimisation, tels que Stable Diffusion (un outil de dessin d’IA open source), je n’ai qu’à l’utiliser pour générer image par image, et cela finira par générer une qualité 8K. » "
Dans les films en prises de vues réelles, Song Donghuan estime que la valeur fondamentale de l’IA à l’heure actuelle est d’aider à résoudre certains contenus qui sont vraiment gênants à tourner. Par exemple, le jeune visage d’un acteur, une scène qui n’est pas pratique à tourner, comme la Cité interdite, le Vieux Palais d’été, les montagnes enneigées, les forêts tropicales humides, etc., tant qu’un certain nombre de photos sont données à l’IA, elle peut utiliser la technologie 3D telle que NERF (champ de rayonnement neuronal) pour restituer l’ensemble de l’espace.
Un rôle de substitution plus important se reflète dans les films d’animation.
« Les films d’animation d’aujourd’hui sont réalisés selon leur processus de production actuel, et le coût est généralement de l’ordre de dizaines de millions à des centaines de millions. Cependant, si l’IA est utilisée pour remplacer une partie du processus intermédiaire et créer une animation bidimensionnelle, son coût sera réduit à au moins un dixième du tiers d’origine, et peut-être un dixième. », a déclaré Song Donghuan.
En juillet de cette année, la start-up Fable n’a besoin que des utilisateurs pour saisir un texte, puis utilise l’IA pour produire directement un dessin animé de South Park, dans lequel le scénariste, l’animation, le réalisateur, la voix, le monteur... L’ensemble du processus de production d’une pièce de théâtre est réalisé par l’IA.
Huang Guoxian, le fondateur de Jinang Interactive, a déclaré après avoir vu l’animation qu’il a générée : « South Park est une animation relativement simple, il n’y a donc pas de grand écart entre la qualité de l’IA et l’animation originale en termes d’effets d’image. Mais l’intrigue n’est pas vraiment créative. "
C’est aussi le plus gros problème avec les images générées par l’IA actuelles - le travail d’image devient de plus en plus beau, mais le travail créatif fait toujours défaut. Selon lui, cela peut être lié à la logique sous-jacente de l’IA, « parce que l’IA est déduite selon la logique de l’apprentissage profond, et chaque étape est produite en fonction des résultats de l’apprentissage précédent, mais le travail créatif essaie d’éviter d’apprendre ou de répéter les résultats passés, et met l’accent sur l’innovation et la différence, de sorte que l’IA a été lente à faire des progrès à cet égard ». "
Il n’est pas difficile de réaliser un court-métrage par IA dans l’ensemble du processus, mais il est exponentiellement plus difficile de produire un long métrage de plus de 10 minutes. À l’heure actuelle, les excellents films d’IA de plus de 10 minutes sont rares dans le monde.
Selon Song Donghuan, il y a trois raisons pour lesquelles il est difficile de produire des longs métrages basés sur l’IA.
L’un d’eux est la composition de l’équipe. Les praticiens doivent avoir à la fois de l’expérience dans l’animation et dans le tournage, et s’il s’agit de la partie des performances des acteurs, la composition de l’équipe sera plus complexe, « Cela implique le problème de la gestion de l’échelle, qui est beaucoup plus compliqué que les courts métrages d’IA qui peuvent être réalisés par une seule personne. » "
South Park créé par l’IA
Le second est le script. Dans l’état actuel de l’industrie, peu de gens sont prêts à tâter le terrain de la production d’IA avec un contenu de haute qualité. Mais le paradoxe est que si ce n’est pas assez bon, aucun investisseur ne sera prêt à y investir, ou à construire une équipe mature pour cela, et le coup dur ne fonctionnera pas bien.
Le plus important, ce sont les normes techniques. Derrière les changements technologiques qui étaient filmés sur pellicule, qui sont devenus plus tard des caméras numériques, se cachait tout un ensemble de normes techniques qui passaient par un processus similaire à celui de passer des personnages traditionnels aux personnages simplifiés, simplifiant le flux de production auparavant complexe en un flux de production plus simple. À l’heure actuelle, il n’existe pas de processus normalisé pour les images générées par l’IA, ce qui conduit à la communication de différents types de travail dans le processus de travail, qui ne proviendra probablement pas du même système.
Après avoir éliminé ces facteurs objectifs, la différence de perception est également l’une des contraintes importantes.
D’après certains praticiens contactés par l’équipe de « Story Solitaire » au cours des six derniers mois, Song Donghuan a constaté que ce qui intéresse le plus tout le monde, ce sont les actifs qui peuvent être utilisés immédiatement, « comme certaines technologies d’échange de visages, ou des images d’actifs numériques comme le remplacement des personnes par des robots (Wonder Studio), qui sont très simples à créer après avoir eu l’IA ». Mais quand je parle du fait que le coût de production d’un projet peut être 10% plus élevé avec l’ajout de l’IA, ou que le coût élevé en ligne (coût de l’acteur) n’est peut-être plus nécessaire, beaucoup de gens ne sont pas très intéressés par leur position. "
C’est lié à l’inertie de l’industrie cinématographique, et tout le monde ne veut pas changer de vie. En particulier, les « artistes » qui sont habitués à la logique originelle de la production artistique ont tendance à maintenir une attitude attentiste face à l’intrusion de la technologie dans le champ de l’art, et sont lents à faire demi-tour lorsqu’ils adoptent de nouvelles technologies.
Bien que Song Donghuan ait été scénariste auparavant, il a étudié l’ingénierie à l’université, ce qui l’a poussé à se consacrer à la recherche dès qu’il a réalisé les changements que l’IA pouvait apporter, « En fait, nous sommes entrés en contact avec la plupart des réalisateurs de cinéma et de télévision, mais les réalisateurs qui ont une certaine réputation n’oseront peut-être pas essayer, mais certains camarades de classe qui n’ont pas de « bagage d’idole », il sera plus enclin à faire des courts métrages d’IA pour tâter le terrain, et puis plus il en fait, plus il se sent, et le film s’améliore de plus en plus. » "
Bien sûr, dans de nombreux cas, les changements de perception doivent être motivés par des résultats matures. Huang Guoxian a utilisé l’analogie de l’industrie des effets spéciaux il y a 20 ans, alors qu’elle n’en était qu’à ses débuts : « À cette époque, les gens ne savaient pas à quel point les effets spéciaux étaient réalistes, et ils ne savaient pas à quel point ils étaient acceptés par le public, et ce n’est que lorsque Hollywood a lancé des superproductions d’effets spéciaux l’une après l’autre que tout le monde a commencé à réaliser ce qu’il pouvait obtenir en l’utilisant dans les films. » "
Cependant, il y aura toujours la première personne à manger des crabes, et lorsque d’excellents longs métrages d’IA apparaîtront et que leurs équipes partageront leurs expériences réussies, les normes techniques de l’industrie pourront être lentement établies, et le concept sera inversé par le choc qu’il apporte. C’est juste qu’avant que le premier cas n’apparaisse, les pratiquants qui n’ont pas la confiance d’être les premiers à manger des crabes ne peuvent qu’attendre.
Un nouveau « mot de passe de richesse » pour les travailleurs ?
En plus d’être utilisés dans la création d’œuvres cinématographiques et télévisuelles et d’œuvres d’art, les scénarios d’application réels des courts métrages d’IA ont été assez étendus et ont été intégrés dans la pratique de diverses industries créatives.
Selon Song Donghuan, parmi les étudiants contactés par « Story Solitaire », certains d’entre eux font du design d’intérieur et utilisent des courts métrages d’IA pour concevoir pour les clients ; d’autres écrivent des romans en ligne, et au stade de l’écriture de quelques milliers de mots, ils transforment d’abord l’ensemble du concept du roman en un court-métrage d’IA pour attirer du trafic ; et certains magasins de meurtre de scripts ouverts, afin de répondre à la tendance de l’industrie du script killing à se développer dans le sens de l’immersion, utilisent l’IA pour créer des images atmosphériques et tracer des courts métrages.
Les scénarios d’application sont déjà très riches, mais leurs compétences ne sont pas maîtrisées par les praticiens de tous les secteurs, et un nouveau métier a émergé - des personnes qui aident toutes sortes de parties A à utiliser l’IA pour réaliser des courts-métrages.
Par rapport aux films en direct précédents, le coût des images générées par l’IA est très faible : « Si vous utilisez Runway Gen2, le coût direct de la puissance de calcul est de 18 yuans/minute, mais c’est comme un outil de base comme un stylo et du papier, et la différence de coût à l’avenir se reflétera davantage dans la différence des personnes. » », a déclaré Song Donghuan.
Un court-métrage sur l’IA réalisé avec Runway
Et les récompenses qu’il peut apporter sont substantielles.
Dans les recherches de Song Donghuan, les citations des réalisateurs qui réalisent des courts métrages sur l’IA varient considérablement, « allant de deux ou trois mille yuans par minute à 50 000 yuans par minute, et une publicité de 15 secondes peut être rapportée à deux ou trois mille par seconde ; "
Le problème est évident. Comparée aux emplois dans l’industrie du cinéma et de la télévision qui existent depuis de nombreuses années, la norme de prix est déroutante. Combien faut-il coter pour l’utilisation de courts métrages générés par l’IA, les attentes psychologiques de chaque partie A et partie B sont différentes, et il n’y a pas de canal suffisamment transparent pour comparer les prix.
« User Stories » sur le site du Runway
« Il n’y a pas de relation claire entre l’offre et la demande dans ce domaine, et elles sont toutes à l’étude. Parfois, l’offre et la demande ne se trouvent pas, mais le plus souvent, les attentes sont trop élevées et le budget trop faible. », a déclaré Song Donghuan.
Derrière les citations inégales se cachent les différents critères permettant de juger de la valeur des images générées par l’IA par des personnes de divers secteurs.
Xue Shanwu, qui a déjà été engagé dans la réalisation de storyboards et le directeur des effets spéciaux de films, a déclaré à Poison Eye que lorsque certains amis ont utilisé l’IA pour la première fois pour recevoir des commandes commerciales, ils ont fait le même devis que le processus de production traditionnel à l’insu de l’autre partie, « Certains partis A demanderont également spécifiquement à l’IA de le faire, de sorte que le devis sera relativement bas. » "
Dans l’esprit d’une partie A contactée par Xue Shanwu, le devis est toujours lié au temps payé par le créateur, estimant qu’il a un temps de sortie plus rapide, donc le prix devrait être plus bas. Cependant, selon Xue Shanwu, l’esthétique, la créativité et l’expérience du créateur sont les valeurs fondamentales du film fini, et ces valeurs devraient être utilisées comme norme de paiement.
Le court-métrage original de Xue Shanwu sur l’IA « Breaking Dawn »
À l’heure actuelle, Xue Shanwu acceptera certaines commandes commerciales pour des courts métrages et des publicités en combinant l’IA et les effets spéciaux traditionnels. Mais les commandes commerciales ne sont pas son objectif, il espère utiliser des outils d’IA pour créer plus de films et de séries télévisées de science-fiction, et à l’avenir, il prendra également les réalisateurs d’IA comme corps principal de sa planification de carrière.
« Je pense que la tendance de l’IA est qu’elle peut améliorer l’efficacité de nombreuses parties du processus de production et vous donner plus de temps pour réfléchir à la création. Par conséquent, le modèle de production original de type usine sera de moins en moins utilisé, et il y aura de plus en plus de petites équipes de trois ou quatre personnes. "
En tant que directeur de publicité, l’utilisation par BING d’outils d’IA est davantage une aide à son travail existant, et il ne fera pas de la création de courts métrages IA son activité principale à l’avenir. « J’ai déjà essayé d’utiliser l’IA pour générer l’ensemble du processus, mais j’ai constaté que les images des produits du client sont toujours déformées après leur importation, j’ai donc finalement utilisé une étape PS, qui ne peut pas être considérée comme l’IA de l’ensemble du processus, et il est impossible d’utiliser uniquement le doublage AI pour la partie doublage, y compris la partie doublage. "
De l’avis de BING, à l’instar du grand nombre de vidéos produites par les MCN dans la plate-forme de vidéos courtes, les images générées par l’IA peuvent les aider à libérer de la productivité, mais s’il s’agit d’une publicité qui nécessite des services personnalisés, l’IA ne peut être assistée que sous la forme d’outils, ou elle doit être ajustée manuellement.
Différentes personnes ont différents niveaux d’engagement avec cette « profession émergente », mais la priorité est de former une plate-forme de création ouverte. Que ce soit pour le parti A ou le parti B, la comparaison ouverte des prix et l’élimination du manque d’information de l’industrie sont propices au développement sain de l’industrie et à une concurrence loyale.
"Mot de passe de patrimoine » a également un seuil
L’émergence de l’IA a considérablement abaissé le seuil technique de production d’images, de sorte que les gens ordinaires peuvent également avoir la possibilité de s’enrichir grâce à la production d’images par IA. Cependant, il existe toujours une différence qualitative dans la qualité des images générées entre les personnes.
Plusieurs praticiens ont déclaré à Poison Eye que les personnes qui ont travaillé dans l’industrie du cinéma et de la télévision dans le passé ou qui ont une formation en apprentissage peuvent généralement générer des images d’IA de meilleure qualité.
Mais ce n’est pas absolu, car ce que les outils d’IA testent, c’est essentiellement l’imagination du créateur, et la capacité à décrire sa propre imagination. Par exemple, Song Donghuan a déclaré : « En prenant l’exemple du test de personnalité MBTI populaire actuel, nous avons constaté que N personnes, ou des personnes ayant plus de conviction et d’imagination, auront une plus grande capacité à faire des images générées par l’IA. "
Le site officiel de 16personnalités explique « N personnes ».
Pour les créateurs nationaux, un seuil plus subtil est que l’utilisation raffinée de l’IA exige que les créateurs aient un certain niveau d’anglais. La raison en est que le logiciel actuel de génération d’images d’IA, plus avancé, est développé à l’étranger, et qu’il a relativement peu d’apprentissage de la base de données chinoise, de sorte que la logique de son contenu généré n’est pas conforme aux habitudes d’utilisation des utilisateurs locaux nationaux, « y compris le contenu d’image qu’il génère, vous voulez des éléments très chinois, et maintenant il n’est pas assez précis, plus adapté à la fantaisie ou au contenu avec une vision internationale ». », A DÉCLARÉ BING
Mais selon Huang, l’écart linguistique se comblera lentement dans quelques mois, voire un an. « Parce que la transformation de la langue est très mécanique, il existe aujourd’hui des outils précis et pratiques pour la traduction. La clé est de décrire une image à partir de rien et de la faire comprendre avec précision par le système d’IA, et enfin de produire l’image ou la vidéo idéale. Cela exige que les « ingénieurs » qui exploitent l’IA aient un haut niveau d’imagination, des compétences associatives et la capacité d’utiliser les mots comme outil de description. "
Images « fantastiques » réalisées à l’aide de Midjourney
Une préoccupation plus courante est qu’il n’y a pas de problèmes de droits d’auteur avec le contenu généré par l’IA qui est directement commercialisé.
En attendant que des lois et des règlements spécifiques soient perfectionnés, le problème plus pratique est que même s’il existe des dispositions légales, il est en fait très difficile de découvrir et de déterminer si une œuvre est générée par l’IA. Surtout avec les progrès rapides de la technologie de l’IA, cette difficulté ne fait qu’augmenter.
La société mère de Chatgpt, Open AI, a lancé un classificateur de texte IA plus tôt cette année pour aider à identifier si le texte a été écrit par un humain ou par une IA. Mais il a été retiré des étagères quelques mois après son lancement parce qu’il ne pouvait même pas dire le contenu qu’il avait généré.
Fran Drescher, présidente de l’American Federation of Television and Radio Artists, le syndicat des acteurs qui a mené la grève à Hollywood, a déclaré lors de la conférence de presse : « Dans le monde de l’intelligence artificielle, trois mois équivalent à un an. "
Si cette tendance est suivie, l’abus de contenu d’IA auquel il pourrait être confronté à l’avenir ne peut être réglementé que par des rapports avec des preuves substantielles sous le principe de l’amélioration des lois et des règlements, c’est-à-dire que « le peuple ne poursuit pas et les fonctionnaires ne poursuivent pas ». C’est ainsi que les syndicats d’Hollywood peuvent maintenant parvenir à un accord qui peut être maintenu.
Il est presque inévitable que des images d’IA qui ne peuvent pas être distinguées pénètrent dans les médias quotidiens à grande échelle. Selon Song Donghuan, d’ici deux ans, 50 % du contenu circulant sur le marché bénéficiera d’une participation approfondie de l’IA, « La quantité totale de contenu généré par l’IA augmentera également considérablement par rapport à aujourd’hui ». Je pense que dans un avenir prévisible, il n’y aura pratiquement aucune création de contenu qui n’utilisera pas du tout AIGC. "
À ce moment-là, les « acteurs professionnels » de l’industrie du cinéma et de la télévision devront peut-être être écartés s’ils veulent se présenter à nouveau.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Gagner 3 000 en une seconde, les images IA deviennent le « mot de passe de richesse » des travailleurs ?
Source originale : Poison Eyes
Un « code de richesse » à bas seuil pour les travailleurs de l’industrie du contenu est en train de lever le mystère.
L’IA, qui semble être « l’ennemi naturel » des praticiens du contenu, est en fait un bon partenaire pour l’avenir. C’est juste que beaucoup de gens n’en sont pas conscients et se battent même contre cela.
Par exemple, lors de la grève de 118 jours à Hollywood, l’impact de l’IA sur l’industrie du divertissement était la priorité absolue dans les discussions sur la grève.
Lors de la discussion sur la nouvelle convention collective, le sujet de l’utilisation de l’IA a été négocié jusqu’à la dernière minute. Le média étranger « Wired » a souligné que les vidéos générées par l’IA n’ont pas encore atteint la qualité d’un film, mais qu’il y aura bientôt une chance d’y parvenir : « Un jour, il sera peut-être plus facile pour les gens ordinaires de faire des émissions de télévision copiées que d’attendre les studios ou les productions multimédias en streaming. » "
Bien que la plupart des outils d’IA avancés soient produits par des entreprises technologiques étrangères, selon les initiés de l’industrie, « les sociétés de cinéma et de télévision étrangères ne sont pas aussi rapides que les entreprises nationales en matière d’IA ». "
En Chine, les images générées par l’IA se sont tranquillement développées en tant que format émergent.
Si l’on prend l’exemple de l’industrie cinématographique, le capital-risque des festivals de films est un scénario d’application qui convient et nécessite des courts métrages basés sur l’IA. Dans le capital-risque, la plupart des quotidiens n’ont qu’à jouer le rôle d'"indication », et il n’y a pas besoin d’une grande précision dans le film fini, qui peut exprimer l’image dans l’esprit du créateur. L’IA crée des échantillons, ce qui peut réduire considérablement le coût de « l’indication ».
Par exemple, dans le cadre du FIRST Surprise Lab, qui s’est achevé à la fin du mois d’octobre, FIRST a organisé un atelier de production de courts-métrages IA pour les créateurs. Après seulement deux ou trois heures de partage, certains créateurs ont produit de manière indépendante un court-métrage sur l’IA, et ont ainsi eu l’occasion de montrer l’esthétique de leur image aux investisseurs et aux juges. Cette initiative est à l’avant-garde du capital-risque des festivals de films nationaux et, dans une certaine mesure, elle a aidé les jeunes créateurs à résoudre un problème de longue date.
Non seulement les festivals de cinéma, mais aussi les scénarios d’application des courts métrages d’IA ne sont pas seulement utilisés pour le « schéma », ils sont depuis longtemps immergés dans la vie des gens ordinaires. Certaines vidéos publicitaires quotidiennes peuvent être des images générées par l’IA. La création de ces images IA pour les annonceurs est en train de devenir une profession émergente. **Les créateurs qui sont entrés dans le jeu tôt peuvent obtenir des dizaines de milliers de yuans en retour pour des courts métrages IA réalisés en une seule journée. **
Qu’est-ce que l’IA va apporter, quels obstacles va-t-elle rencontrer en ce moment, et comment les gens du contenu devraient-ils saisir l’opportunité ?Poison Eye a trouvé un groupe d’IA et de praticiens du contenu pour discuter, essayant de restaurer le vrai visage de l’écologie de la création de l’IA.
Le capital-risque est le « premier » scénario
Le cinéma est un art audiovisuel, mais les dimensions qui peuvent être examinées dans le cadre du capital-risque se limitent souvent aux textes. Comment montrer la capacité d’image du réalisateur à l’employeur d’une manière pratique est l’un des points douloureux que le capital-risque doit résoudre de toute urgence.
Avant l’avènement des outils d’IA, il y avait deux façons principales pour les créateurs de créer des rushes. Le premier est un court-métrage en prises de vues réelles, mais le coût de la prise de vue réelle est élevé, et il n’est pas réaliste pour les jeunes créateurs. Bien que les activités de capital-risque des festivals et des expositions à grande échelle en Chine soutiennent progressivement la possibilité de tourner des films d’échantillons, les fonds totaux sont limités et il est difficile de couvrir tous les participants au capital-risque.
Une autre option consiste à éditer certains clips de films classiques dans des rushes, ce qui est moins cher, mais différents films ont des styles différents, et les rushes ne sont souvent pas en bon état.
Lors de la Golden Rooster Film Venture Capital Conference de cette année, le réalisateur Guo Fan, en tant que juge en chef, a déclaré sur les lieux : « Le montage de clips de films classiques, même s’ils sont bien coupés, est une « bombe fumigène », et le film fini que nous voyons réellement peut être très différent de celui-ci. » J’espère aussi que les futurs créateurs cesseront d’utiliser l’édition. C’est mieux de trouver un moyen de le filmer soi-même, même si ce n’est qu’un storyboard, même si c’est avec un téléphone portable, je pense que c’est bien de montrer nos idées avec notre cœur. "
L’IA est devenue un outil pratique pour « montrer des idées ».
Lors de l’atelier de formation FIRST, Song Donghuan, le fondateur de l’équipe « Story Solitaire », a choisi la combinaison Midjourney + Runway pour enseigner. Ces deux outils sont au niveau des « imbéciles ». Midjourney est un logiciel qui génère des images par le biais de texte, et Runway a publié une nouvelle fonctionnalité en juillet de cette année qui vous permet de générer directement des vidéos pertinentes après avoir saisi du texte, des images ou des descriptions d’images textuelles.
Après avoir écouté le partage, Li Tang, le réalisateur et scénariste de « No Phase », a passé trois ou quatre jours à faire des recherches et a proposé un court-métrage sur l’IA qui a été salué par les juges. Bien qu’il s’agisse d’un genre à suspense, « Wu Xiang » implique de nombreux éléments de la culture populaire, et le protagoniste a toujours eu le sentiment d’être regardé et enveloppé, et ce sentiment est difficile à transmettre avec des mots seuls, et l’IA offre une opportunité de visualisation.
Avant d’en apprendre davantage sur les outils d’IA, comment présenter le monde dans le script de « No Phase » sous forme d’échantillons visuels est son « point de douleur très douloureux ». « J’ai déjà envisagé de tourner des rushes, mais c’est trop cher à réaliser. J’ai également utilisé d’autres films pour couper l’échantillon schématique, mais ce n’est pas précis, et je dois expliquer à la direction quelles parties doivent être ignorées lors de l’examen de ce type d’échantillon schématique. Mais avec l’avènement de l’IA, il est possible de le rendre un peu plus précis. Il a dit à Poison Eyes.
Par rapport au tournage réel, l’échantillon de film généré par l’IA ne peut pas montrer le contenu de la performance de l’acteur, ce qui est un grand regret que Li Tang pense qu’il s’agit d’un échantillon de capital-risque. Mais s’il n’est utilisé que comme référence en termes de texture et d’atmosphère, il estime que les images générées par l’IA ont atteint six ou sept pour cent des échantillons réels.
La valeur de l'« indication » peut non seulement faciliter la communication entre les investisseurs et les créateurs dans le domaine du capital-risque, mais aussi faciliter la communication de divers types d’œuvres dans la production cinématographique. Li Tang a mentionné : « Par exemple, au début d’un projet, lorsque je parlais à tous les types de travail du type de sentiment que je voulais, je ne pouvais le décrire qu’avec des mots auparavant, et peut-être que les partenaires qui travaillaient avec plus de personnes pouvaient pleinement comprendre ce que je voulais. » Mais maintenant, avec l’IA pour faire un schéma, c’est très intuitif et permet d’économiser beaucoup de coûts de communication. "
Mais en ce qui concerne l’application directe d’images générées par l’IA à des œuvres cinématographiques, selon Li Tang, sa précision est loin d’être suffisante.
Distance du film
De l’avis de Song Donghuan, ce n’est pas le cas, et après avoir utilisé une combinaison d’outils relativement plus complexe, l’IA a également la capacité de générer directement des films de haute précision.
Il a mentionné : « Par exemple, en termes de précision d’image, il est vrai que la méthode Midjourney+Runway ne peut générer que des images au niveau schématique, mais si d’autres outils sont ajoutés au processus de production pour poursuivre l’optimisation, tels que Stable Diffusion (un outil de dessin d’IA open source), je n’ai qu’à l’utiliser pour générer image par image, et cela finira par générer une qualité 8K. » "
Dans les films en prises de vues réelles, Song Donghuan estime que la valeur fondamentale de l’IA à l’heure actuelle est d’aider à résoudre certains contenus qui sont vraiment gênants à tourner. Par exemple, le jeune visage d’un acteur, une scène qui n’est pas pratique à tourner, comme la Cité interdite, le Vieux Palais d’été, les montagnes enneigées, les forêts tropicales humides, etc., tant qu’un certain nombre de photos sont données à l’IA, elle peut utiliser la technologie 3D telle que NERF (champ de rayonnement neuronal) pour restituer l’ensemble de l’espace.
Un rôle de substitution plus important se reflète dans les films d’animation.
« Les films d’animation d’aujourd’hui sont réalisés selon leur processus de production actuel, et le coût est généralement de l’ordre de dizaines de millions à des centaines de millions. Cependant, si l’IA est utilisée pour remplacer une partie du processus intermédiaire et créer une animation bidimensionnelle, son coût sera réduit à au moins un dixième du tiers d’origine, et peut-être un dixième. », a déclaré Song Donghuan.
En juillet de cette année, la start-up Fable n’a besoin que des utilisateurs pour saisir un texte, puis utilise l’IA pour produire directement un dessin animé de South Park, dans lequel le scénariste, l’animation, le réalisateur, la voix, le monteur... L’ensemble du processus de production d’une pièce de théâtre est réalisé par l’IA.
Huang Guoxian, le fondateur de Jinang Interactive, a déclaré après avoir vu l’animation qu’il a générée : « South Park est une animation relativement simple, il n’y a donc pas de grand écart entre la qualité de l’IA et l’animation originale en termes d’effets d’image. Mais l’intrigue n’est pas vraiment créative. "
Il n’est pas difficile de réaliser un court-métrage par IA dans l’ensemble du processus, mais il est exponentiellement plus difficile de produire un long métrage de plus de 10 minutes. À l’heure actuelle, les excellents films d’IA de plus de 10 minutes sont rares dans le monde.
Selon Song Donghuan, il y a trois raisons pour lesquelles il est difficile de produire des longs métrages basés sur l’IA.
L’un d’eux est la composition de l’équipe. Les praticiens doivent avoir à la fois de l’expérience dans l’animation et dans le tournage, et s’il s’agit de la partie des performances des acteurs, la composition de l’équipe sera plus complexe, « Cela implique le problème de la gestion de l’échelle, qui est beaucoup plus compliqué que les courts métrages d’IA qui peuvent être réalisés par une seule personne. » "
Le second est le script. Dans l’état actuel de l’industrie, peu de gens sont prêts à tâter le terrain de la production d’IA avec un contenu de haute qualité. Mais le paradoxe est que si ce n’est pas assez bon, aucun investisseur ne sera prêt à y investir, ou à construire une équipe mature pour cela, et le coup dur ne fonctionnera pas bien.
Le plus important, ce sont les normes techniques. Derrière les changements technologiques qui étaient filmés sur pellicule, qui sont devenus plus tard des caméras numériques, se cachait tout un ensemble de normes techniques qui passaient par un processus similaire à celui de passer des personnages traditionnels aux personnages simplifiés, simplifiant le flux de production auparavant complexe en un flux de production plus simple. À l’heure actuelle, il n’existe pas de processus normalisé pour les images générées par l’IA, ce qui conduit à la communication de différents types de travail dans le processus de travail, qui ne proviendra probablement pas du même système.
Après avoir éliminé ces facteurs objectifs, la différence de perception est également l’une des contraintes importantes.
D’après certains praticiens contactés par l’équipe de « Story Solitaire » au cours des six derniers mois, Song Donghuan a constaté que ce qui intéresse le plus tout le monde, ce sont les actifs qui peuvent être utilisés immédiatement, « comme certaines technologies d’échange de visages, ou des images d’actifs numériques comme le remplacement des personnes par des robots (Wonder Studio), qui sont très simples à créer après avoir eu l’IA ». Mais quand je parle du fait que le coût de production d’un projet peut être 10% plus élevé avec l’ajout de l’IA, ou que le coût élevé en ligne (coût de l’acteur) n’est peut-être plus nécessaire, beaucoup de gens ne sont pas très intéressés par leur position. "
C’est lié à l’inertie de l’industrie cinématographique, et tout le monde ne veut pas changer de vie. En particulier, les « artistes » qui sont habitués à la logique originelle de la production artistique ont tendance à maintenir une attitude attentiste face à l’intrusion de la technologie dans le champ de l’art, et sont lents à faire demi-tour lorsqu’ils adoptent de nouvelles technologies.
Bien que Song Donghuan ait été scénariste auparavant, il a étudié l’ingénierie à l’université, ce qui l’a poussé à se consacrer à la recherche dès qu’il a réalisé les changements que l’IA pouvait apporter, « En fait, nous sommes entrés en contact avec la plupart des réalisateurs de cinéma et de télévision, mais les réalisateurs qui ont une certaine réputation n’oseront peut-être pas essayer, mais certains camarades de classe qui n’ont pas de « bagage d’idole », il sera plus enclin à faire des courts métrages d’IA pour tâter le terrain, et puis plus il en fait, plus il se sent, et le film s’améliore de plus en plus. » "
Bien sûr, dans de nombreux cas, les changements de perception doivent être motivés par des résultats matures. Huang Guoxian a utilisé l’analogie de l’industrie des effets spéciaux il y a 20 ans, alors qu’elle n’en était qu’à ses débuts : « À cette époque, les gens ne savaient pas à quel point les effets spéciaux étaient réalistes, et ils ne savaient pas à quel point ils étaient acceptés par le public, et ce n’est que lorsque Hollywood a lancé des superproductions d’effets spéciaux l’une après l’autre que tout le monde a commencé à réaliser ce qu’il pouvait obtenir en l’utilisant dans les films. » "
Cependant, il y aura toujours la première personne à manger des crabes, et lorsque d’excellents longs métrages d’IA apparaîtront et que leurs équipes partageront leurs expériences réussies, les normes techniques de l’industrie pourront être lentement établies, et le concept sera inversé par le choc qu’il apporte. C’est juste qu’avant que le premier cas n’apparaisse, les pratiquants qui n’ont pas la confiance d’être les premiers à manger des crabes ne peuvent qu’attendre.
Un nouveau « mot de passe de richesse » pour les travailleurs ?
En plus d’être utilisés dans la création d’œuvres cinématographiques et télévisuelles et d’œuvres d’art, les scénarios d’application réels des courts métrages d’IA ont été assez étendus et ont été intégrés dans la pratique de diverses industries créatives.
Selon Song Donghuan, parmi les étudiants contactés par « Story Solitaire », certains d’entre eux font du design d’intérieur et utilisent des courts métrages d’IA pour concevoir pour les clients ; d’autres écrivent des romans en ligne, et au stade de l’écriture de quelques milliers de mots, ils transforment d’abord l’ensemble du concept du roman en un court-métrage d’IA pour attirer du trafic ; et certains magasins de meurtre de scripts ouverts, afin de répondre à la tendance de l’industrie du script killing à se développer dans le sens de l’immersion, utilisent l’IA pour créer des images atmosphériques et tracer des courts métrages.
Les scénarios d’application sont déjà très riches, mais leurs compétences ne sont pas maîtrisées par les praticiens de tous les secteurs, et un nouveau métier a émergé - des personnes qui aident toutes sortes de parties A à utiliser l’IA pour réaliser des courts-métrages.
Par rapport aux films en direct précédents, le coût des images générées par l’IA est très faible : « Si vous utilisez Runway Gen2, le coût direct de la puissance de calcul est de 18 yuans/minute, mais c’est comme un outil de base comme un stylo et du papier, et la différence de coût à l’avenir se reflétera davantage dans la différence des personnes. » », a déclaré Song Donghuan.
Et les récompenses qu’il peut apporter sont substantielles.
Dans les recherches de Song Donghuan, les citations des réalisateurs qui réalisent des courts métrages sur l’IA varient considérablement, « allant de deux ou trois mille yuans par minute à 50 000 yuans par minute, et une publicité de 15 secondes peut être rapportée à deux ou trois mille par seconde ; "
Le problème est évident. Comparée aux emplois dans l’industrie du cinéma et de la télévision qui existent depuis de nombreuses années, la norme de prix est déroutante. Combien faut-il coter pour l’utilisation de courts métrages générés par l’IA, les attentes psychologiques de chaque partie A et partie B sont différentes, et il n’y a pas de canal suffisamment transparent pour comparer les prix.
« Il n’y a pas de relation claire entre l’offre et la demande dans ce domaine, et elles sont toutes à l’étude. Parfois, l’offre et la demande ne se trouvent pas, mais le plus souvent, les attentes sont trop élevées et le budget trop faible. », a déclaré Song Donghuan.
Derrière les citations inégales se cachent les différents critères permettant de juger de la valeur des images générées par l’IA par des personnes de divers secteurs.
Xue Shanwu, qui a déjà été engagé dans la réalisation de storyboards et le directeur des effets spéciaux de films, a déclaré à Poison Eye que lorsque certains amis ont utilisé l’IA pour la première fois pour recevoir des commandes commerciales, ils ont fait le même devis que le processus de production traditionnel à l’insu de l’autre partie, « Certains partis A demanderont également spécifiquement à l’IA de le faire, de sorte que le devis sera relativement bas. » "
Dans l’esprit d’une partie A contactée par Xue Shanwu, le devis est toujours lié au temps payé par le créateur, estimant qu’il a un temps de sortie plus rapide, donc le prix devrait être plus bas. Cependant, selon Xue Shanwu, l’esthétique, la créativité et l’expérience du créateur sont les valeurs fondamentales du film fini, et ces valeurs devraient être utilisées comme norme de paiement.
À l’heure actuelle, Xue Shanwu acceptera certaines commandes commerciales pour des courts métrages et des publicités en combinant l’IA et les effets spéciaux traditionnels. Mais les commandes commerciales ne sont pas son objectif, il espère utiliser des outils d’IA pour créer plus de films et de séries télévisées de science-fiction, et à l’avenir, il prendra également les réalisateurs d’IA comme corps principal de sa planification de carrière.
« Je pense que la tendance de l’IA est qu’elle peut améliorer l’efficacité de nombreuses parties du processus de production et vous donner plus de temps pour réfléchir à la création. Par conséquent, le modèle de production original de type usine sera de moins en moins utilisé, et il y aura de plus en plus de petites équipes de trois ou quatre personnes. "
En tant que directeur de publicité, l’utilisation par BING d’outils d’IA est davantage une aide à son travail existant, et il ne fera pas de la création de courts métrages IA son activité principale à l’avenir. « J’ai déjà essayé d’utiliser l’IA pour générer l’ensemble du processus, mais j’ai constaté que les images des produits du client sont toujours déformées après leur importation, j’ai donc finalement utilisé une étape PS, qui ne peut pas être considérée comme l’IA de l’ensemble du processus, et il est impossible d’utiliser uniquement le doublage AI pour la partie doublage, y compris la partie doublage. "
De l’avis de BING, à l’instar du grand nombre de vidéos produites par les MCN dans la plate-forme de vidéos courtes, les images générées par l’IA peuvent les aider à libérer de la productivité, mais s’il s’agit d’une publicité qui nécessite des services personnalisés, l’IA ne peut être assistée que sous la forme d’outils, ou elle doit être ajustée manuellement.
Différentes personnes ont différents niveaux d’engagement avec cette « profession émergente », mais la priorité est de former une plate-forme de création ouverte. Que ce soit pour le parti A ou le parti B, la comparaison ouverte des prix et l’élimination du manque d’information de l’industrie sont propices au développement sain de l’industrie et à une concurrence loyale.
"Mot de passe de patrimoine » a également un seuil
L’émergence de l’IA a considérablement abaissé le seuil technique de production d’images, de sorte que les gens ordinaires peuvent également avoir la possibilité de s’enrichir grâce à la production d’images par IA. Cependant, il existe toujours une différence qualitative dans la qualité des images générées entre les personnes.
Plusieurs praticiens ont déclaré à Poison Eye que les personnes qui ont travaillé dans l’industrie du cinéma et de la télévision dans le passé ou qui ont une formation en apprentissage peuvent généralement générer des images d’IA de meilleure qualité.
Mais ce n’est pas absolu, car ce que les outils d’IA testent, c’est essentiellement l’imagination du créateur, et la capacité à décrire sa propre imagination. Par exemple, Song Donghuan a déclaré : « En prenant l’exemple du test de personnalité MBTI populaire actuel, nous avons constaté que N personnes, ou des personnes ayant plus de conviction et d’imagination, auront une plus grande capacité à faire des images générées par l’IA. "
Pour les créateurs nationaux, un seuil plus subtil est que l’utilisation raffinée de l’IA exige que les créateurs aient un certain niveau d’anglais. La raison en est que le logiciel actuel de génération d’images d’IA, plus avancé, est développé à l’étranger, et qu’il a relativement peu d’apprentissage de la base de données chinoise, de sorte que la logique de son contenu généré n’est pas conforme aux habitudes d’utilisation des utilisateurs locaux nationaux, « y compris le contenu d’image qu’il génère, vous voulez des éléments très chinois, et maintenant il n’est pas assez précis, plus adapté à la fantaisie ou au contenu avec une vision internationale ». », A DÉCLARÉ BING
Mais selon Huang, l’écart linguistique se comblera lentement dans quelques mois, voire un an. « Parce que la transformation de la langue est très mécanique, il existe aujourd’hui des outils précis et pratiques pour la traduction. La clé est de décrire une image à partir de rien et de la faire comprendre avec précision par le système d’IA, et enfin de produire l’image ou la vidéo idéale. Cela exige que les « ingénieurs » qui exploitent l’IA aient un haut niveau d’imagination, des compétences associatives et la capacité d’utiliser les mots comme outil de description. "
Une préoccupation plus courante est qu’il n’y a pas de problèmes de droits d’auteur avec le contenu généré par l’IA qui est directement commercialisé.
En attendant que des lois et des règlements spécifiques soient perfectionnés, le problème plus pratique est que même s’il existe des dispositions légales, il est en fait très difficile de découvrir et de déterminer si une œuvre est générée par l’IA. Surtout avec les progrès rapides de la technologie de l’IA, cette difficulté ne fait qu’augmenter.
La société mère de Chatgpt, Open AI, a lancé un classificateur de texte IA plus tôt cette année pour aider à identifier si le texte a été écrit par un humain ou par une IA. Mais il a été retiré des étagères quelques mois après son lancement parce qu’il ne pouvait même pas dire le contenu qu’il avait généré.
Si cette tendance est suivie, l’abus de contenu d’IA auquel il pourrait être confronté à l’avenir ne peut être réglementé que par des rapports avec des preuves substantielles sous le principe de l’amélioration des lois et des règlements, c’est-à-dire que « le peuple ne poursuit pas et les fonctionnaires ne poursuivent pas ». C’est ainsi que les syndicats d’Hollywood peuvent maintenant parvenir à un accord qui peut être maintenu.
Il est presque inévitable que des images d’IA qui ne peuvent pas être distinguées pénètrent dans les médias quotidiens à grande échelle. Selon Song Donghuan, d’ici deux ans, 50 % du contenu circulant sur le marché bénéficiera d’une participation approfondie de l’IA, « La quantité totale de contenu généré par l’IA augmentera également considérablement par rapport à aujourd’hui ». Je pense que dans un avenir prévisible, il n’y aura pratiquement aucune création de contenu qui n’utilisera pas du tout AIGC. "
À ce moment-là, les « acteurs professionnels » de l’industrie du cinéma et de la télévision devront peut-être être écartés s’ils veulent se présenter à nouveau.