Le comparatif le plus complet : quelle est la meilleure IA générative ? Une large collection d'avantages et d'inconvénients des trois meilleurs outils de génération d'images, vous comprendrez après l'avoir lu

Question

Texte : Tri Editeur : VickyXiao![](https://img.gateio.im/social/moments-bab2147faf-c6a4dbe7ea-dd1a6f-62a40f) *Source de l'image : générée par l'outil d'IA illimitée*Le mot-clé le plus en vogue en 2023 est probablement l'IA.De ChatGPT, qui est né de nulle part, à Midjourney, qui est populaire partout sur Internet, puis à la mêlée mondiale à grande échelle de l'IA, en moins d'un an, l'AIGC n'a cessé d'exploser, remuant le monde.Peu importe chez nous ou à l'étranger, tout le monde semble avoir trouvé le billet pour le "nouveau monde", que ce soit dans la recherche et le développement de l'IA, ou dans le business + AI. On peut dire que l'IA est devenue la certitude la plus certaine à l'heure actuelle, guidant le public vers la prochaine ère AIGC et réalisant un nouveau saut de productivité. Il existe de nombreux outils liés à l'IA dans le pays et à l'étranger, mais ils sont tous étendus à partir des trois algorithmes principaux de Midjourney (MJ), Stable Diffusion (SD) et DALL-E. DALL-E a été mis à niveau vers DALL-E2.Aujourd'hui, nous allons explorer ensemble, quels sont les avantages, les inconvénients et les différences de ces trois algorithmes traditionnels ?## **Présentation générale des trois "top streams"**Midjourney est un logiciel actuellement installé sur la plateforme Discord. Il a été développé par un studio aux États-Unis et a fait ses débuts en mars 2022. En seulement un an, MJ a mis à jour et itéré vers la version V5, et est rapidement devenu populaire grâce à son talent artistique. . Les cartes générées de ces explosions sur les réseaux sociaux sont toutes générées par MJ. Avec sa qualité de rendu incroyable et son modèle de commercialisation parfait, il a réussi à attirer un grand nombre d'utilisateurs payants et a réalisé un chiffre d'affaires annuel de 100 millions de dollars américains.![](https://img.gateio.im/social/moments-bab2147faf-7bceae4c5a-dd1a6f-62a40f)  ![](https://img.gateio.im/social/moments-bab2147faf-2f8839a4bb-dd1a6f-62a40f)  ![](https://img.gateio.im/social/moments-bab2147faf-337bea44b6-dd1a6f-62a40f) Stable Diffusion est développé par la start-up britannique Stability AI en coopération avec plusieurs chercheurs universitaires et des organisations à but non lucratif. Son utilisation est gratuite. Le code source et le modèle actuels de SD sont open source et peuvent être utilisés localement sur Mac, PC ou même des appareils mobiles.Déploiement (nécessite une configuration d'équipement relativement élevée), vous pouvez modéliser vous-même, de nombreux outils logiciels à la maison et à l'étranger, la plupart d'entre eux sont développés avec SD comme logique sous-jacente, et ses capacités de contrôlabilité et de rendu sont également très fortes, et maintenant de nombreux designers l'utilisent pour effectuer des travaux secondaires.DALL-E 2 a été développé et lancé par l'équipe OpenAI. Contrairement à Midjourney, les images générées avec des instructions simples ont généralement tendance à être réalistes. DALL-E 2 est le meilleur des trois en termes d'images réalistes et d'invites concises.![](https://img.gateio.im/social/moments-bab2147faf-fcbcf5df3f-dd1a6f-62a40f)## **Capacité expressive**Examinons ensemble leur capacité d'expression. Sous la description de **même mot-clé**, quel est leur retour d'image ?![](https://img.gateio.im/social/moments-bab2147faf-9d9bc787a5-dd1a6f-62a40f) DALL·E 2 (à gauche), Midjourney (au milieu) et Stable Diffusion (à droite)![](https://img.gateio.im/social/moments-bab2147faf-0a8ad7581d-dd1a6f-62a40f) DALL·E 2 (à gauche), Midjourney (au milieu) et Stable Diffusion (à droite)![](https://img.gateio.im/social/moments-bab2147faf-944659dde5-dd1a6f-62a40f) DALL·E 2 (à gauche), Midjourney (au milieu) et Stable Diffusion (à droite)D'après la comparaison de la figure ci-dessus, nous pouvons voir que DALL-E 2 peut très bien gérer les images de la nature et des personnes. À l'heure actuelle, en utilisant l'API de DALL-E 2, trois méthodes d'interaction avec les images peuvent être réalisées : Selon à l'invite de texte Créez des images à partir de zéro, créez des modifications d'images existantes en fonction de nouvelles invites de texte, créez des variantes d'images existantes.Midjourney a des couleurs riches et des graphismes réalistes dans toutes les tentatives. Il est capable de générer des images en fonction des invites de l'utilisateur. Midjourney est bon pour adapter le style artistique réel pour créer des images avec n'importe quelle combinaison d'effets que l'utilisateur souhaite. Il excelle dans les effets environnementaux, en particulier les scènes fantastiques et de science-fiction qui ressemblent à de l'art du jeu.Et Stable Diffusion est un modèle open source que tout le monde peut utiliser. Il a une relativement bonne compréhension des images d'art contemporain et peut produire des œuvres d'art pleines de détails. C'est juste qu'il est difficile à utiliser pour les utilisateurs ordinaires. À l'heure actuelle, la discussion la plus populaire parmi tout le monde est de savoir qui est le meilleur, SD ou MJ, nous avons donc testé quelques images.![](https://img.gateio.im/social/moments-bab2147faf-8b655a73e5-dd1a6f-62a40f) Mi-parcours (à gauche) et Diffusion stable (à droite)![](https://img.gateio.im/social/moments-bab2147faf-0f5e359b9d-dd1a6f-62a40f) Mi-parcours (à gauche) et Diffusion stable (à droite)D'après les détails de la génération d'images de personnages de dessins animés, SD est meilleur.Avec la même génération de mots-clés, les traits du visage générés par SD sont plus tridimensionnels et exquis, et Midjourney est plus artistique.![](https://img.gateio.im/social/moments-bab2147faf-2040b1f890-dd1a6f-62a40f) Mi-parcours (à gauche) et Diffusion stable (à droite)Lors de la génération d'images réalistes de style illustration, les deux sont tout aussi efficaces.Le plus grand avantage de la SD est que les utilisateurs peuvent remixer via l'intégration de modèles, LoRA ou le réseau, ce qui peut produire des effets inattendus.![](https://img.gateio.im/social/moments-bab2147faf-26c0f07941-dd1a6f-62a40f) Mi-parcours (à gauche) et Diffusion stable (à droite)Stable Diffusion compte actuellement plus d'un millier de modèles disponibles en téléchargement. Chaque modèle peut être modifié davantage à l'aide de modèles LoRA, de modèles d'intégration et d'hyperréseaux ; Midjourney est limité en termes de modèles. Seuls les modèles v1 à v5 sont disponibles, ainsi que certains modèles spéciaux tels que niji, test, testp et HD. Il existe un paramètre supplémentaire pour "styliser" l'image. Mais dans l'ensemble, il fait encore pâle figure par rapport à Stable Diffusion.## **guide de l'utilisateur**En fait, ces générateurs d'images AI ont leurs propres avantages. Sur la base de l'expérience de ces trois algorithmes, nous avons résumé quelques points saillants et différences. Le choix spécifique peut être déterminé en fonction de vos propres besoins.![](https://img.gateio.im/social/moments-bab2147faf-88e6615b1a-dd1a6f-62a40f) **1、DALL-E2**L'interface de ce modèle est simple et facile à comprendre, et vous pouvez facilement générer des images sans enregistrer une plate-forme tierce. Il vous suffit de visiter le site Web et de saisir le texte de votre mot clé dans la zone de génération pour créer des images.![](https://img.gateio.im/social/moments-bab2147faf-00c5248d94-dd1a6f-62a40f) avantage:l Facile à utiliserl Créativité avec flexibilitél Aucune plate-forme tierce requisedéfaut:l image simplel La précision n'est pas élevéel Ne peut créer que des images carrées**2、À mi-parcours**Contrairement au DALL-E 2, vous devez d'abord créer un compte Discord, et vous devez entrer des commandes comme du texte ou des images pour générer des images.![](https://img.gateio.im/social/moments-bab2147faf-76abd5e268-dd1a6f-62a40f) avantage:l Image de haute qualitél Les utilisateurs peuvent personnaliser le rapport de taille d'imagel Contrôle flexible des paramètres d'imagedéfaut:l Il est plus compliqué à utiliserl Exiger que les utilisateurs s'inscrivent sur Discordl Une fois le temps écoulé, le temps de génération d'image augmentera considérablement**3、Diffusion stable**Stable Diffusion et DALL·E-2 sont tous deux basés sur le modèle de diffusion, qui peut dessiner des images en fonction des descripteurs de texte d'entrée (). Pour compléter la production d'excellentes images sur Stable Diffusion, il faut le modèle correct + des mots rapides précis + un réglage des paramètres + une technologie de post-traitement.![](https://img.gateio.im/social/moments-bab2147faf-77e2706d3b-dd1a6f-62a40f) avantage:l Fonctionnement Web et installation de modèles open source sur d'autres plates-formesl Plus de liberté créativel Un grand nombre de contrôles pour personnaliser les paramètres d'imagedéfaut:l Nécessite un équipement matériel professionnel et puissantl La qualité de l'image est très instable, cela dépend de la version que vous utilisezl Difficulté d'apprentissage élevée, difficile à contrôler pour les utilisateurs ordinairesPour résumer, si vous avez une sortie cible claire, par exemple, vous êtes un designer architectural, alors Stable Diffusion répondra mieux à vos besoins créatifs car il est plus contrôlable. Et si vous n'avez pas d'objectif de contrôle créatif clair et que vous souhaitez faire un travail créatif avec une pensée divergente, alors la commodité et le seuil bas de Midjourney et DALL-E 2 seront votre meilleur choix.Quel outil d'IA préférez-vous utiliser ? Comment est-il appliqué dans la vie professionnelle ? Bienvenue à partager avec nous dans les commentaires !