Sommaire
- Meilleurs Prompts = Meilleurs Résultats
- Description ou prompt ?
- Ecrire en français ou en anglais ?
- Où et comment utiliser ces prompts ?
- La structure d’un bon Prompt
- 1. Sujet
- 2. Média
- 3. Style
- 4. Artiste
- 5. Sites web
- 6. Résolution et qualité
- 7. Détails supplémentaires
- 8. Couleurs
- Résultat final
- Listes de mots clefs
- Media
- Artistes et styles
- Sites webs
- Resolution et qualité
- Autres détails
- Conclusions
Meilleurs Prompts = Meilleurs Résultats
Stable Diffusion est un logiciel IA texte-image. Il est formé sur des millions de paires d'images et de descriptions de texte trouvées sur Internet. Parce qu'il a vu tellement, le modèle comprend ce que la description de texte associe à quelles images.
Si vous mettez une description, appellée prompt, comme « Une photo d'un lapin assis sur une bûche », il vous retourne des images comme celles-ci :
Pour générer une image avec cette technique, vous devez donc en donner une description. C’est en effet cette description, couplée à quelques autres paramètres, qui va permettre de génerer une image.
Nous allons voir comme écrire cette description au mieux pour obtenir des résultats impressionants.
Description ou prompt ?
En anglais, on appelle prompt, une commande entrée manuellement par l'utilisateur et exécutée par un programme. En pratique, la description de l'image que nous fournissons est en effet une commande transmise au programme de Stable Diffusion.
Parce qu'il est court et fréquemment utilisé partout où l'on parle d'intelligence artificielle, notamment pour la génération d'image, c'est ce terme que nous utiliserons pour désigner la description utilisée pour générer des images avec Stable Diffusion.
Ecrire en français ou en anglais ?
En principe, Stable Diffusion comprend le français et vous pouvez donc écrire vos prompts dans la langue de Molière. (les exemples de lapins ci-dessus ont été généré avec un prompt en français)
Cependant, le modèle a été entrainé essentiellement avec des descriptions d’images en anglais. Nous vous conseillons donc de privilégier cette langue pour avoir un maximum de précision et obtenir de meilleures résultats. Au besoin, vous pouvez utiliser des outils comme Deepl ou chatGPT pour traduire vos descriptions du français à l’anglais.
Où et comment utiliser ces prompts ?
Vous pouvez utiliser un générateur Stable Diffusion en ligne pour générer vos premières images avec l'Intelligence Artificielle.
Si vous n’avez jamais utilisé Stable Diffusion, consultez également notre guide du débutant pour en apprendre les principes de base et découvrir son utilisation.
Bien que les conseils repris sur cette page restent valides et fonctionnent aussi avec la v2 de Stable Diffusion, les exemples et les prompts ont été testés avec la v1. Certains mots clef, par exemple les noms d’artistes, sont réputés beaucoup moins efficaces avec la v2.
La structure d’un bon Prompt
Il y a des techniques éprouvées pour générer des images de haute qualité et spécifiques. Votre prompt devrait donc couvrir la plupart, sinon la totalité, de ces points :
- Sujet (obligatoire)
- Média
- Style
- Artiste
- Site Web
- Résolution et qualité
- Détails supplémentaires
- Couleur
1. Sujet
Tout d'abord, vous aurez besoin d'une description du sujet avec autant de détails que possible. Par exemple.
Un garçon geek programme devant un ordinateur (A geeky boy programming in front of a computer)
Cela donnera une image comme celle-ci, qui correspond déjà assez bien à cette description.
2. Média
Mais nous pouvons être plus spécifiques. Ajoutons un média. Quelques exemples sont : la peinture numérique, la photographie, la peinture à l'huile. Utilisons-les.
Peinture numérique (Digital painting)
Notre prompt devient donc
Peinture numérique d’un garçon geek qui programme devant un ordinateur Digital painting of a a geeky boy programming in front of a computer
Et on obtient une nouvelle image
Vous pouvez voir comment cette description change le résultat d'une photographie à une peinture numérique. Vous avez compris l'idée. Ajoutons d’autres élèments.
3. Style
De la même manière que le média, un mot clef de style peut grandement influencer l’image générée. On parle de style pour désigner la tendance et l’ambiance de l’image : Cartoon, Futiriste, Fantasy, Horreur, Peinture classique, Rétro, Pixel Art,…
Pour notre image, nous allons partir sur un style “Anime”
Japanese anime
4. Artiste
Une bonne manière d’influencer le résultat final est d’indiquer un ou deux artistes dont vous appréciez le travail et dont le style correspond à ce que vous souhaitez.
Par exemple, pour une image dans un style d’anime japonais, vous pourriez ajouter “par makoto shinkai et le studio ghibli” :
by makoto shinkai and ghibli studio
5. Sites web
Certain site web de partage d’image sont connus pour la qualité des images proposés - ou bien ils sont spécialisé dans certains style d’image : Artstation, Deviant Art, Pinterest, cgsociety
Pour un peinture numérique, on peut donc ajouter
artstation
6. Résolution et qualité
Des indications précise sur la qualité de l’image permettent d’améliorer le résultat. Les images 4k ou 8k sont en effets réputée. Si vous vous y connaissez un peu en photographie, vous pouvez aussi ajouter des détails sur le type d’objectif utilisé.
Contentons nous d’ajouter un mùot cléf pour une image de haute qualité :
8k
7. Détails supplémentaires
Ajoutons encore des indications pour cibler une image détaillée et de bonne qualitée.
highly detailed, incredible quality
Ici, nous pourrions aussi ajouter des informations sur l’éclairage (dramatic lighting, cinematic lighting,…)
8. Couleurs
Enfin, vous pouvez également ajouter des mots clefs pour influencer sur la palette de couleur ou leur tonalité. Par exemple, pour des couleurs vivantes et dynamique, nous allons ajouter
vivid colors
Résultat final
En mettant tout cela ensemble, nous obtenons un prompt comme celui-ci :
Peinture numérique d’un garçon geek qui programme devant un ordinateur, anime japonais, par makoto shinkai et le studio ghibli, artstation, 8k, hautement détaillé, qualité incroyable, couleurs vives Digital painting of a a geeky boy programming in front of a computer, japanese anime, by makoto shinkai and ghibli studio, artstation, 8k, highly detailed, incredible quality, vivid colors
Ce qui génère une image comme celle-ci
Reprenons maintenant le même sujet mais avec des mots clefs diffèrents :
Rendu 3d d’un garçon geek qui programme devant un ordinateur, american comics, par Todd McFarlane et le studio Marvel, deviantart, 4k, hautement détaillé, éclairage cinématique, ambiance sombre. 3d render of a a geeky boy programming in front of a computer, american comics, by Todd McFarlane and marvel studio, deviantart, 4k, highly detailed, cinematic McFarlane, dark atmosphere
Vous voyez comment, en ajoutant des mots-clés spécifiques pour différents éléments, on peut fortement influencer le rendu de l’image finale.
Listes de mots clefs
Voici quelques mots clefs, classés par types, pour vous inspirer. N’hésitez cependant pas à ajouter et essayer les votre.
Media
mots clefs | Notes |
Portrait | Favorise les gros plan sur le visage (headshot portrait) et les portrait en général. |
Digital painting | Image et peinture numérique |
Concept art | Illustration style et planche concept de cinéma |
Ultrarealistic illustration | Dessins très réaliste. Plutôt éfficace pour des images de personnes. |
Realistic Photography | Rendu photoréaliste. |
Drawing | Dessin et croquis. |
Oil Painting | Peinture à l’huile et toiles de maitre |
Artistes et styles
mots clefs | Notes |
John Collier | Potraityiste du 19èm siècle. Ajoutes une sorte d’élégance. |
Stanley Artgerm Lau | Dessins moderne et réaliste. |
Frida Kahlo | Quite strong effect following Kahlo’s portrait style. Sometimes result in picture frame |
John Singer Sargent | Assez éfficace pour les portraits de femme. Ajoutes de l’élégance et un style 19èm siècle aux vêtements. |
Alphonse Mucha | Peinture de portrait 2D avec beaucoup de détails et d’ornements. |
Greg rutkowski | Artiste de fantasy pour des images fortes et réalistes. |
Ghibli | Anime japonais aux lignes claires et épurées. Ambiance poétique. |
Disney Pixar | Idéal pour un rendu 3D et des personnages un peu cartoon. |
Sites webs
mots clefs | Notes |
pixiv | Anime japonais |
pixabay | Photos de stock commercial (ambiance pro / corporate) |
artstation | Illustration de fantasy moderne |
Deviant Art | Art et peintures digitales |
Resolution et qualité
mots clefs | Notes |
unreal engine | Rendu 3D très réaliste |
sharp focus | Améliore la résolution et la précision |
8k | Améliore la résolution et donne un rendu très photographique, mais peut donner un aspect très faux / artificiel. |
vray | Rendu 3D |
8bit | Rendu pixelisé, dans le style des anciennes consoles de jeux |
Autres détails
mots clefs | Note |
dramatic | Augmente l'expressivité émotionnelle du visage. Augmentation globale considérable du potentiel / variabilité photo. +1 pour la variabilité, important pour obtenir le maximum de succès. |
silk | Ajouter de la soie aux vêtements. Favoris eun rendu plus doux. |
dramatic lighting | Eclairage dramatique pour ajouter de l’intensité à une scène. |
psychedelic | Couleurs vives et distrotion. |
vivid colors | couleurs vives et dynamique |
Conclusions
Nous avons vu ensemble une manière de structurer vos prompts pour obtenir de meilleurs résultats.
Cette structure reste cependant un guide et non une règle à suivre obligatoirement et encore moins une science exacte. Stable Diffusion est très flexible. Faites des tests, amusez-vous et laissez-vous surprendre par des combinaisons créatives de mots-clés !
Ecrit par