Black Forest Labs, créateur de l’IA de génération d’images Flux, propose trois versions distinctes de son modèle de génération d'images par IA : Schnell, Dev et Pro.
Chacune de ces versions est conçue pour répondre à des besoins spécifiques en termes de vitesse, de qualité et de flexibilité dans la création d'images :
- FLUX.1 [pro] est le modèle phare de la gamme. Il offre des performances de pointe, une qualité d'image exceptionnelle, des détails complexes et une délicieuse diversité.
Il est avant tout destiné aux professionnels et aux entreprises et se distingue par la qualité et la variétés des images.
- FLUX.1 [dev] est une variante distillée par guidage partagée librement pour une utilisation non commerciale.
Ses créateurs la présente comme de qualité a peu près égale à celle de [pro] tout en étant plus efficiente et donc parfaite pour la recherche et le développement.
- FLUX.1 [schnell] est optimisé pour la vitesse et se veut idéal pour le développement local et les projets personnels. Il est partagée sous la licence Open Source Apache 2.0.
Voilà en tous cas comment Black Forest Labs présente ses 3 modèles Flux et leurs spécificités. Mais concrètement, quelles différences y a t’il au niveau des images ? C’est ce que nous allons essayer de voir dans la suite de cet article en testant les modèles avec plusieurs prompts de référence.
Comment on été générées les images ?
Toutes les images ont été générée à l’aide des modèles de Black Forest Labs sur Replicate avec leurs paramètres par défaut. A chaque fois, le même prompt a été utilisé pour générer 3 images qui sont présentées ici sans retouche ni modification.
Comparaisons des modèles
Respect du prompt
C’est l’une des forces de Flux : comprendre et respecter les prompts complexes avec plusieurs éléments précis. Sur ce point, les 3 versions se révèlent excellentes. Globalement l’IA de Black Forest Labs comprend bien le prompt avec plusieurs élèments et les met en scène vos prompts avec une précision étonnante. [schnell] montre cependant une petite faiblesse sur certains prompt comme celui avec les formes et les animaux.
A captivating vintage-inspired movie poster featuring a black cat wearing a white suit and a red tie pointing a gun at the viewer. To his left, a smaller white cat wears a black tuxedo and is counting money from a bundle of bills. The background is a dark alley in a big city.
Photo of a red sphere on top of a blue cube. Behind them is a green triangle, a dog on the right, a cat on the left.
Rendu du texte
C’est un autre point fort de Flux pour lequel les 3 versions excellent. Si [schnell] a parfois (mais pas toujours) du mal et mélange les lettres, les deux autres versions peuvent facilement intégrer des phrases complètes dans les images de manière claire et correcte.
A woman with sandy hair clad in cyberpunk style clothes is marching in the street holding a sign that says "I'M ONLY HERE BECAUSE I LIKE HOLDING UP SIGNS”
A rounded fridge magnet that says "Flux is the best model to generate text", 80's design with flowers and rainbow
Photoréalisme
Générer des images réalistes qui peuvent passer pour de véritables photos est une utilisation courante de l’IA. Même sans les améliorations proposées par les LoRAs, Flux est plutôt bon dans ce domaine… Sauf peut être [schnell] dont le rendu reste quand même très artificiel, particulièrement dans les textures.
Portrait photo of a 25 years old american man in crowded pub
Anatomie
En complément du photoréalisme lui-même, la question du respects de l’anatomie et des proportions est un autre élément clef pour un rendu réaliste. Heureusement l’époque des mains à 6 ou 7 doigts semblent révolue. Flux surpasse les alternative Open Source précédente comme SDXL pour créer des corps réalistes et proportionné aussi bien que les modèles privées.
Portrait of a smiling person with hands resting on knees, clearly showing details of hands and face.
High quality photo of a bearded man wearing a tuxedo and showing his hands to the camera
Styles artistiques
Si le photoréalisme reste le point fort de Flux, il connait également d’autres styles artistiques. A sa sortie, beaucoup d’utilisateurs ont regretté qu’il ne soit pas aussi bon que SDXL dans ce domaine. Mais les modèles de bases sont pourtant capables de générer des images dans différentes styles. A noter que dans certains cas, il semble que [Pro] ait tendance à plus se rapprocher d’un rendu photo que les deux autres.
Star wars Jedi Knight in pixel art, holding a purple light saber.
The Shepard robot sits quietly in a secluded spot with a little lamb on its lap, In the style of studio ghibli anime.
blue ink ballpoint pen drawing of a high speed coupe sports car, fast, drifting, speed
Un modèle, trois saveurs, des possibilités infinies
Bien que les trois versions de Flux aient chacune leurs forces, il est clair que [Pro] offre les meilleures performances quand pratiquement tous tous les domaines. [Dev] se positionne cependant comme une excellente alternative pour ceux qui n'ont pas besoin du niveau de détail et de réalisme offert par [Pro], tandis que [Schnell] reste une option intéressante pour des projets rapides ou des tests, malgré ses limitations évidentes.
[Dev] et [Schnell] bénéficient cependant d’autres avantages par rapport a modèle [Pro]. Leur distribution plus libre offre la possibilité d'être utilisé pour l'entraînement de nouveaux modèles, tels que les LoRAs. Cette flexibilité permet aux chercheurs et aux développeurs de créer des modèles dérivés adaptés à des besoins spécifiques, ouvrant ainsi la voie à de nouvelles innovations dans le domaine de la génération d'images par IA. Avec cependant un bémol pour [Dev] dont la licence non-commerciale s’applique également aux modèles dérivés.
La nature open source de [Schnell] favorise par contre la transparence, l'innovation collaborative et la possibilité d'adapter le modèle à des besoins très spécifiques sans restriction. C'est un choix idéal pour les projets qui privilégient la liberté d'utilisation et de modification plutôt que la qualité brute des images générées.
Le choix entre ces trois versions dépendra donc non seulement de vos besoins spécifiques de en termes de vitesse de génération et de qualité d'image, mais aussi de vos objectifs à long terme. Il faut considérer si vous avez besoin de la qualité supérieure de [Pro] pour des utilisations commerciales, de la flexibilité de [Dev] pour la recherche et le développement de modèles dérivés, ou de la liberté totale offerte par l'open source de [Schnell] pour des projets nécessitant une personnalisation poussée ou une intégration profonde.
Cette diversité d’option est aussi une des forces de Flux qui permet à Black Forest Labs de répondre à un large éventail de besoins et de cas d'utilisation, tout en encourageant l'innovation et la recherche.
Ecrit par