Dans un contexte où l'intelligence artificielle générative connaît une croissance exponentielle, le domaine du text-to-image ne cesse de surprendre. Après les l’accueil enthousiaste d’AuraFlow, c'est au tour de Flux de faire son entrée fracassante sur la scène des alternatives au Stable Diffusion de Stability AI.
Black Forest Labs, une nouvelle start-up spécialisée dans l'IA générative pour les médias, vient de lancer Flux, sa suite de modèles text-to-image qui se distingue par son approche open source couplées à des performances impressionnantes, qui en font un concurrent sérieux non seulement pour Stable Diffusion 3 mais aussi pour d’autres leaders du secteur comme DALL-E et Midjourney.
FLUX.1
Entraînés sur un vaste ensemble de données d'images et de légendes, les modèles FLUX.1 possèdent des capacités impressionnantes de génération d'images à partir de descriptions en langage naturel. La compréhension approfondie du langage par le modèle lui permet d'interpréter des messages complexes et de produire des images très détaillées et cohérentes.
FLUX.1 introduit une "architecture hybride" novatrice. Cette approche fusionne ingénieusement les techniques de transformation et de diffusion. Black Forest Labs affirme que cette innovation surpasse les modèles de diffusion antérieurs grâce à l'intégration de la correspondance des flux et d'autres optimisations techniques sophistiquées.
Un des atouts majeurs de FLUX.1 réside dans sa capacité à générer des représentations réalistes de mains humaines. Cette prouesse est particulièrement notable, car la synthèse précise des mains a longtemps constitué un défi pour les modèles de génération d'images antérieurs. Cette limitation était principalement due à une pénurie d'images d'entraînement focalisées sur les mains. Bien que d'autres générateurs d'images IA comme Midjourney aient depuis lors comblé cette lacune, il est remarquable de voir un modèle ouvert comme FLUX.1 capable de reproduire des mains avec une telle précision dans diverses poses.
Caractéristiques techniques
- Qualité d'image améliorée : Créez des images époustouflantes à des résolutions plus élevées.
- Anatomie humaine avancée et photoréalisme : Obtenez des images très réalistes et anatomiquement exactes.
- Adhésion plus rapide : Obtenez des images plus précises et plus pertinentes en fonction de vos données.
- Vitesse exceptionnelle : bénéficiez de la vitesse et de l'efficacité de Flux Schnell, idéal pour les applications à forte demande.
- Disponible en trois variantes :
- FLUX.1 [dev] : Le modèle de base, partagé avec une licence non commerciale pour que la communauté puisse construire dessus.
- FLUX.1 [schnell] : Une version distillée du modèle de base qui fonctionne jusqu'à 10 fois plus vite sous licence OpenSource.
- FLUX.1 [pro] : Une version privée disponible uniquement via l'API.
Comment essayer FLUX.1 ?
Flux en ligne
Si vous voulez essayer quelques générations avec FLUX.1, vous pouvez tester les différentes version sur les plateforme de Fal.AI et Replicate :
Les deux derniers modèles sont également partagé sur HuggingFace où il peuvent être télécharger.
L’équipe de Black Forest Labs a partagé un code d’exemple sur Github qui permet déjà aux développeurs et utiisateurs avancés de faire fonctionner les modèles sur leur propre machine.
Flux dans ComfyUi
La dernière mise à jour de ComfyUi devrait intègre déjà Flux et permettre de générer des images avec les modeles [dev] et [schell].
Des workflows ont été partagés et sont disponible sur la page d’exemple de Flux du github ComfyUI.
Stratégie commerciale et Licences
Black Forest Labs adopte une approche stratégique novatrice avec sa suite FLUX, offrant des options adaptées à divers besoins et contextes d'utilisation :
- FLUX.1 [pro] : Fer de lance de la gamme, ce modèle haut de gamme promet des performances inégalées. Accessible uniquement via l'API de Black Forest Labs, il cible les professionnels exigeant une qualité visuelle exceptionnelle. Bien que les détails tarifaires restent à confirmer, on peut s'attendre à un modèle commercial premium.
- FLUX.1 [dev] : Version intermédiaire, FLUX.1 [dev] offre un équilibre entre performances et accessibilité. Conçu pour les développeurs et chercheurs, il permet le fine-tuning et une utilisation plus flexible, tout en restant encadré par des conditions d'utilisation non commerciale. Pour une exploitation commerciale, des négociations spécifiques avec Black Forest Labs seront nécessaires.
- FLUX.1 [schnell] : Véritable porte d'entrée dans l'univers FLUX, cette version optimisée pour la rapidité sacrifie une partie de la qualité au profit de l'accessibilité. Distribué sous licence open source (Apache 2.0), FLUX.1 [schnell] ouvre un vaste champ de possibilités pour l'expérimentation et l'innovation à grande échelle.
Cette stratégie à trois niveaux illustre la volonté de Black Forest Labs de démocratiser l'accès à l'IA générative tout en préservant un modèle économique viable. Elle offre ainsi un éventail de solutions répondant aux besoins variés des professionnels, des chercheurs et des enthousiastes de l'IA.
Perspectives d'avenir
Le lancement de FLUX par Black Forest Labs marque un tournant dans l'industrie du text-to-image. Soutenue par un financement de 31 millions de dollars en série Seed, mené par Andreessen Horowitz, l'entreprise est bien positionnée pour influencer l'avenir de l'IA générative.
L'équipe de Black Forest Labs, composée de chercheurs et d'ingénieurs renommés ayant contribué à des innovations majeures comme VQGAN et Stable Diffusion, prévoit déjà le développement de systèmes text-to-video. Cette approche pourrait accélérer l'innovation dans des domaines variés tels que le cinéma, la publicité ou l'éducation.
En démocratisant l'accès à ces technologies de pointe tout en mettant l'accent sur la transparence et la sécurité, Black Forest Labs ambitionne de façonner un écosystème d'IA générative plus ouvert, collaboratif et innovant. L'avenir dira si FLUX parviendra à s'imposer face aux géants du secteur, mais une chose est sûre : la compétition dans le domaine des IA text-to-image ne fait que commencer.
Pour en savoir plus
- L’annonce sur Fal.AI, partenaire de FLUX.
- L’annonce sur Replicate, également partenaire.
- Exemples de génération sur la Galerie d’images Flux
Ecrit par