Flex.1 - Le nouveau Flux Open Source

Flex.1 Alpha

Flex.1-alpha est donc un modèle de transformation de flux rectifié pré-entraîné, conçu pour générer des images à partir de descriptions textuelles. Ses principales caractéristiques sont les suivantes :

8 milliards de paramètres : Cette ampleur permet au modèle de capturer des nuances complexes dans les descriptions textuelles, améliorant ainsi la qualité et la pertinence des images générées.

"Guidance embedder" intégré : Flex.1-alpha intègre un "guidance embedder" qui élimine le besoin de Classifier-Free Guidance (CFG) traditionnellement utilisé dans la génération d'images. Cette intégration simplifie le processus de génération tout en maintenant une haute qualité visuelle.

Longueur d'entrée de 512 tokens : Le modèle accepte des entrées textuelles allant jusqu'à 512 tokens, offrant une flexibilité pour des descriptions détaillées et complexes, ce qui enrichit le contexte pour la génération d'images précises.

Licence Apache 2.0 : Flex.1-alpha est distribué sous la licence Apache 2.0, permettant une utilisation libre et une intégration aisée dans divers projets, tout en assurant une conformité avec les standards open-source reconnus.

Ces caractéristiques positionnent Flex.1-alpha comme un outil puissant et accessible pour les développeurs et chercheurs souhaitant exploiter la génération d'images à partir de descriptions textuelles, tout en bénéficiant d'une architecture optimisée et d'une licence permissive.

Contexte et Développement

Le développement de Flex.1-alpha s'inscrit dans la continuité des efforts d'ostris pour améliorer les modèles de génération d'images à partir de descriptions textuelles.

En voulant créer une solution permettant d’entraine facilement des LoRA pour FLUX.1-schnell, ostiris a commencé par développé un premier modèle complémentaire. Cette solution a ensuite été utilisée pour entrainer OpenFlux.1 - Un premier modèle prometteur qui a connu plusieurs versions.

Pour aller plus loin, Il a ensuite entrepris d'optimiser l'architecture existante en réduisant le nombre de blocs de transformateurs doubles de 19 à 8, tout en augmentant le nombre total de paramètres à 8 milliards. Cette démarche visait à améliorer l'efficacité et la qualité des images générées.

Flex.1-alpha est résultat de ses effort d’optimisation - un nouveau modèle Open Source aux résultats plus que prometeurs.

Comment tester Flex.1 ?

Flex.1 alpha peut être utilisé de manière presque identique à FLUX.1-dev et fonctionne directement avec la plupart des moteurs d'inférence qui prennent en charge ce dernier, comme Diffusers ou ComfyUI.

Pour utiliser Flex.1 alpha avec ComfyUI :

Téléchargez le fichier Flex.1-alpha.safetensors

Placez ce fichier dans votre dossier de points de contrôle (checkpoints)

Utilisez-le comme vous le feriez avec FLUX.1-dev

Quel avenir pour Flex.1 ?

Les premières impressions sont prometteuses, soulignant l'innovation apportée par l'intégration du "guidance embedder" et la capacité à traiter des entrées textuelles étendues.

La nature Open Source du modèle et ses premiers résultats laissent entrevoir des perspectives d'avenir positives :

Adoption accrue : Avec la montée en popularité des modèles de génération d'images, Flex.1-alpha est bien positionné pour être adopté par les développeurs et chercheurs cherchant à exploiter des modèles performants et flexibles.

Améliorations continues : La nature open-source de Flex.1-alpha, sous licence Apache 2.0, encourage la communauté à contribuer à son perfectionnement, que ce soit en optimisant ses performances ou en élargissant ses capacités.

Applications diversifiées : Les caractéristiques avancées de Flex.1-alpha permettent son intégration dans divers domaines comme c’est déjà le cas pour Flux : création artistique, prototypage de produits ou encore éducation.

Flex.1-alpha représente une avancée notable dans la génération d'images à partir de descriptions textuelles, grâce à son architecture optimisée et son intégration transparente avec des interfaces utilisateur comme ComfyUI. Bien que les retours d'utilisateurs soient encore limités en raison de son lancement récent, les perspectives d'adoption et d'amélioration continue sont prometteuses. Ce modèle open-source offre une base solide pour les futures innovations dans le domaine de l'intelligence artificielle générative.

👍

Si vous souhaitez soutenir le travail innovant d'Ostris et contribuer au développement de modèles d'IA open-source tels que Flex.1-alpha, vous pouvez le soutenir sur sa page Patreon. Votre contribution aidera à financer la recherche et le développement de nouveaux outils d'intelligence artificielle.

→ Soutenir Ostris

Flex.1 - Le nouveau Flux Open Source