QwenQwen-Image est un modèle de base open-source puissant pour la génération et l'édition d'images, construit sur un transformateur de diffusion multimodale piloté par MoE. Il excelle dans le rendu de texte propre et précis directement dans les images (anglais et chinois), gérant des mises en page multi-lignes et paragraphe avec une forte cohérence de mise en page. Au-delà du texte vers l'image, il prend en charge des modifications avancées telles que le transfert de style, l'insertion/suppression d'objets, la manipulation de la pose et l'amélioration des détails, ainsi que l'édition multi-images pour des compositions de personne à produit ou de scène cohérentes. Il s'intègre avec ComfyUI et offre une quantification GGUF pour une utilisation locale. Fournir des invites spécifiques et structurées, et utiliser des entrées ControlNet (profondeur/bords/points clés) pour un contrôle précis. Idéal pour les visuels marketing, les affiches de commerce électronique, les bandes dessinées et la conception multilingue.
