Qwen Image - AI Model

Qwen-Image est un modèle de base open-source puissant pour la génération et l'édition d'images, construit sur un transformateur de diffusion multimodale piloté par MoE. Il excelle dans le rendu de texte propre et précis directement dans les images (anglais et chinois), gérant des mises en page multi-lignes et paragraphe avec une forte cohérence de mise en page. Au-delà du texte vers l'image, il prend en charge des modifications avancées telles que le transfert de style, l'insertion/suppression d'objets, la manipulation de la pose et l'amélioration des détails, ainsi que l'édition multi-images pour des compositions de personne à produit ou de scène cohérentes. Il s'intègre avec ComfyUI et offre une quantification GGUF pour une utilisation locale. Fournir des invites spécifiques et structurées, et utiliser des entrées ControlNet (profondeur/bords/points clés) pour un contrôle précis. Idéal pour les visuels marketing, les affiches de commerce électronique, les bandes dessinées et la conception multilingue.

Exemple de sortie

Prompt utilisé

A steampunk astronaut playing a grand piano on the edge of a floating cliff in the sky, under a golden sunset. The cliff is covered in moss and rusted metal pipes, with small mechanical birds perched around. The astronaut’s suit is detailed with brass, leather straps, and glowing blue tubes. Clouds drift below, while distant airships pass in the background. The lighting is dramatic, casting long shadows and warm reflections on the piano’s surface. Ultra-detailed, cinematic composition, dreamy and surreal atmosphere, 8K.