QwenQwen-Image, görüntü oluşturma ve düzenleme için güçlü bir açık kaynak temel modelidir. MoE tarafından yönlendirilen Multimodal Diffusion Transformer üzerine inşa edilmiştir. İngilizce ve Çince metinleri doğrudan görüntülerde temiz ve doğru bir şekilde oluşturma konusunda uzmanlaşmıştır, çoklu satır ve paragraf düzenlerini güçlü düzen uyumuyla ele alır. Metin-görüntü dönüşümünün ötesinde, stil transferi, nesne ekleme/çıkarma, poz manipülasyonu ve detay artırma gibi gelişmiş düzenlemeleri destekler, ayrıca tutarlı kişiden ürüne veya sahneden kompozisyonlara kadar çoklu görüntü düzenlemelerini sağlar. ComfyUI ile entegre olup yerel kullanım için GGUF nicemlemesini sunar. Kesin kontrol için belirli, yapılandırılmış ipuçları sağlayın ve hassas kontrol için ControlNet girişlerini (derinlik/kenarlar/anahtar noktalar) kullanın. Pazarlama görselleri, e-ticaret posterleri, çizgi romanlar ve çok dilli tasarım için idealdir.
