Qwen Image - AI Model

Qwen-Image, görüntü oluşturma ve düzenleme için güçlü bir açık kaynak temel modelidir. MoE tarafından yönlendirilen Multimodal Diffusion Transformer üzerine inşa edilmiştir. İngilizce ve Çince metinleri doğrudan görüntülerde temiz ve doğru bir şekilde oluşturma konusunda uzmanlaşmıştır, çoklu satır ve paragraf düzenlerini güçlü düzen uyumuyla ele alır. Metin-görüntü dönüşümünün ötesinde, stil transferi, nesne ekleme/çıkarma, poz manipülasyonu ve detay artırma gibi gelişmiş düzenlemeleri destekler, ayrıca tutarlı kişiden ürüne veya sahneden kompozisyonlara kadar çoklu görüntü düzenlemelerini sağlar. ComfyUI ile entegre olup yerel kullanım için GGUF nicemlemesini sunar. Kesin kontrol için belirli, yapılandırılmış ipuçları sağlayın ve hassas kontrol için ControlNet girişlerini (derinlik/kenarlar/anahtar noktalar) kullanın. Pazarlama görselleri, e-ticaret posterleri, çizgi romanlar ve çok dilli tasarım için idealdir.

Örnek Çıktı

Kullanılan Prompt

A steampunk astronaut playing a grand piano on the edge of a floating cliff in the sky, under a golden sunset. The cliff is covered in moss and rusted metal pipes, with small mechanical birds perched around. The astronaut’s suit is detailed with brass, leather straps, and glowing blue tubes. Clouds drift below, while distant airships pass in the background. The lighting is dramatic, casting long shadows and warm reflections on the piano’s surface. Ultra-detailed, cinematic composition, dreamy and surreal atmosphere, 8K.