Qwen Image - AI Model

Qwen-Image es un modelo base de código abierto potente para la generación y edición de imágenes, construido sobre un Transformador de Difusión Multimodal impulsado por MoE. Sobresale en la renderización de texto limpio y preciso directamente en imágenes (inglés y chino), manejando diseños de varias líneas y párrafos con una fuerte coherencia de diseño. Más allá del texto a imagen, admite ediciones avanzadas como transferencia de estilo, inserción/eliminación de objetos, manipulación de postura y mejora de detalles, además de edición multi-imágenes para composiciones consistentes de persona a producto o escena. Se integra con ComfyUI y ofrece cuantificación GGUF para uso local. Proporcione indicaciones específicas y estructuradas, y utilice entradas de ControlNet (profundidad/bordes/puntos clave) para un control preciso. Ideal para visuales de marketing, carteles de comercio electrónico, cómics y diseño multilingüe.

Ejemplo de salida

Prompt utilizado

A steampunk astronaut playing a grand piano on the edge of a floating cliff in the sky, under a golden sunset. The cliff is covered in moss and rusted metal pipes, with small mechanical birds perched around. The astronaut’s suit is detailed with brass, leather straps, and glowing blue tubes. Clouds drift below, while distant airships pass in the background. The lighting is dramatic, casting long shadows and warm reflections on the piano’s surface. Ultra-detailed, cinematic composition, dreamy and surreal atmosphere, 8K.