QwenQwen-Image es un modelo base de código abierto potente para la generación y edición de imágenes, construido sobre un Transformador de Difusión Multimodal impulsado por MoE. Sobresale en la renderización de texto limpio y preciso directamente en imágenes (inglés y chino), manejando diseños de varias líneas y párrafos con una fuerte coherencia de diseño. Más allá del texto a imagen, admite ediciones avanzadas como transferencia de estilo, inserción/eliminación de objetos, manipulación de postura y mejora de detalles, además de edición multi-imágenes para composiciones consistentes de persona a producto o escena. Se integra con ComfyUI y ofrece cuantificación GGUF para uso local. Proporcione indicaciones específicas y estructuradas, y utilice entradas de ControlNet (profundidad/bordes/puntos clave) para un control preciso. Ideal para visuales de marketing, carteles de comercio electrónico, cómics y diseño multilingüe.
