Google DeepMindEl último modelo de imagen a video de Google transforma una sola imagen en clips cinematográficos con un realismo sorprendente y un movimiento suave. Basado en difusión latente y entrenamiento multimodal a gran escala, ofrece una fuerte alineación de instrucciones y una alta fidelidad visual, admitiendo resoluciones de hasta 4K. El sistema destaca con imágenes claras y bien iluminadas e instrucciones descriptivas que especifican el movimiento, los movimientos de cámara y el estilo. Las salidas típicas duran de 5 a 8 segundos a 24-30 fps, con una coherencia espacio-temporal robusta y transiciones de escena dinámicas. Ideal para creativos, especialistas en marketing y educadores, maneja diversos géneros y efectos, desde panorámicas lentas hasta planos de seguimiento dinámicos. El refinamiento iterativo de las instrucciones ayuda a minimizar artefactos y optimizar resultados.
