Google DeepMindLe dernier modèle d'image-vidéo de Google transforme une seule image en clips cinématographiques avec un réalisme frappant et un mouvement fluide. Basé sur la diffusion latente et la formation multimodale à grande échelle, il offre un alignement fort des instructions et une haute fidélité visuelle, prenant en charge des résolutions allant jusqu'à 4K. Le système excelle avec des images claires et bien éclairées et des instructions descriptives qui spécifient le mouvement, les mouvements de caméra et le style. Les sorties typiques durent de 5 à 8 secondes à 24-30 images par seconde, avec une cohérence spatio-temporelle robuste et des transitions de scène dynamiques. Idéal pour les créatifs, les marketeurs et les éducateurs, il gère divers genres et effets, des panoramiques lents aux plans de suivi dynamiques. Le raffinement itératif des instructions aide à minimiser les artefacts et à optimiser les résultats.
