Google DeepMindCet outil de texte-à-vidéo transforme des instructions claires en langage naturel en courts clips cinématographiques avec des détails réalistes et des mouvements de caméra fluides. Il prend en charge divers styles tels que les prises de vue aériennes, le ralenti et les vues à la première personne, et offre un contrôle précis à travers le langage, y compris les zooms, les panoramiques et les travellings. Les vidéos sont rendues jusqu'à 1080p en prévisualisation et atteignent jusqu'à 30 images par seconde avec une cohérence temporelle et spatiale améliorée. Utilisez des instructions concrètes et sûres pour de meilleurs résultats, ainsi que des valeurs de départ optionnelles pour la reproductibilité. Bien qu'il excelle dans le réalisme et le suivi des mouvements, des instructions abstraites peuvent entraîner de l'ambiguïté, et des clignotements ou déformations occasionnels peuvent survenir. Les sorties sont de courts clips MP4 idéaux pour la conception et les bandes-annonces.