Google DeepMindGoogle'ın en son görüntüden videoya modeli, tek bir görüntüyü çarpıcı gerçekçilik ve akıcı hareketle sinematik kliplere dönüştürüyor. Gecikmeli difüzyon ve büyük ölçekli multimodal eğitim üzerine inşa edilen bu sistem, güçlü bir prompt hizalaması ve yüksek görsel sadakat sunarak, 4K'ya kadar çözünürlükleri destekler. Sistem, net, iyi aydınlatılmış görüntüler ve hareketi, kamera hareketlerini ve tarzı belirten açıklayıcı prompt'lar ile başarılı olur. Tipik çıktılar, güçlü mekânsal-zamansal uyumluluk ve dinamik sahne geçişleri ile 24-30 fps'de 5-8 saniye sürer. Yaratıcılar, pazarlamacılar ve eğitimciler için ideal olan bu sistem, yavaş pan çekimlerinden dinamik takip çekimlerine kadar çeşitli türleri ve efektleri ele alır. İteratif prompt iyileştirmesi, artefaktları en aza indirgemeye ve sonuçları optimize etmeye yardımcı olur.
