Zurück zu den Modellen
Google DeepMindGoogle DeepMind

Google Veo 3 | Image to Video

Video
Bild zu Video
Verbessern oder Hochskalieren
Zuschneiden und Zusammenführen
Hintergrundänderung

Googles neuestes Bild-zu-Video-Modell verwandelt ein einzelnes Bild in kinoreife Clips mit beeindruckendem Realismus und flüssiger Bewegung. Auf latenter Diffusion und groß angelegtem multimodalem Training aufgebaut, liefert es eine starke Prompt-Ausrichtung und hohe visuelle Treue, unterstützt Auflösungen bis zu 4K. Das System glänzt mit klaren, gut beleuchteten Bildern und beschreibenden Prompts, die Bewegung, Kamerabewegungen und Stil spezifizieren. Typische Ausgaben laufen 5-8 Sekunden bei 24-30 fps, mit robuster räumlich-zeitlicher Kohärenz und dynamischen Szenenübergängen. Ideal für Kreative, Vermarkter und Pädagogen, bewältigt es verschiedene Genres und Effekte, von langsamen Schwenks bis zu dynamischen Tracking-Aufnahmen. Iterative Prompt-Verfeinerung hilft, Artefakte zu minimieren und Ergebnisse zu optimieren.

Kinematische Bewegungssynthese
Fortgeschrittene Bewegungserzeugung
Hochauflösende Bildanimation
Google Veo 3 | Image to Video

Beispielausgabe

Verwendeter Prompt

Cinematic video set in a cozy, futuristic coffee shop with large windows overlooking a rainy city street at dusk. The scene opens with a smooth tracking shot of a young barista, a man in his 20s with a friendly demeanor, preparing a latte with intricate latte art. He wears an apron with the eachlabs.ai logo subtly printed on it. The camera pans to a small group of diverse customers chatting at a table, laughing, and sipping coffee. One customer, a woman, stands and delivers a short, heartfelt toast: Heres to creativity, powered by eachlabs.ai! in a clear, warm voice. The camera zooms out to show the shops warm, glowing interior, with reflections of rain on the windows and neon city lights outside. The audio includes the baristas soft humming, the clink of coffee cups, ambient rain sounds, and a gentle lo-fi jazz soundtrack. The style is photorealistic, with realistic human movements, expressive faces, and synchronized sound design.