Volver a los Modelos
Open SourceOpen Source

XTTS

Música y Audio
Texto a voz
Clonación de voz
Mejora de audio
Doblaje o Sincronización labial

XTTS genera un habla natural y realista en varios idiomas con una pronunciación clara y un tono expresivo. Admite la personalización del hablante utilizando archivos de audio externos, lo que le permite imitar voces o estilos específicos. Para obtener mejores resultados, proporcione muestras de hablantes limpias y bien grabadas y un texto gramaticalmente correcto y conciso que coincida con el código de idioma seleccionado (por ejemplo, en, fr, tr). El modelo incluye una opción de limpieza para suavizar artefactos y mejorar la calidad de audio, especialmente para perfiles ruidosos o sintetizados. XTTS sobresale en la narración de audiolibros, doblajes de video, presentaciones y comunicación multilingüe en tiempo real. Aunque maneja bien muchos idiomas, los tecnicismos o acentos regionales fuertes pueden requerir una solicitud cuidadosa.

Soporte multilingüe
Clonación de voz personalizada
Cambio de voz en tiempo real
XTTS

Ejemplo de salida

Prompt utilizado

Prompt info not available.
Model Output Example