ElevenLabs lanza v3 (alpha): la IA que habla con emociones reales y conversaciones naturales

🌟 Un salto cualitativo en la IA de voz

ElevenLabs ha presentado Eleven v3 (alpha), su nuevo modelo de texto‑a‑voz que integra etiquetas de audio para generar expresividad emocional auténtica, entonación natural e incluso efectos no verbales como risas, suspiros y susurros. Esta versión permite producciones vocales más humanas que nunca, situándose por encima de sus predecesores en realismo y riqueza emocional.

🗣️ Lo nuevo en v3: etiquetas, diálogos múltiples y más de 70 idiomas

Etiquetas de control emocional: Puedes insertar directamente en el texto comandos como [whispers], [laughs], [sighs], [excited], entre otros, para ajustar el tono, ritmo, intención y emociones.
Modo diálogo multivoz: Ahora permite generar conversaciones fluídas entre varios personajes, gestionando pausas naturales, interrupciones y flujo emocional compartido.
Compatibilidad con 70+ idiomas: Amplía drásticamente la cobertura idiomática respecto a versiones anteriores, lo que facilita la creación de contenido global sin necesidad de locutores nativos.

Eleven v3 (alpha) de ElevenLabs puede hablar en más de 70 idiomas y con diferentes tonos, ritmos y emociones.

🎙️ Casos de uso: audiolibros, publicidad, accesibilidad

Producción de audiolibros y podcasts: Narraciones más inmersivas, emotivas y dinámicas sin los costos y tiempos asociados a locutores humanos.
Publicidad y contenido personalizado: Posibilita anuncios con emociones auténticas en múltiples idiomas, sin contratar talento de voz.
Accesibilidad mejorada: Personas con discapacidades del habla pueden comunicarse con total expresividad, superando limitaciones de otras tecnologías.

🧪 Estado actual: alfa, uso mediante UI y oferta promocional

Actualmente está en fase alpha, accesible desde la plataforma de ElevenLabs:

Uso inicialmente a través de la interfaz web o app; la API pública estará disponible próximamente.
Frente a casos de uso en tiempo real, siguen recomendando sus modelos anteriores “Turbo/Flash v2.5” por menor latencia.
Oferta de lanzamiento: 80 % de descuento en uso desde UI hasta el fin de junio 2025 .

🧠 Un impulso estratégico para ElevenLabs

En enero de 2025, la compañía cerró una ronda de financiación Serie C de 180 millones de USD, alcanzando una valoración de 3 300 millones USD. Este respaldo financiero refuerza su capacidad para liderar en tecnologías de voz expresiva y expandir su penetración en sectores creativos y accesibilidad.

🔍 En resumen

Eleven v3 (alpha) representa un avance sin precedentes en IA de voz. Sus etiquetas emocionales y capacidad de diálogo natural, junto a su multilenguaje, abren un escenario donde voces sintéticas son casi indistinguibles de las humanas. Es especialmente relevante para creadores, editores y desarrolladores que buscan generar narraciones ricas y flexibles.