🌟 Un salto cualitativo en la IA de voz
ElevenLabs ha presentado Eleven v3 (alpha), su nuevo modelo de texto‑a‑voz que integra etiquetas de audio para generar expresividad emocional auténtica, entonación natural e incluso efectos no verbales como risas, suspiros y susurros. Esta versión permite producciones vocales más humanas que nunca, situándose por encima de sus predecesores en realismo y riqueza emocional.
🗣️ Lo nuevo en v3: etiquetas, diálogos múltiples y más de 70 idiomas
- Etiquetas de control emocional: Puedes insertar directamente en el texto comandos como [whispers], [laughs], [sighs], [excited], entre otros, para ajustar el tono, ritmo, intención y emociones.
- Modo diálogo multivoz: Ahora permite generar conversaciones fluídas entre varios personajes, gestionando pausas naturales, interrupciones y flujo emocional compartido.
- Compatibilidad con 70+ idiomas: Amplía drásticamente la cobertura idiomática respecto a versiones anteriores, lo que facilita la creación de contenido global sin necesidad de locutores nativos.

🎙️ Casos de uso: audiolibros, publicidad, accesibilidad
- Producción de audiolibros y podcasts: Narraciones más inmersivas, emotivas y dinámicas sin los costos y tiempos asociados a locutores humanos.
- Publicidad y contenido personalizado: Posibilita anuncios con emociones auténticas en múltiples idiomas, sin contratar talento de voz.
- Accesibilidad mejorada: Personas con discapacidades del habla pueden comunicarse con total expresividad, superando limitaciones de otras tecnologías.
🧪 Estado actual: alfa, uso mediante UI y oferta promocional
Actualmente está en fase alpha, accesible desde la plataforma de ElevenLabs:
- Uso inicialmente a través de la interfaz web o app; la API pública estará disponible próximamente.
- Frente a casos de uso en tiempo real, siguen recomendando sus modelos anteriores “Turbo/Flash v2.5” por menor latencia.
- Oferta de lanzamiento: 80 % de descuento en uso desde UI hasta el fin de junio 2025 .
🧠 Un impulso estratégico para ElevenLabs
En enero de 2025, la compañía cerró una ronda de financiación Serie C de 180 millones de USD, alcanzando una valoración de 3 300 millones USD. Este respaldo financiero refuerza su capacidad para liderar en tecnologías de voz expresiva y expandir su penetración en sectores creativos y accesibilidad.
🔍 En resumen
Eleven v3 (alpha) representa un avance sin precedentes en IA de voz. Sus etiquetas emocionales y capacidad de diálogo natural, junto a su multilenguaje, abren un escenario donde voces sintéticas son casi indistinguibles de las humanas. Es especialmente relevante para creadores, editores y desarrolladores que buscan generar narraciones ricas y flexibles.