Desarrollan una IA capaz de imitar cualquier voz en menos de 1 minuto

La startup canadiense Lyrebird, especializada en el desarrollo de tecnologías de síntesis de voces para desarrolladores, ha desvelado una nueva tecnología con inteligencia artificial o IA capaz de imitar cualquier voz en menos de 1 minuto.

Desarrollan una IA capaz de imitar cualquier voz en menos de 1 minuto

 

Cómo funciona el sistema de Lyrebird

Para que la inteligencia artificial de Lyrebird pueda imitar la voz de una persona concreta, basta con proporcionarle un archivo de audio con 1 minuto de grabación de la voz de la persona en cuestión.

Los complejos algoritmos y modelos de aprendizaje profundo de la compañía extraen la esencia o ADN de esa voz para crear una clave única con la que la tecnología puede, a continuación, generar cualquier frase utilizando dicha voz.

El sistema permite también controlar la emoción de la voz generada, es decir, la voz podría transmitir enfado, alegría, estrés, etc.; dependiendo de lo que determine la persona que controle el sistema en ese momento.

Como muestra, en la web de la compañía se pueden escuchar algunas frases pronunciadas con las voces de destacados políticos estadounidenses, como Obama, Hillary Clinton o Donald Trump.

Posibles aplicaciones y consecuencias

Por motivos más que evidentes, la idea resulta realmente aterradora.

No hay duda de que una tecnología de este tipo puede tener aplicaciones muy positivas y diversas, como su incorporación en asistentes virtuales o su uso en videojuegos y películas de animación. Incluso se podría utilizar parar ofrecer la lectura de audiolibros con voces de famosos.

No obstante, en malas manos, podría tener también graves consecuencias, dado que una vez aprendidas las peculiaridades de nuestra voz, el sistema de IA podría hacerse pasar por nosotros, ya sea en una conversación telefónica o para superar un sistema de seguridad activado por voz.

Objetivo de la compañía a corto plazo

El objetivo de Lyrebird es desarrollar una API para desarrolladores, de manera que estos puedan incorporar voces fácilmente en sus aplicaciones.

Además, de imitar cualquier voz, la API traerá incorporadas por defecto miles de voces predefinidas para escoger, así como la opción de diseñar una voz única con las características deseadas.

Por el momento, la API se encuentra todavía en desarrollo, pero ya es posible inscribirse como beta-tester en la web de la compañía para poder probarla o bien proporcionar una dirección de correo electrónico para recibir un aviso en cuanto se produzca su lanzamiento.

Fuente: Lyrebird Press

Seguir leyendo:

X

Sin Respuestas

Deja un comentario