Amazon.com Inc. anunció la semana pasada el lanzamiento de un nuevo conjunto de datos masivo, apropiadamente llamado “Massive”, que dice que puede usarse para construir asistentes virtuales que admitan algunos de los idiomas más “oscuros” del mundo.

Junto con la base de datos, Amazon también ha lanzado un código de modelado de código abierto para ayudar a los desarrolladores a crear asistentes virtuales más capaces.

La base de datos MASSIVE es lo que se conoce como un “conjunto de datos paralelos”, lo que significa que cada una de las expresiones que contiene se proporciona en los 51 idiomas que admite, incluidos muchos difíciles y poco explotados que carecen de datos etiquetados para permitir el entrenamiento de IA.

La idea es que los desarrolladores puedan usar la base de datos MASSIVE para entrenar modelos de IA para comprender esos idiomas más “oscuros” en un grado similar al que se puede lograr con idiomas más comunes como el inglés.

Amazon dijo que el conjunto de datos MASIVO y las herramientas para usarlo están disponibles en su repositorio de GitHub a partir de la fecha de su anuncio. Además de lanzar el conjunto de datos, también ha creado una competencia para alentar a los desarrolladores a trabajar con él.

Más información: https://siliconangle.com/2022/04/20/amazon-releases-massive-database-designed-scale-natural-language-understanding/

1MillionBot extiende su zona operativa en Chile, Uruguay, Perú y México

1MillionBot extiende su zona operativa en Chile, Uruguay, Perú y México