Siguiendo los enfoques de comprensión del lenguaje, unos investigadores del MIT han desarrollado un método para identificar qué está pasando en los archivos de vídeo. El método, basado en la rama de aprendizaje automático de la inteligencia artificial, permitirá a los ordenadores entender el contenido de los archivos en formato vídeo.

Pronto los ordenadores podrán entender qué sucede en un vídeo

El nuevo enfoque de análisis de vídeo utiliza los enfoques del análisis textual, examinando cada parte de un fragmento de contenido para averiguar el sentido global. Por ejemplo, en una oración de un texto, los algoritmos pueden identificar los sustantivos, los verbos o los adjetivos, entre otras partes del discurso; y después, determinar qué significa la combinación de esas palabras en el orden en el que se encuentran.

En los vídeos, los algoritmos de los investigadores del MIT primero identifican qué sucede en cada uno de los frames por separado y después determinan qué quieren decir cuando se combinan en un orden concreto.

Por supuesto, la identificación de lo que sucede en los vídeos es un problema de aprendizaje automático. El nuevo sistema no constituye un sistema autónomo de aprendizaje profundo, como algunos de los que trabajan en el reconocimiento de objetos, pero sí requiere que el ordenador aprenda por sí solo ciertas cosas.

El algoritmo se entrenó con vídeos de acciones específicas, pero tuvo que aprender por sí solo a diferenciar las distintas etapas necesarias para llevar a cabo una acción mayor (por ejemplo, preparar té o levantar unas pesas) y el flujo normal de una etapa a la siguiente.

Un algoritmo de este tipo podría ser muy eficaz para etiquetar e indexar las colecciones de vídeos en línea, pero los investigadores apuntan aún más alto. Dado que el algoritmo es bueno en la predicción de eventos a partir de acciones incompletas, podría identificar acciones incluso de fuentes de vídeo de streaming.

También podría tener algunos usos médicos específicos, como supervisar la realización de ejercicios o detectar si la gente recuerda tomar sus medicamentos, aunque teóricamente se podría aplicar a cualquier cosa.

Hay otros enfoques interesantes para el análisis de vídeo utilizando el aprendizaje automático. Por ejemplo:

  • Un proyecto de investigación que averigua el tema de los vídeos para hacer un breve resumen de su contenido.
  • Dropcam, una nueva empresa tecnológica que fabrica cámaras con conexión a la nube, está trabajando en su propio enfoque para identificar qué es normal y qué no en las zonas monitorizadas por sus cámaras.

En términos más generales, está claro que pronto el vídeo se convertirá en una fuente de datos tan importante como lo son el texto y las imágenes para las empresas inteligentes y otras instituciones.

Siempre ha habido un montón de información en los tweets, fotos y vídeos, pero pocas compañías disponían de la suficiente mano de obra como para visualizarlos todos. Gracias a los avances en inteligencia artificial, pronto solo necesitarán pagar por ello.

Fuente: gigaom.com

 

Seguir leyendo: