Facebook AI Research (FAIR) ha liberado recientemente su plataforma de detección de objetos Detectron, la principal responsable de los enormes avances observados en la percepción visual de la red social en los últimos años; además de las líneas de base de rendimiento de más de 70 modelos preentrenados.
¿Qué es el proyecto Detectron?
Facebook puso en marcha el proyecto Detectron en julio de 2016 con el objetivo de crear un sistema de detección de objetos rápido y flexible basado en Caffe2, que en ese momento estaba en desarrollo alfa inicial.
Desde entonces, el código ha madurado y se ha utilizado en gran cantidad de proyectos, entre ellos, Mask R-CNN y Focal Loss for Dense Object Detection, que obtuvieron los premios Marr Prize y Best Student Paper, respectivamente, en ICCV 2017.
Los algoritmos de Detectron proporcionan modelos intuitivos para desempeñar importantes tareas de visión artificial, como la segmentación de instancias; y han desempeñado un papel fundamental en el avance sin precedentes logrado por los sistemas de percepción visual de la red social en los últimos años.
En este sentido, no solo pueden detectar y clasificar objetos, sino también generar, al mismo tiempo, máscaras de segmentación.
La posibilidad de identificar determinadas regiones de las imágenes como miembros de un grupo permite entrenar a un modelo para identificar otros objetos de dicho grupo.
Escrito en python, el código incluye varios tipos de redes neuronales.
Más allá de la investigación, varios equipos de Facebook usan esta plataforma para entrenar modelos personalizados para diversas aplicaciones. Una vez capacitados, estos modelos se pueden implementar en la nube y en dispositivos móviles.
¿Por qué ha liberado Facebook su código?
Según la compañía:
“Nuestro objetivo al liberar el Detectron es abrir todo lo posible nuestra investigación, así como acelerar la investigación en los laboratorios de todo el mundo. Con su lanzamiento, la comunidad de investigadores podrá reproducir nuestros resultados y tener acceso a la misma plataforma de software que FAIR utiliza a diario”.
El código se ha liberado con licencia Apache 2.0 y está disponible en Github. No obstante, para ejecutarlo es necesario disponer de un ordenador con una GPU Nvidia CUDA.
Fuente:
Seguir leyendo:
- Google abre su API Cloud Vision a los desarrolladores
- Dos chatbots sorprenden a Facebook al inventar un nuevo lenguaje sin intervención humana
- Google presenta Tensorflow Lite para facilitar la incorporación del aprendizaje automático en los móviles
- Nueva plataforma de aprendizaje automático de Google para desarrolladores