Un equipo de investigadores de la Universidad de California, Berkely, ha desarrollado una inteligencia artificial que muestra curiosidad.
Para probarla, utilizaron dos videojuegos famosos: Super Mario Bros, de Nintendo y VizDoom, un juego de disparos en un escenario 3D. Y los resultados son realmente interesantes.
La mayor parte de los sistemas de inteligencia artificial, entre ellos, el famoso Alphago de Google, aprenden por refuerzo, es decir, se les premia cuando realizan una acción que les ayuda a lograr un objetivo o a completar una tarea.
Este método de aprendizaje ha demostrado ser extremadamente eficaz cuando el objetivo es que la inteligencia artificial aprenda a realizar una tarea concreta. Sin embargo, no resulta tan adecuado cuando se pretende que la inteligencia artificial aprenda a ser realmente autónoma y tomar decisiones sin una orden previa directa.
Según Pulkit Agrawal, estudiante de doctorado de la universidad y miembro del equipo, para que los sistemas de inteligencia artificial (IA) puedan desenvolverse con soltura en la vida real es fundamental que aprendan a ser autónomos, dado que en la vida real el objetivo no siempre está claro y las recompensas son más bien escasas.
“En muchos escenarios del mundo real, las recompensas extrínsecas al agente son extremadamente escasas o inexistentes”, escribieron los autores del estudio.
“En estos casos, la curiosidad puede servir como una señal de recompensa intrínseca para permitir que el agente explore su entorno y aprenda habilidades que podrían serle útiles posteriormente en su vida”.
Las redes neuronales entrenadas con un método de aprendizaje por refuerzo irán siempre tras las mejores recompensas sin preocuparse por nada más, aunque eso perjudique su eficiencia global.
En las pruebas realizadas por los investigadores, de hecho, la IA sin la mejora de curiosidad trataba siempre de pasar el juego lo más rápido posible y se golpeaba una y otra vez contra el mismo muro en lugar de pararse a buscar otra estrategia.
La inteligencia artificial con curiosidad desarrollada los investigadores de la UC, en cambio, mostró un comportamiento más similar al de los humanos.
Las personas, en general, cuando jugamos a un juego por primera vez dedicamos un tiempo a explorar los distintos escenarios y probar cosas, en lugar de correr hacia adelante sin pensar. Y eso, precisamente, es lo que hizo la inteligencia artificial de la UC.
Para lograr este comportamiento, básicamente, los investigadores le imprimieron la capacidad de tomar decisiones y realizar acciones aún cuando no hay una recompensa inmediata.
Desde el punto de vista técnico, los investigadores lo definen como “el error en la capacidad de un agente para predecir la consecuencia de sus propias acciones en un espacio de rasgos visuales aprendido por medio de un modelo de dinámica inversa autosupervisada”, pero para Agrawal, se puede entender como un modo de curiosidad.
Las implicaciones de este descubrimiento pueden ser sin duda muy importantes, pero el hecho de que la IA pueda aprender por sí sola de manera autónoma también resulta algo inquietante.
Aunque hay diversas opiniones encontradas al respecto, expertos como Elon Musk y Stephen Hawking han planteado ya la posibilidad de que la IA llegue a suponer una seria amenaza para la humanidad. En cualquier caso, no hay duda de que está aprendiendo a una velocidad asombrosa.
Fuentes:
Seguir leyendo:
Trackbacks/Pingbacks