Investigadores de IBM han desarrollado una red neuronal capaz de predecir con antelación el resultado que se obtendrá a partir de una reacción química orgánica.

La síntesis de moléculas orgánicas es una de las tareas más importantes de la química orgánica y el principal desafío para los investigadores de este área en diversos campos es la existencia de cientos de miles de reacciones diferentes.

Por este motivo, en los últimos 50 años, científicos de todo el mundo han tratado de enseñar a los ordenadores a predecir el resultado de las reacciones de química orgánica. No obstante, predecir lo que va a suceder cuando se mezclan dos o más sustancias químicas o se les aplica cierto tratamiento ha resultado ser muy difícil, debido a todas las variables implicadas.

IBM predice el resultado de las reacciones químicas con inteligencia artificial

Los compuestos orgánicos pueden llegar a ser extrordinariamente complejos y, como consecuencia, las simulaciones realizadas hasta la fecha a menudo requerían mucho tiempo y les faltaba precisión.

Para resolver este problema, un equipo de investigadores de IBM decidió probar con técnicas de aprendizaje profundo, una rama de la inteligencia artificial que se encuadra dentro del aprendizaje automático.

Siguiendo un enfoque innovador, los investigadores decidieron utilizar técnicas utilizadas habitualmente en el campo de la traducción automática y afirman haber tenido éxito, tras lograr, en las pruebas de predicción realizadas, una precisión del 80%.

“Nos dimos cuenta de que los conjuntos de datos de la química orgánica tienen mucho en común con los conjuntos de datos lingüísticos: ambos dependen de una gramática y de dependiencias de largo alcance; y una pequeña partícula o palabra como “no” puede cambiar el significado completo de una frase, del mismo modo que la estereoquímica puede convertir la talidomida en un medicamento o un veneno mortal”, señalan los investigadores de IBM Research.

“En lugar de traducir de inglés a alemán o a chino, pusimos a la misma tecnología de inteligencia artificial a analizar cientos de miles de reacciones químicas hasta que aprendió la estructura básica  del ‘lenguaje’ de la química orgánica y, a continuación, la utilizamos para predecir el resultado de posibles reacciones químicas orgánicas”, señaló el coautor del estudio Teodoro Laino, de IBM Research en Zurich.

Los investigadores entrenaron el modelo de IA con un conjunto de datos de reacciones químicas disponible en abierto, concretamente de reacciones incluidas en patentes estadounidenses publicadas en línea.

Una vez entrenada, la red demostró ser capaz de predecir el resultado de las reacciones propuestas con un 80,3% de aciertos, ofreciendo los 5 posibles resultados más probables.

El siguiente paso, según los investigadores, será mejorar esa precisión al menos hasta un 90%.

Para el presente estudio, presentado en el congreso NIPS 2017, celebrado a comienzos de diciembre en California, EE.UU. y publicado en Arxiv, solo se entrenó a la red neuronal con datos de moléculas de hasta 150 átomos. Ampliar el estudio con la inclusión de moléculas más complejas podría mejorar considerablemente la precisión del sistema.

Los investigadores señalan que, además de patentes, se podría alimentar la red neuronal también con información de libros de texto de química y de publicaciones cientificas.

Además, los investigadores planean modificar la red neuronal para poder añadir parámetros como la temperatura, los niveles de pH o disolventes.

Una vez completado el desarrollo de la herramienta, los investigadores planean publicarla en abierto de manera gratuita como aplicación web. Se espera que pueda estar disponible a comienzos de 2018.

Si deseas recibir un aviso en cuanto esté disponible, puedes registrarte en: www.zurich.ibm.com/foundintranslation.

Los investigadores de IBM esperan que la nueva herramienta de IA pueda ayudar a los químicos orgánicos y acelerar considerablemente el desarrollo de nuevos materiales y fármacos.

Puedes consultar el trabajo de investigación completo en Arxiv, con el título: “Found in Translation: Predicting Outcomes of Complex Organic Chemistry Reactions using Neural Sequence-to-Sequence Models“.

Fuentes:

Seguir leyendo: