OpenAI ha lanzado sus primeros modelos de lenguaje de “peso abierto” en más de cinco años, una noticia significativa que marca un cambio en su estrategia. Los nuevos modelos, denominados gpt-oss-120b y gpt-oss-20b, ya están disponibles para su descarga y uso en la plataforma Hugging Face.

El lanzamiento de estos modelos, los primeros de su tipo desde el GPT-2 de 2019, llega en un momento de creciente presión y competencia en el ámbito de la inteligencia artificial. Como señala Grace Huckins en un artículo de Technology Review, el movimiento podría interpretarse como una respuesta al dominio de los modelos abiertos chinos, como las ofertas de DeepSeek y Qwen de Alibaba.

Casey Dvorak, gerente del programa de investigación de OpenAI, explicó en una conferencia de prensa que muchos de sus clientes ya utilizan numerosos modelos de código abierto y que, al no ofrecer uno competitivo, la empresa quería “cubrir esa necesidad y permitirles usar nuestra tecnología de forma generalizada”.

Significado de “peso abierto”

A diferencia de los modelos de código abierto, los de “peso abierto” liberan los parámetros del modelo, pero no el código fuente completo ni los datos de entrenamiento. Esta distinción es crucial. No obstante, los modelos se publican bajo una licencia Apache 2.0, una de las más permisivas, lo que facilita su uso para fines comerciales y de investigación.

Según Nathan Lambert, del Instituto Allen de IA, esta decisión es digna de elogio, ya que contrasta con la licencia más restrictiva utilizada por Meta para sus modelos Llama. “Es muy positivo para la comunidad abierta”, afirmó Lambert en la fuente.

Características y ventajas

Los nuevos modelos están diseñados para ser accesibles y eficientes. El modelo más pequeño, el gpt-oss-20b, está optimizado para funcionar en un dispositivo de consumo con solo 16 GB de RAM, la cantidad mínima que ofrecen actualmente los ordenadores de Apple. Esto permite a los usuarios ejecutar la IA de forma local, algo de gran importancia para organizaciones como hospitales y bufetes de abogados que necesitan garantizar la seguridad de los datos.

El modelo más grande, el gpt-oss-120b, aunque requiere un hardware más especializado, ofrece un rendimiento comparable a los modelos propietarios de la compañía en pruebas de razonamiento avanzado. Peter Henderson, profesor adjunto de la Universidad de Princeton, destaca que este movimiento podría beneficiar a OpenAI al permitir que los investigadores exploren y mejoren los modelos, y que la compañía podría “incorporar innovaciones descubiertas por otros investigadores en su propio ecosistema de modelos”.

El panorama geopolítico y la competencia

El lanzamiento de estos modelos también tiene implicaciones geopolíticas. La creciente popularidad de los modelos chinos, que en ocasiones se niegan a tratar temas políticamente sensibles, ha generado preocupación. OpenAI, al lanzar modelos de peso abierto creados en EE. UU., se alinea con la postura de la administración estadounidense de fomentar el desarrollo de modelos nacionales abiertos.

Como comenta Rishi Bommasani del Instituto Stanford para la Inteligencia Artificial Centrada en el Ser Humano, la decisión de OpenAI, junto con las propuestas de otras empresas como Meta y Google, contribuye a un ecosistema de IA más sano y diverso, lo que es beneficioso para el desarrollo a largo plazo de la tecnología.