NVIDIA Rubin es la nueva plataforma de computación de vanguardia de NVIDIA, diseñada específicamente para impulsar la era de la IA de agentes (IA agentiva) y el razonamiento complejo. Rubin está creada para la próxima generación de inteligencia artificial, capaz de pensar, planificar y resolver problemas complejos paso a paso. En lugar de basarse solo en un chip muy potente, Rubin hace que todo un centro de datos trabaje como si fuera un solo “cerebro”, coordinando muchos ordenadores a la vez.

NVIDIA está preparando la “infraestructura” sobre la que funcionará la próxima generación de inteligencia artificial, no solo modelos más grandes, sino modelos que razonan, planifican y actúan durante largos periodos de tiempo, lo que permite que la inteligencia artificial maneje tareas largas y complicadas, como tomar decisiones, organizar procesos y trabajar de forma más autónoma y a gran escala.

Los aspectos fundamentales que definen a NVIDIA Rubin son:

Arquitectura de razonamiento avanzado: Optimizada para acelerar la inferencia, ofreciendo una mayor cantidad de tokens por vatio y reduciendo significativamente el coste por token en comparación con la generación Blackwell. Esta eficiencia permite el funcionamiento de inteligencias artificiales que no se limitan a generar respuestas inmediatas, sino que pueden razonar de forma prolongada, descomponen problemas complejos en varios pasos, priorizan acciones, utilizan herramientas externas, evalúan resultados intermedios y continúan trabajando hasta alcanzar un objetivo.

Este tipo de IA exige una infraestructura especialmente estable y coordinada, ya que opera durante periodos más largos y maneja volúmenes de información mucho mayores que la IA tradicional

Componentes integrados: La plataforma no solo incluye la GPU Rubin, sino que se complementa con la CPU NVIDIA Vera, la cual posee 88 núcleos diseñados para el movimiento masivo de datos y el razonamiento eficiente. También integra componentes de red de última generación como la SuperNIC ConnectX-9 y la DPU BlueField-4. Esto es esencial porque, en este tipo de IA, mover datos y coordinar procesos es tan importante como calcular.

Interconexión de sexta generación: Utiliza el tejido NVLink de sexta generación, que permite unificar hasta 72 GPUs en un único dominio de rendimiento, proporcionando un ancho de banda de 3,6 TB/s por GPU y reduciendo la congestión de red en un 50% gracias al protocolo SHARP™. En la práctica, esto permite entrenar y ejecutar modelos enormes sin que la red se convierta en el punto débil, algo que antes limitaba mucho el crecimiento de la IA.

Motor transformador adaptativo: Incorpora un nuevo motor con compresión adaptativa acelerada por hardware que alcanza hasta 50 petaFLOPS de inferencia NVFP4, manteniendo la compatibilidad total con los códigos optimizados para la arquitectura Blackwell para asegurar una transición fluida. Esto implica que Rubin está optimizada específicamente para los modelos de lenguaje y razonamiento modernos. Puede hacer cálculos de forma más compacta y rápida sin perder precisión, y además permite que las empresas migren desde plataformas anteriores sin tener que rehacer todo su software.

Seguridad y fiabilidad empresarial: Introduce la tercera generación de computación confidencial, que protege modelos y datos de entrenamiento a escala de bastidor (rack) completo. Además, cuenta con un motor RAS de segunda generación para mantenimiento proactivo en tiempo real y un diseño modular sin cables que agiliza el montaje del sistema hasta 18 veces. Los datos y modelos pueden mantenerse protegidos incluso dentro del centro de datos, el sistema detecta fallos antes de que ocurran y el diseño físico permite montar y mantener estas infraestructuras de forma mucho más rápida y fiable.

La plataforma se materializa en productos como el NVIDIA Vera Rubin NVL72, un sistema a escala de rack diseñado para las cargas de trabajo de IA más complejas del mundo, y el NVIDIA DGX Rubin NVL8, un sistema refrigerado por líquido especializado en el entrenamiento y la inferencia de alto rendimiento.

Todo esto no es solo teoría. Son sistemas físicos reales, pensados para los problemas de IA más exigentes del mundo, desde entrenar modelos gigantes hasta hacerlos funcionar de forma continua y segura. Rubin no es solo un chip nuevo. Es la apuesta de NVIDIA por convertir el centro de datos completo en la verdadera “máquina pensante” de la próxima era de la inteligencia artificial.

Más información: https://nvidianews.nvidia.com/news/rubin-platform-ai-supercomputer?ncid=no-ncid