GTC 2024 ha comenzado con todo y NVIDIA ha presentado su próxima generación de aceleradores de IA, los B200 y GB200 GPU, construidas sobre la innovadora arquitectura Blackwell.
Estos procesadores representan un gran paso en la informática de IA, diseñados para abordar la complejidad cada vez mayor de las cargas de trabajo modernas.
El B200 cuenta con un diseño monolítico con un número récord de transistores, mientras que el GB200 adopta un enfoque de múltiples chips, combinando la potencia de múltiples B200 con una CPU Grace para un rendimiento incomparable.
Juntas, estas GPU ofrecen un aumento espectacular en la potencia de procesamiento y la capacidad de memoria, allanando el camino para avances en numerosos campos que dependen en gran medida de la inteligencia artificial.
La maravilla monolítica NVIDIA B200
La NVIDIA B200 es una obra maestra de la ingeniería, que cuenta con la asombrosa cifra de 208 mil millones de transistores. Esta notable hazaña es posible gracias a su diseño de chiplet, donde dos matrices masivas se integran a la perfección.
El B200 es una potencia computacional que ofrece un rendimiento de computación de alta precisión FP64 tres veces mayor en comparación con su predecesor basado en Hopper.
Quizás lo más sorprendente sea la capacidad del B200 para tareas de inferencia de IA.
NVIDIA afirma que esta GPU ofrece una asombrosa mejora cinco veces mayor que la H200. Este salto en el rendimiento es significativo para la implementación de grandes modelos de lenguaje (LLM) y otras aplicaciones de inteligencia artificial que dependen en gran medida de la inferencia.
Para los magnates de la tecnología, aquí están todos los detalles técnicos de Nvidia B200:
Especificación | Detalles |
Arquitectura | Blackwell |
Proceso de fabricación | TSMC N4P (clase personalizada de 4 nm) |
recuento de transistores | 208 mil millones (en dos chiplets) |
Tipo de memoria | HBM3E |
Capacidad de memoria | 192 GB (8 pilas de 24 GB) |
Ancho de banda de memoria | 8 TB/s |
Interfaz NVLink | 1,8 TB/s |
Rendimiento informático FP64 | Mejora 3 veces mayor que H100 |
Rendimiento de inferencia de IA | Mejora 5 veces mayor que H100 |
GB200 combina las arquitecturas Grace y Blackwell
El GB200 lleva el concepto de “superchip” un paso más allá al unir la potencia de dos GPU B200 con una CPU Grace a través de una interconexión de chip a chip NVLink de consumo ultrabajo.
Esta configuración ofrece un rendimiento y una capacidad de memoria aún más impresionantes, adaptados a las cargas de trabajo de IA más exigentes.
Las características del GB200 incluyen:
- Inmensa capacidad de memoria: Diseñado para manejar las demandas de memoria de un modelo de IA de billones de parámetros
- Redes de alta velocidad: Compatibilidad con las plataformas Ethernet NVIDIA Quantum-X800 InfiniBand y Spectrum-X800 con velocidades ultrarrápidas de 800 Gb/s
- Escalabilidad multinodo: El GB200 forma la base del NVIDIA GB200 NVL72, un sistema a escala de rack refrigerado por líquido para los niveles más altos de intensidad computacional
Aquí hay un resumen rápido de las especificaciones del GB200:
Especificación | Detalles |
Arquitectura | Blackwell |
Componentes | 2x GPU B200 + CPU NVIDIA Grace |
interconectar | NVLink (chip a chip) de consumo ultrabajo de 900 GB/s |
Capacidad de memoria | 384GBHBM3E |
Ancho de banda de memoria total | 16 TB/s |
Soporte de redes | NVIDIA Quantum-X800 InfiniBand (800 Gb/s), Spectrum-X800 Ethernet (800 Gb/s) |
Configuración del sistema | GB200 NVL72 (refrigerado por líquido, báscula en rack) |
El impacto potencial del B200 y GB200 se extiende a numerosas industrias y aplicaciones.
Su poderosa aceleración es ideal para entrenar e implementar modelos masivos de IA generativa que cambian la forma en que creamos arte, texto, código y más.
Los B200/GB200 potencian servicios mejorados en áreas como el procesamiento del lenguaje natural y los sistemas de recomendación. Los investigadores también obtendrán precisión y velocidad en campos como el descubrimiento de fármacos, la modelización climática y la ciencia de materiales.
Blackwell a escala
NVIDIA ha anunciado simultáneamente el DGX SuperPOD, diseñado específicamente para aprovechar la potencia de los superchips GB200 Grace Blackwell. Esta solución llave en mano ofrece una plataforma optimizada para escalar cargas de trabajo de IA generativa con una confiabilidad líder en la industria.
El futuro de la aceleración de la IA
NVIDIA B200 y GB200 representan un avance importante en la informática de IA y marcan un nuevo hito en potentes soluciones de aceleración.
Estas GPU históricas, con sus ventajas de rendimiento y memoria, están preparadas para impulsar la innovación y ampliar las fronteras de lo que es posible en numerosos sectores.
Crédito de imagen destacada: pvproducciones/Freepik.
Source: NVIDIA acaba de lanzar sus chips AI B200 y GB200 de próxima generación