Nvidia Grace CPU y Nvidia H100 se revelaron en Nvidia GTC 2022. Nvidia anunció hoy su arquitectura de GPU Hopper de próxima generación y GPU Hopper H100, así como un nuevo chip de centro de datos que combina la GPU con una CPU de alto rendimiento, denominado ” Grace CPU Superchip” (que no debe confundirse con el otro superchip Grace de Nvidia).
CPU Nvidia Grace: especificaciones, precio y fecha de lanzamiento
El GPU Superchip de Nvidia es el primer intento de la compañía en una CPU de centro de datos especializada. El chip basado en Arm contará con la asombrosa cantidad de 144 núcleos y 1 terabyte por segundo de ancho de banda de memoria, según la información filtrada por Intel. En realidad, combina dos CPU Grace conectadas a través de la interconexión NVLink de Nvidia, que es comparable a la arquitectura M1 Ultra de Apple.
Se espera que la nueva CPU, que estará alimentada por una memoria rápida LPDDR5X, se entregue en la primera mitad de 2023 y ofrezca el doble de rendimiento que los servidores convencionales. Nvidia predice que el chip logrará 740 puntos en la prueba de referencia SPECrate®2017_int_base, poniéndolo cara a cara con los procesadores de centro de datos AMD e Intel de gama alta (aunque algunos de ellos obtienen una puntuación más alta, pero a costa de un menor rendimiento por vatio). ).
“Ha surgido un nuevo tipo de centro de datos: fábricas de IA que procesan y refinan montañas de datos para producir inteligencia. Grace CPU Superchip ofrece el más alto rendimiento, ancho de banda de memoria y plataformas de software NVIDIA en un solo chip y brillará como la CPU de la infraestructura de IA del mundo”.
-Jensen Huang, fundador y CEO de Nvidia
Este nuevo chip, en muchos sentidos, es la progresión natural del Superchip y la CPU Grace Hopper anunciados el año pasado. El superchip Grace Hopper combina una CPU y una GPU en un solo diseño de sistema en un chip. Este sistema, que también debutará en la primera mitad de 2023, incluirá una GPU de memoria de 600 GB para modelos grandes y Nvidia afirma que el ancho de banda de la memoria será 30 veces mayor que la GPU de un servidor básico. Estos procesadores, según Nvidia, están destinados a aplicaciones informáticas de alto rendimiento e inteligencia artificial de “escala gigante”.
Grace CPU Superchip es un SoC basado en Arm v9 que se puede usar para crear servidores o CPU independientes con hasta ocho GPU basadas en Hopper.
La compañía indica que está trabajando con “clientes líderes de HPC, supercomputación, hiperescala y nube”, lo que implica que estos sistemas eventualmente estarán disponibles en un proveedor de nube cerca de usted.
Aún no se ha compartido información sobre el precio.
GPU Nvidia H100: especificaciones, precio y fecha de lanzamiento
Nvidia está lanzando una serie de tecnologías nuevas y mejoradas con Hopper, pero el énfasis de la arquitectura en los modelos de transformadores, que se han convertido en la técnica de aprendizaje automático elegida para muchas aplicaciones y que impulsan modelos como GPT-3 y asBERT, puede ser el más esencial. .
El nuevo Transformer Engine del chip H100 promete acelerar el entrenamiento del modelo hasta seis veces, y debido a que esta nueva arquitectura también incluye el nuevo sistema NVLink Switch de Nvidia para vincular numerosos nodos, los clústeres de servidores masivos alimentados por estos chips podrán ampliarse para admitir grandes redes con menos gastos generales.
“Los modelos de IA más grandes pueden requerir meses para entrenarse en las plataformas informáticas actuales. Eso es demasiado lento para las empresas. La inteligencia artificial, la computación de alto rendimiento y el análisis de datos están creciendo en complejidad con algunos modelos, como los de lenguaje grande, que alcanzan billones de parámetros. La arquitectura NVIDIA Hopper está construida desde cero para acelerar estas cargas de trabajo de IA de próxima generación con una potencia de cómputo masiva y una memoria rápida para manejar redes y conjuntos de datos en crecimiento”.
-Dave Salvador
Los Tensor Cores de los clientes, que pueden combinar precisión de 8 bits y semiprecisión de 16 bits según sea necesario sin dejar de ser precisos, se utilizan en el nuevo Transformer Engine.
Aún no se ha compartido información sobre el precio.