Nvidia presentó Nemotron 3 Nano Omni, un modelo abierto de IA multimodal que integra capacidades de visión, audio y lenguaje en una arquitectura unificada.
El modelo tiene como objetivo abordar las ineficiencias de los sistemas empresariales de IA actuales, que a menudo dependen de procesos fragmentados. Procesa una variedad de entradas, incluidos texto, imágenes, audio, video, documentos, cuadros e interfaces gráficas, mientras genera salidas de texto.
Construido sobre una arquitectura híbrida de mezcla de expertos de 30 mil millones de parámetros, Nemotron 3 Nano Omni activa aproximadamente 3 mil millones de parámetros por inferencia. Nvidia afirma que proporciona la capacidad de conocimiento de modelos más grandes al tiempo que reduce significativamente los costos de computación.
Nvidia afirmó que el Nemotron 3 Nano Omni logra un rendimiento hasta 9 veces mayor que los modelos omni abiertos comparables. Para tareas de razonamiento en vídeo, ofrece un rendimiento aproximadamente tres veces mayor con requisitos informáticos 2,75 veces menores, respaldado por una ventana de contexto de 256 000 tokens. Según se informa, el modelo lidera seis puntos de referencia para inteligencia de documentos complejos y comprensión de video y audio.
Los adoptantes notables del modelo incluyen Foxconn, Palantir y H Company. “El uso de Nemotron 3 Nano Omni permite a nuestros agentes analizar rápidamente grabaciones de pantalla Full HD, una capacidad que antes era inviable”, afirmó Gautier Cloix, director ejecutivo de H Company.
Dell, Oracle e Infosys están evaluando actualmente el modelo para su posible adopción. Se puede acceder a Nemotron 3 Nano Omni en plataformas como Hugging Face, OpenRouter, Amazon SageMaker JumpStart, Vultr y más de 25 plataformas asociadas. Viene equipado con pesos abiertos, conjuntos de datos y recetas de entrenamiento para implementar en varios entornos.
Este modelo forma parte de la familia Nemotron 3 más amplia de Nvidia, que incluye modelos Super y Ultra diseñados para tareas de razonamiento más intensivas. La serie Nemotron 3 alcanzó más de 50 millones de descargas el año pasado.








