DeepSeek lanza el modelo V4 con un contexto de un millón de palabras

DeepSeek ha lanzado su nuevo modelo de IA, DeepSeek V4, afirmando un rendimiento mejorado optimizado para chips producidos localmente en China. El modelo presenta un contexto ultralargo de un millón de palabras, lo que mejora las capacidades de los agentes, el conocimiento del mundo y el rendimiento del razonamiento.

DeepSeek V4 está disponible en dos versiones: DeepSeek V4-Pro y DeepSeek V4-Flash. La empresa describe esta última como una opción más eficiente y económica. Según DeepSeek, V4-Pro supera significativamente a otros modelos de código abierto en los puntos de referencia de conocimiento mundial y sólo es ligeramente superado por el modelo de código cerrado de Google, Gemini-Pro-3.1.

La variante V4-Pro incluye un “modo de máximo esfuerzo de razonamiento” diseñado para mejorar las capacidades de conocimiento de los modelos de código abierto, estableciéndolo como uno de los principales contendientes en ese espacio. Anteriormente, DeepSeek provocó una liquidación de billones de dólares en el mercado de valores con su modelo anterior, R1, que desafió a los sistemas de inteligencia artificial como ChatGPT de OpenAI a un costo de desarrollo más bajo.

El lanzamiento de R1 el año pasado provocó pérdidas significativas para las principales empresas de tecnología, y Nvidia sufrió más de 500 mil millones de dólares en un solo día. El lanzamiento también marcó la primera competencia importante de una empresa china de inteligencia artificial contra gigantes tecnológicos estadounidenses establecidos. El lanzamiento de DeepSeek se produce en medio de las restricciones estadounidenses a la exportación de semiconductores a China, que afectan particularmente a las GPU de alta gama, esenciales para el desarrollo de la IA.

OpenAI respalda la Ley de seguridad infantil en línea para fortalecer la protección de los menores

El sistema de chip utilizado para entrenar DeepSeek V4 no ha sido revelado, pero la empresa afirmó que es compatible con chips de Nvidia y Huawei. DeepSeek V4 puede procesar hasta 384.000 tokens, una unidad de datos fundamental para los modelos de IA. Esto marca una mejora significativa con respecto a su predecesor, V3, que gestionaba sólo 128.000 tokens.

La actualización permite el razonamiento de múltiples documentos, lo que permite a la IA comprender libros completos y bases de datos de códigos completos. La compañía afirma que esta capacidad representa un “salto espectacular en la eficiencia computacional” e inicia una nueva era para grandes modelos de lenguaje con contextos de un millón de longitud.

DeepSeek V4-Pro supera al Gemini-3.1-Pro de Google, pero aún está por detrás del modelo Claude Opus 4.6 de Anthropic. DeepSeek tiene como objetivo mejorar aún más la inteligencia, la solidez y la usabilidad del modelo en diversas tareas y escenarios.

Tencent lanza ClawBot que vincula WeChat con OpenClaw

Crédito de imagen destacada

DeepSeek lanza el modelo V4 con un contexto de un millón de palabras

Related Stories

Apple trae controles de voz Siri más personales a la beta 3

Un estudio antrópico encuentra que los modelos de Claude forman un espacio de trabajo interno que se asemeja a la conciencia

Apple activa Siri AI en Apple Watch en watchOS 27 beta 3

Midjourney presiona a Disney y otros a revelar el uso interno de IA en la demanda