DeepSeek anunció importantes reducciones de precios para su servicio API el sábado, poco después del lanzamiento de su modelo de lenguaje grande V4 el 24 de abril de 2023. El precio reduce las tarifas de acceso a la caché de entrada a una décima parte de sus tarifas anteriores y ofrece un descuento del 75 % en el modelo V4-Pro hasta el 5 de mayo de 2023.

El precio de acierto de la caché de entrada del V4-Pro ha caído a 0,025 yuanes (aproximadamente 0,0036 dólares) por millón de tokens. Los precios estándar durante el período promocional se fijan en 3 yuanes para la entrada y 6 yuanes para la producción por millón de tokens. Esta estrategia de precios socava marcadamente a los competidores, con modelos de Anthropic, OpenAI y Google con precios de entre 12 y 25 dólares por millón de tokens, según datos de OpenRouter.

  Gemini ahora puede generar y descargar archivos directamente desde la barra de mensajes

DeepSeek lanzó V4-Pro y V4-Flash en capacidad de vista previa, lo que marca el primer lanzamiento importante de un modelo de la compañía desde su versión V3.2 en diciembre de 2022. V4-Pro tiene 1,6 billones de parámetros y 49 mil millones de parámetros activos por pase de inferencia, lo que lo convierte en el modelo de peso abierto más grande disponible actualmente. V4-Flash presenta una configuración más pequeña con 284 mil millones de parámetros.

Incluso antes de los recortes recientes, los precios estándar de V4-Pro eran de 1,74 dólares por entrada y 3,48 dólares por producción por millón de tokens, lo que era aproximadamente un 98% más bajo que el precio del GPT-5.5 Pro de OpenAI. Los últimos descuentos amplían aún más esta ventaja competitiva.

  La película Critterz de OpenAI utiliza IA y se estrena en Cannes

En medio de los crecientes costos de la potencia informática en el sector de la IA, la estrategia de DeepSeek se alinea con una tendencia más amplia de reducciones de precios dentro de la industria. Según un informe de Gelonghui, la empresa ha adoptado plenamente el concepto de “reducción de precio de la IA”.

En particular, V4 funciona con hardware Huawei Ascend en lugar de chips Nvidia, lo que, según los observadores, puede mejorar la adopción nacional de sistemas de inteligencia artificial. Wei Sun, analista principal de IA en Counterpoint Research, indicó que este desarrollo permite el despliegue de sistemas de IA sin depender únicamente de Nvidia, lo que potencialmente acelera los avances de la IA tanto a nivel nacional como global.

V4-Pro demuestra una eficiencia significativa, ya que requiere solo el 27 % de la potencia informática de su predecesor, V3.2, para una ventana de contexto de un millón de tokens. A pesar de sus avances, DeepSeek reconoce que V4 se mantiene detrás de modelos líderes como GPT-5.4 y Gemini 3.1 Pro por aproximadamente tres a seis meses en rendimiento, como se indica en el documento técnico de la compañía.

  California promulga transparencia en la Ley Frontier AI (SB 53)

Crédito de imagen destacada