Los modelos de lenguaje grande construidos en China ahora representan el 61 % del consumo total de tokens en OpenRouter, la plataforma de agregación de API LLM más grande del mundo, según datos semanales publicados el 24 de febrero de 2026. Los tres modelos más utilizados en la plataforma fueron todos desarrollados por laboratorios de IA chinos.

MiniMax M2.5 ocupó el primer lugar con 2,45 billones de tokens consumidos en una sola semana, un aumento del 197% con respecto a la semana anterior. Le siguió Kimi K2.5 de Moonshot AI con 1,21 billones de tokens, aunque su uso disminuyó un 20% semana tras semana. El GLM-5 de Zhipu AI ocupó el tercer lugar con 780 mil millones de tokens después de aumentar un 158%. DeepSeek V3.2 ocupó el quinto lugar entre todos los modelos de la plataforma. En conjunto, los modelos chinos representaron 5,3 billones de los 8,7 billones de tokens consumidos por los 10 modelos principales de la plataforma.

  Microsoft enfrenta una reacción violenta por la advertencia de Copilot en sus propios términos

El aumento en el uso de MiniMax M2.5 se debió en parte al acceso promocional gratuito. Kilo Code, una herramienta de codificación basada en inteligencia artificial, ofreció el modelo sin costo durante una semana a partir del 12 de febrero. Cline, otra herramienta de desarrollo, realizó una promoción similar.

MiniMax M2.5 obtiene una puntuación del 80,2% en SWE-Bench Verified, lo que lo sitúa a un punto del Claude Opus 4.6 de Anthropic con un 80,8%.

La programación se ha convertido en la categoría más grande de consumo de tokens en OpenRouter, creciendo del 11 % a más del 50 % del total de tokens hasta 2025. Los flujos de trabajo impulsados ​​por agentes, en los que los modelos ejecutan de forma autónoma tareas de varios pasos, ahora representan más de la mitad de todos los tokens de salida en la plataforma.

  Sonnet 4.6 de Anthropic bate los récords mundiales de SWE-Bench y OS

El director de operaciones de OpenRouter, Chris Clark, afirmó que los modelos chinos de peso abierto tienen una cantidad desproporcionadamente pesada de flujos de agentes gestionados por empresas estadounidenses. Los tres modelos chinos mejor clasificados esta semana están optimizados para la codificación y la automatización de agentes.

El costo sigue siendo un factor definitorio. MiniMax M2.5 cobra 0,30 dólares por millón de tokens de entrada y 1,10 dólares por millón de tokens de salida. GLM-5 tiene un precio de 0,30 dólares por millón de tokens de entrada y 2,55 dólares por millón de tokens de salida. En comparación, Claude Opus 4.6 cuesta 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida, aproximadamente entre 10 y 20 veces más caro.

El consumo total de tokens semanal de OpenRouter ha alcanzado aproximadamente 12,1 billones, un aumento de 12,7 veces respecto al año anterior. La plataforma, fundada por el ex director de tecnología de OpenSea, Alex Atallah, proporciona una puerta de enlace API unificada para más de 400 modelos de más de 60 proveedores.

  Meta ahora usa IA para detectar y eliminar usuarios menores de edad en Instagram y Facebook

Martin Casado, socio de Andreessen Horowitz, estimó que aproximadamente el 80% de las nuevas empresas que utilizan pilas de inteligencia artificial de código abierto ejecutan modelos chinos. MIT Technology Review informó que la adopción de modelos chinos de peso abierto se está acelerando en Silicon Valley.

Crédito de la imagen destacada