Z.ai, anteriormente conocida como Zhipu AI, lanzó el modelo GLM-5.1 el martes. Este modelo insignia de código abierto está diseñado para ingeniería agente y puede manejar de forma autónoma una única tarea de codificación durante hasta ocho horas, realizando planificación, ejecución, pruebas y optimización en un bucle continuo.
El modelo GLM-5.1 obtuvo una puntuación de 58,4 en el punto de referencia SWE-Bench Pro, superando a GPT-5.4, Claude Opus 4.6 y Gemini 3.1 Pro. Este lanzamiento sigue a un refinamiento posterior al entrenamiento de GLM-5, que se presentó en febrero como un modelo de mezcla de expertos de 744 mil millones de parámetros, que utiliza aproximadamente 40 mil millones de parámetros activos por token y se entrenó completamente en chips Huawei Ascend sin hardware Nvidia.
Según la documentación de Z.ai, GLM-5.1 mejora las capacidades de codificación y agencia a través de técnicas como el ajuste fino supervisado de tareas múltiples y etapas de aprendizaje de refuerzo. El modelo es capaz de sostener una ejecución autónoma de ocho horas, completando un ciclo completo de “experimentar-analizar-optimizar”. En las demostraciones, construyó con éxito un sistema de escritorio Linux completo desde cero en ocho horas, ejecutando 655 iteraciones y aumentando el rendimiento de las consultas de bases de datos vectoriales en 6,9 veces.
GLM-5.1 presenta una ventana de contexto de 200 000 tokens y admite hasta 128 000 tokens de salida. Ha sido optimizado para flujos de trabajo de codificación agente y es compatible con herramientas como Claude Code y OpenClaw. El modelo logró una aceleración media geométrica de 3,6 veces en cargas de trabajo de aprendizaje automático reales en el punto de referencia de optimización KernelBench Nivel 3.
GLM-5.1 está disponible para todos los suscriptores del GLM Coding Plan, y sus pesos se publican bajo una licencia del MIT. Z.ai, que salió a bolsa en la Bolsa de Valores de Hong Kong en enero con una valoración de 31.300 millones de dólares, ofrece acceso API para GLM-5.1 a un coste de 1 dólar por millón de tokens de entrada y 3,20 dólares por millón de tokens de salida.
El lanzamiento intensifica la competencia en el espacio del modelo de codificación de código abierto, posicionando a GLM-5.1 a la vanguardia del SWE-Bench Pro por delante de sus homólogos de código cerrado. Si bien Z.ai afirma que las capacidades del modelo están alineadas con Claude Opus 4.6, evaluaciones independientes muestran que logra aproximadamente el 94,6 por ciento de la puntuación de codificación más amplia de Opus 4.6, lo que indica algunas lagunas en el razonamiento y las tareas creativas.








