El equipo de Qwen ha anunciado el lanzamiento de la instrucción QWEN3-coder-480b y QWEN3-coder-35B, marcando un avance significativo en modelos de código de agente abierto. Estos nuevos modelos están diseñados para mejorar sustancialmente las capacidades de codificación, ofreciendo un diseño arquitectónico robusto y utilidad práctica para tareas de desarrollo de software.
QWEN3-Coder-480b se erige como el modelo de código abierto más grande hasta la fecha, lo que demuestra el rendimiento de última generación (SOTA) en varios puntos de referencia de código. Sus capacidades abarcan la finalización del código, la edición y la generación. Un logro notable para QWEN3-Coder-480B es su rendimiento excepcional en la finalización del código, particularmente en la tarea de relleno en el medio (FIM), donde logró un puntaje PASS@1 de 42.0%. El extenso régimen de capacitación del modelo incluyó más de 3 billones de tokens procedentes de diversos conjuntos de datos, lo que contribuye a su capacidad mejorada para comprender y generar código de manera efectiva. Estos vastos datos de entrenamiento y el tamaño del modelo lo posicionan como una herramienta altamente versátil para los desarrolladores, capaz de manejar un amplio espectro de tareas desde la finalización del código fundamental hasta la intrincada generación de códigos.
Complementando el modelo 480B, el instructo QWEN3-Coder-35B está optimizado específicamente para funcionar como un agente de codificación, proporcionando asistencia a los desarrolladores con requisitos de codificación complejos. Este modelo incorpora características avanzadas, incluida una ventana de contexto de token de 32k. Ha sido capacitado con técnicas especializadas que facilitan el uso perfecto de herramientas externas y llamadas de funciones. Esta funcionalidad permite a los desarrolladores invocar API externas directamente dentro de su entorno de codificación, mejorando así la productividad y simplificando los flujos de trabajo de desarrollo. El modelo de instrucción QWEN3-Coder-35B está diseñado para obtener robustez y eficiencia, lo que lo hace altamente adecuado para aplicaciones de agentes que involucran interacciones complejas.
Los instrucciones QWEN3-Coder-480b y QWEN3-coder-35B ahora son accesibles públicamente en plataformas líderes como abrazar Face y Modelscope. En un movimiento para fomentar la innovación y la colaboración dentro de la comunidad de desarrollo de software impulsada por la IA, el equipo de QWEN tiene todos los códigos asociados, pesos de modelos y documentación integral. Este enfoque de código abierto está destinado a capacitar a los investigadores y desarrolladores para utilizar estos modelos, contribuyendo a su mejora adicional y una adopción más amplia.
Source: Nuevo modelo 480B QWEN Ratea registros de código abierto





