Anthropic lanzó su último modelo de IA, Claude Opus 4.7, caracterizado como una “mejora notable” con respecto a Opus 4.6, pero “menos capaz en términos generales” que el inédito Opus Mythos Preview. El nuevo modelo mejora las fortalezas existentes, enfocándose en codificación, ingeniería y tareas de varios pasos.
Claude Opus 4.7 muestra un desempeño superior en el trabajo del conocimiento profesional, afirmando ser “más completo y consistente” en contextos desafiantes. Las pruebas de evaluación comparativa del modelo demuestran sus capacidades, con una puntuación del 64,3 % en codificación agente en SWE-bench Pro y SWE-bench Verified, recuperando la primera posición entre los modelos disponibles públicamente.
En comparación con Opus 4.6, Opus 4.7 también presenta mejoras en el uso agente de la computadora y el razonamiento a nivel de posgrado. Sin embargo, muestra una ligera disminución en las puntuaciones de vulnerabilidad de ciberseguridad, alcanzando un 73,1% frente al 73,8% de la versión anterior. Anthropic señaló que este cambio puede ser el resultado de nuevas salvaguardas destinadas a detectar y bloquear solicitudes de ciberseguridad de alto riesgo.
El lanzamiento de Claude Opus 4.7 parece promover Claude Mythos Preview, que ha demostrado un rendimiento superior en los principales puntos de referencia, pero actualmente está disponible sólo para organizaciones selectas. Anthropic enfatizó que las capacidades cibernéticas de Opus 4.7 no coinciden con las de Mythos Preview.
“Dijimos que mantendríamos limitado el lanzamiento de Claude Mythos Preview y probaríamos primero nuevas protecciones cibernéticas en modelos menos capaces”, afirmó la compañía. “Opus 4.7 es el primer modelo de este tipo: sus capacidades cibernéticas no son tan avanzadas como las de Mythos Preview”.
Claude Opus 4.7 está disponible de inmediato en todos los productos Claude y a través de la API de la empresa, manteniendo el mismo precio que los modelos anteriores.








