Anthropic lanzó el Proyecto Glasswing, una iniciativa centrada en defender la infraestructura de software global contra las ciberamenazas impulsadas por la IA, además de presentar su modelo de IA, Claude Mythos Preview.
El Proyecto Glasswing tiene como objetivo aprovechar las capacidades de Claude Mythos Preview, que ha demostrado habilidades avanzadas de codificación, superando a la mayoría de los expertos en seguridad humana. El modelo identifica y explota vulnerabilidades de software, lo que marca una evolución significativa en la tecnología de ciberdefensa.
En las pruebas iniciales, Claude Mythos Preview descubrió miles de vulnerabilidades de día cero de alta gravedad en los principales sistemas operativos y navegadores web. Los éxitos clave en la detección incluyen una vulnerabilidad de 27 años en OpenBSD, una falla de 16 años en FFmpeg que había sobrevivido a cinco millones de pruebas automatizadas y múltiples vulnerabilidades en el kernel de Linux que permitieron un acceso escalado de usuarios.
Todas las vulnerabilidades identificadas han sido informadas y parcheadas por desarrolladores relevantes. Para evitar que los malos actores exploten esta tecnología, Anthropic formó la Glasswing Coalition, con socios fundadores como Amazon Web Services, Apple, Google, Microsoft, NVIDIA, Broadcom, Cisco, CrowdStrike, Palo Alto Networks, JPMorganChase y Linux Foundation.
Como parte de su compromiso, Anthropic está proporcionando 100 millones de dólares en créditos de uso para Mythos Preview a sus socios y 40 organizaciones adicionales que mantienen infraestructura crítica, junto con una donación de 4 millones de dólares a organizaciones de seguridad de código abierto, incluidas Apache Software Foundation y OpenSSF.
Las evaluaciones internas muestran mejoras significativas en las métricas de desempeño de Claude Mythos Preview. En la prueba CyberGym, el modelo obtuvo una puntuación del 83,1%, frente al 66,6% del anterior Claude Opus 4.6. En la prueba de codificación SWE-bench Verified, logró una precisión del 93,9%, en comparación con el 80,8% de su predecesor.
Anthropic no hará que Claude Mythos Preview esté disponible de forma generalizada debido a riesgos potenciales. El modelo está destinado a aplicaciones de seguridad defensiva, incluidas pruebas de penetración y protección de puntos finales. La estructura de precios para los socios se establecerá en $25 por millón de tokens de entrada y $125 por millón de tokens de salida a través de AWS Bedrock y Vertex AI de Google Cloud.
La iniciativa incluye el compromiso de informar los hallazgos públicos dentro de los 90 días. Anthropic se encuentra actualmente en conversaciones con el gobierno de los EE. UU. sobre las implicaciones de seguridad nacional de Claude Mythos Preview. Elia Zaitsev, CTO de CrowdStrike, destacó la urgencia de la colaboración y señaló: “La ventana entre el descubrimiento de una vulnerabilidad y su explotación se ha derrumbado. Esa no es una razón para reducir la velocidad; es una razón para avanzar juntos, más rápido”.








