Anthropic presenta un impulso de defensa cibernética de IA con el modelo Mythos

Anthropic lanzó el Proyecto Glasswing, una iniciativa centrada en defender la infraestructura de software global contra las ciberamenazas impulsadas por la IA, además de presentar su modelo de IA, Claude Mythos Preview.

El Proyecto Glasswing tiene como objetivo aprovechar las capacidades de Claude Mythos Preview, que ha demostrado habilidades avanzadas de codificación, superando a la mayoría de los expertos en seguridad humana. El modelo identifica y explota vulnerabilidades de software, lo que marca una evolución significativa en la tecnología de ciberdefensa.

En las pruebas iniciales, Claude Mythos Preview descubrió miles de vulnerabilidades de día cero de alta gravedad en los principales sistemas operativos y navegadores web. Los éxitos clave en la detección incluyen una vulnerabilidad de 27 años en OpenBSD, una falla de 16 años en FFmpeg que había sobrevivido a cinco millones de pruebas automatizadas y múltiples vulnerabilidades en el kernel de Linux que permitieron un acceso escalado de usuarios.

Todas las vulnerabilidades identificadas han sido informadas y parcheadas por desarrolladores relevantes. Para evitar que los malos actores exploten esta tecnología, Anthropic formó la Glasswing Coalition, con socios fundadores como Amazon Web Services, Apple, Google, Microsoft, NVIDIA, Broadcom, Cisco, CrowdStrike, Palo Alto Networks, JPMorganChase y Linux Foundation.

La Casa Blanca considera supervisar los nuevos modelos de IA

Como parte de su compromiso, Anthropic está proporcionando 100 millones de dólares en créditos de uso para Mythos Preview a sus socios y 40 organizaciones adicionales que mantienen infraestructura crítica, junto con una donación de 4 millones de dólares a organizaciones de seguridad de código abierto, incluidas Apache Software Foundation y OpenSSF.

Las evaluaciones internas muestran mejoras significativas en las métricas de desempeño de Claude Mythos Preview. En la prueba CyberGym, el modelo obtuvo una puntuación del 83,1%, frente al 66,6% del anterior Claude Opus 4.6. En la prueba de codificación SWE-bench Verified, logró una precisión del 93,9%, en comparación con el 80,8% de su predecesor.

Anthropic no hará que Claude Mythos Preview esté disponible de forma generalizada debido a riesgos potenciales. El modelo está destinado a aplicaciones de seguridad defensiva, incluidas pruebas de penetración y protección de puntos finales. La estructura de precios para los socios se establecerá en $25 por millón de tokens de entrada y $125 por millón de tokens de salida a través de AWS Bedrock y Vertex AI de Google Cloud.

Daybreak enfrenta a OpenAI contra Anthropic en la carrera de seguridad de la IA

La iniciativa incluye el compromiso de informar los hallazgos públicos dentro de los 90 días. Anthropic se encuentra actualmente en conversaciones con el gobierno de los EE. UU. sobre las implicaciones de seguridad nacional de Claude Mythos Preview. Elia Zaitsev, CTO de CrowdStrike, destacó la urgencia de la colaboración y señaló: “La ventana entre el descubrimiento de una vulnerabilidad y su explotación se ha derrumbado. Esa no es una razón para reducir la velocidad; es una razón para avanzar juntos, más rápido”.

Crédito de imagen destacada

Anthropic presenta un impulso de defensa cibernética de IA con el modelo Mythos

Related Stories

OpenAI finaliza el navegador Atlas para unificar funciones en la nueva aplicación ChatGPT

OpenAI eleva los límites de uso de GPT-5.6 Sol después del aumento de la demanda

Anthropic pospone el muro de pago de Fable 5 por tercera vez

OpenAI lanza la aplicación de productividad laboral ChatGPT con tecnología GPT-5.6