Un hacker aprovechó el chatbot Claude de Anthropic para atacar agencias gubernamentales mexicanas y robar 150 GB de datos oficiales. La información robada incluía registros de contribuyentes y credenciales de empleados. La empresa de ciberseguridad Gambit Security identificó los ataques, que comenzaron en diciembre y continuaron durante aproximadamente un mes. El hacker utilizó a Claude para encontrar vulnerabilidades en redes gubernamentales, escribir scripts de explotación y automatizar el robo de datos.
El atacante hizo jailbreak a Claude mediante indicaciones para evitar sus barreras de seguridad. El chatbot inicialmente rechazó las solicitudes, pero finalmente accedió. Según Curtis Simpson, director de estrategia de Gambit Security, Claude produjo miles de informes detallados con planes de ataque listos para ejecutar. Estos planes especificaban objetivos internos y credenciales a utilizar.
Anthropic investigó la actividad, la interrumpió y prohibió todas las cuentas involucradas. Un representante de la empresa afirmó que el último modelo, Claude Opus 4.6, incluye herramientas para evitar ese mal uso. El hacker también utilizó ChatGPT de OpenAI para complementar los ataques. Recopilaron información sobre el movimiento de la red, el acceso a credenciales y la forma de evitar la detección. OpenAI identificó los intentos del hacker de violar las políticas de uso y dijo que sus herramientas se negaron a cumplirlas.
El hacker sigue sin ser identificado. Gambit Security sugirió que los ataques podrían estar vinculados a un gobierno extranjero. La intención de los datos robados no está clara. La agencia digital nacional de México no ha hecho comentarios, pero señaló que la ciberseguridad es una prioridad. El gobierno del estado de Jalisco negó haber sido violado y afirmó que solo las redes federales se vieron afectadas. El Instituto Nacional Electoral de México también negó cualquier violación o acceso no autorizado.
Gambit Security encontró al menos 20 vulnerabilidades de seguridad durante su investigación. Esta no es la primera vez que Claude es utilizado en un ciberataque. El año pasado, piratas informáticos en China lo manipularon para infiltrarse en docenas de objetivos globales, algunos de ellos con éxito. Anthropic abandonó recientemente su compromiso de seguridad de larga data, que se comprometía a no entrenar sistemas de inteligencia artificial sin medidas de seguridad adecuadas garantizadas.







