Si bien la compañía cuenta con medidas de seguridad para evitar que sus modelos de IA sean manipulados con este fin, los 'hackers' lograron burlarlas. Para lograr su objetivo le pidieron que simulara ser un empleado de una empresa legítima de ciberseguridad que realizaba pruebas.
Una vez comprometido, el sistema de IA identificó bases de datos valiosas, generó códigos para aprovechar sus vulnerabilidades, recopilar credenciales y creó puertas traseras que permitían un acceso más profundo para robar los datos. Entre el 80 y el 90 % de las operaciones implicadas en el ataque se realizaron sin intervención humana, detalla Anthropic.
No obstante, la compañía afirmó que solo una parte de los intentos de infiltración tuvieron éxito y que logró actuar con rapidez para cerrar las cuentas comprometidas y notificar a las entidades afectadas. No se detalló el nombre de las entidades afectadas ni qué se logró sustraer exactamente.
El informe sugiere que los piratas tenían vínculos con el Gobierno chino. Sin embargo, agencias independientes aún no han confirmado esa atribución. El portavoz de la Embajada china en EE.UU., Liu Pengyu, indicó que se trata de una "especulación infundada". "China se opone firmemente y combate todas las formas de ciberataques de conformidad con la ley", afirmó, citado por Fox.