image

Anthropic publicó un análisis de 832 cuentas baneadas por actividad maliciosa que muestra cómo la inteligencia artificial está transformando la escala, autonomía y sofisticación de los ciberataques 

Entre marzo de 2025 y marzo de 2026, Anthropic ha baneado 832 cuentas por actividad cibernética maliciosa y analizó sus patrones de ataque. Los resultados fueron parcialmente publicados en el Informe de Investigación de Brechas de Datos 2026 de Verizon. Lo cierto es que a medida que los modelos de IA se vuelven más capaces, también se vuelven más útiles para atacantes de cualquier nivel técnico.

El número que lo define todo

En el primer semestre del período analizado, el 33% de los actores maliciosos que usaron IA fueron clasificados como riesgo medio o alto. Seis meses después, esa cifra era el 56%. Un aumento de 1,7 veces en medio año. 

Ese dato es la síntesis del reporte que Anthropic publicó el 3 de junio, basado en el análisis de 832 cuentas baneadas por actividad cibernética maliciosa entre marzo de 2025 y marzo de 2026. Las conclusiones rediseñan cómo entender las amenazas digitales en la era de la inteligencia artificial. 

La IA ya no solo abre puertas: opera dentro 

Los resultados arrojaron que el uso más común de la IA entre los atacantes es escribir malwares. El 67,3% de los actores la usaron para ese fin. Pero el cambio más preocupante es otro. Históricamente, las técnicas avanzadas que los atacantes usan una vez que ya están dentro de un sistema (movimiento lateral, descubrimiento de cuentas, escalada de privilegios) requerían alto nivel técnico. Ahora la IA las ejecuta por actores sin esa habilidad. 

El uso de IA para descubrimiento de cuentas dentro de redes comprometidas subió un 8,9%, mientras el phishing (técnica de acceso inicial) cayó un 8,6%. Los atacantes están usando IA cada vez más profundo en el ciclo del ataque, no solo para entrar. 

Los equipos de seguridad históricamente evaluaban el nivel de riesgo de un atacante según cuántas técnicas diferentes usaba y qué herramientas empleaba. Ese método ya no funciona. 

Los atacantes menos hábiles del dataset usaron un promedio de 16 técnicas distintas. Los más hábiles, 20. La diferencia es mínima porque la IA nivela el campo. Ahora mismo, lo que diferencia  a los atacantes más peligrosos no es cuántas técnicas usan, sino qué arquitectura construyen. Ya que ponen el foco en sistemas donde la IA encadena etapas del ataque y las ejecuta con mínima intervención humana. 

Una señal de gran alarma

MITRE ATT&CK es el estándar global que usan los equipos de ciberseguridad para clasificar amenazas. Sin embargo, Anthropic descubrió que su sistema no incluye la orquestación autónoma mediante IA, que es exactamente la técnica más peligrosa que observaron. 

También remarcan el caso más intenso que han registrado. Una operación de espionaje cibernético estatal desarticulada en noviembre de 2025 usó Claude Code de forma autónoma para intentar infiltrar objetivos globales con mínima intervención humana. El actor usó 30 técnicas en 13 tácticas, lo que lo clasificaría como riesgo medio según el framework estándar. Su puntuación real fue de 100 sobre 100. Anthropic está en conversaciones con MITRE para actualizar el framework. 

Conclusión

Este no es solo un reporte con nivel académico, sino que contiene información que podría llegar a evitar miles de casos delictivos. Lo bueno es que las conclusiones ya están informando los sistemas de protección que Anthropic integra en sus modelos. 

Lo cierto es que la carrera entre atacantes y defensores se aceleró, y la IA está en los dos lados del tablero.

Por Rous Espindola

Rous Espindola, parte del equipo de Cripto La Plata, Community Manager para proyectos web3, con 4 años de experiencia en crecimiento de comunidades digitales.Periodista y escritora. BD & comms en Cripto La Plata. Entusiasta en DeFi y Gobernanza. Embajadora de Arbitrum en Argentina.