El grupo habría conseguido acceso al sistema el mismo día de su presentación, tras deducir su ubicación en línea a partir de información filtrada luego de una brecha de seguridad sufrida por la firma de análisis de datos Mercor.
Desde entonces, los integrantes han utilizado Mythos de manera recurrente, aunque no con fines de ciberseguridad, según la persona citada por Bloomberg. Esta versión fue respaldada con capturas de pantalla y un video en vivo que muestran el uso del sistema presuntamente por usuarios del canal de Discord.
El potencial dañino de Mythos
Aunque el reporte sostiene que el grupo que accedió sin autorización “está interesado en experimentar con nuevos modelos, no en causar daños”, la situación despierta inquietudes frente a las advertencias emitidas por el propio equipo de Anthropic.
Claude Mythos es un modelo de propósito general con capacidades avanzadas de razonamiento, autonomía y programación, que supera a otros sistemas desarrollados por la compañía. En pruebas internas, mostró mejoras significativas en estas áreas, así como en la generación y gestión de código en comparación con su antecesor. No obstante, estas capacidades derivaron en un efecto inesperado, es decir, el sistema demostró una notable eficacia para identificar fallas y vulnerabilidades de software.
De acuerdo con documentos técnicos de Anthropic, Claude Mythos no solo puede detectar fallas con más de dos décadas de antigüedad, sino también identificar y explotar vulnerabilidades de día cero en sistemas operativos y navegadores web, además de generar exploits incluso de forma autónoma.
La empresa advierte que, debido a estas capacidades, personas sin conocimientos técnicos avanzados pueden llegar a emplear el sistema para descubrir y explotar vulnerabilidades complejas.
iniciativa denominada Proyecto Glasswing, en la que se busca desarrollar aplicaciones orientadas a la defensa cibernética frente a amenazas altamente sofisticadas.Logan Graham, líder del equipo de pruebas de penetración de Anthropic, señaló en una entrevista con WIRED que el desarrollo de Mythos representa un cambio relevante para el sector de la ciberseguridad, ya que el modelo puede funcionar tanto como herramienta defensiva como potencial amenaza, con alcances que aún no se comprenden completamente.
“Debemos prepararnos desde ahora para un escenario en el que estas capacidades estén ampliamente disponibles en seis, 12 o 24 meses. Muchos de los supuestos sobre los que hemos construido los paradigmas modernos de seguridad podrían dejar de ser válidos. Hemos visto cómo Mythos Preview lograba tareas comparables a las de un investigador de seguridad de alto nivel. Esto tiene implicaciones muy profundas sobre la forma en que deben liberarse capacidades como esta. Si no se hace con cuidado, podría convertirse en un acelerador significativo para los atacantes”, concluyó el ejecutivo.