¿Qué es Claude Mythos Preview y por qué se describe como un «momento decisivo»?

Claude Mythos Preview es un modelo de lenguaje de propósito general que marca un salto generacional en la capacidad de la IA para realizar tareas de seguridad informática de extremo a extremo. Anthropic lo califica como un «momento decisivo» (watershed moment) porque es el primer modelo capaz de realizar investigaciones de vulnerabilidades y desarrollar exploits con una eficacia que rivaliza con expertos humanos de élite.

A diferencia de sus predecesores, Mythos no solo identifica errores de escritura, sino que comprende la arquitectura profunda del software, permitiéndole encontrar fallos lógicos en sistemas que han sido auditados durante décadas por humanos, como es el caso de OpenBSD o los kernels de los principales navegadores.

¿Cuál es la diferencia de rendimiento entre Mythos y modelos anteriores como Opus 4.6?

La diferencia es abismal y representa un cambio de paradigma en la autonomía de explotación. Según las pruebas internas de Anthropic:

Opus 4.6: Tenía una tasa de éxito cercana al 0% en el desarrollo autónomo de exploits. En una prueba específica con el motor de JavaScript de Firefox, solo logró 2 exploits funcionales en cientos de intentos.

Mythos Preview: En el mismo examen de Firefox, logró 181 exploits funcionales.

Mientras que los modelos anteriores eran mejores «parcheando» que «atacando», Mythos ha equilibrado la balanza, demostrando que las mejoras en razonamiento general se traducen directamente en una capacidad ofensiva letal.

¿Qué es el «Proyecto Glasswing» y cuál es su relación con este lanzamiento?

El Proyecto Glasswing es la respuesta estratégica de Anthropic para mitigar los riesgos de Mythos. Dado que el modelo es tan potente descubriendo vulnerabilidades, Anthropic decidió no lanzarlo de forma abierta inicialmente.

En su lugar, Glasswing otorga acceso a un grupo limitado de socios industriales críticos y desarrolladores de código abierto. El objetivo es que los «defensores» utilicen a Mythos para encontrar y parchear los agujeros de seguridad en el software más importante del mundo (infraestructuras críticas, navegadores, sistemas operativos) antes de que modelos con capacidades similares caigan en manos de ciberatacantes.

¿Cómo utiliza su razonamiento para identificar vulnerabilidades «Zero-day»?

Claude Mythos identifica Zero-days mediante una comprensión profunda de la «intención del código» frente a su «implementación real». El modelo no busca patrones de texto (como un fuzzer tradicional), sino que:

Analiza la lógica: Entiende, por ejemplo, que una función de login debe denegar el paso a usuarios no autorizados, incluso si el código escrito contiene un bypass sutil.

Hipótesis y experimentación: Actúa como un agente que lee el código, formula una hipótesis de fallo y luego ejecuta el proyecto en un entorno aislado para confirmar si su sospecha es real.

Superación de la memoria: Al encontrar fallos en versiones actuales de software (vulnerabilidades nunca antes vistas), demuestra que no está «recordando» datos de su entrenamiento, sino razonando sobre el código en tiempo real.