Anthropic planea lanzar una versión pública de su modelo de ciberseguridad. Llamado Mitos. Puede encontrar fallas de software más rápido que la mayoría de los equipos humanos. Y es peligroso.
La captura
Aquí está el problema. No tienen salvaguardias.
Aún no. Según su propia admisión. La compañía dijo que nadie en la Tierra ha construido frenos adecuados para un sistema tan potente. No impedirán que los malos hagan un mal uso de él si se escapa demasiado pronto. ¿Entonces el plan? Más despacio. Primero, entregar las llaves a los gobiernos de Estados Unidos y sus aliados. Luego tal vez más tarde para todos los demás.
El Registro cubrió bien la admisión. Anthropic calificó la línea de tiempo como “incierta”. También tiraron por una ventana concreta. De seis a doce meses. Creen que estos modelos de “clase Mythos” estarán ampliamente disponibles entonces. Ampliamente disponible en el mundo de la seguridad cibernética no es exactamente sinónimo de seguridad.
Por qué asusta a la gente
Mythos salió en abril. Las estadísticas son raras. Cuando se probó con puntos de referencia estándar, Mythos generó exploits funcionales el 72% de las veces. ¿El modelo estándar, Claude Opus 4.6? Casi cero por ciento.
Piensa en esa brecha.
Los investigadores que no conocían el código pidieron a la IA que buscara agujeros mientras dormían. Se despertaron. Las hazañas estaban listas. Funcional. Completo. No fue una suposición. Estaba funcionando.
“Los modelos a nivel de mitos se generalizarán”. – Publicación de blog antrópico
Desde entonces escaneó mil proyectos de código abierto. Encontró más de 23,00 defectos. Miles de ellos fueron de alta gravedad o críticos. Un gran error ocurrió en wolfSSL. Esa biblioteca criptográfica se ejecuta en miles de millones de dispositivos. Mythos encontró una manera de falsificar certificados. Los atacantes podrían haber pretendido ser cualquier sitio que visite. Sucedió. El equipo lo arregló. Apenas.
La reacción
Las herramientas de inteligencia artificial encuentran errores más rápido de lo que cualquiera puede solucionarlos.
Los programas de recompensas por errores están muriendo. Algunos se han cerrado por completo porque no pueden soportar el volumen. Los mantenedores del software de código abierto han pedido a Anthropic que haga una pausa. Sólo por un respiro. La avalancha de informes está ahogando su capacidad.
¿Qué sugiere Anthropic? Más IA.
Su propia tarjeta de sistema afirma que los defensores eventualmente ganarán. Los piratas informáticos podrían tener la ventaja ahora. Eso no parece un consuelo para nadie. ¿Quién quiere vivir en el “ahora” mientras los hackers aprenden?
