A Anthropic está planejando lançar uma versão pública de seu modelo de segurança cibernética. Chamado Mythos. Ele pode encontrar falhas de software mais rapidamente do que a maioria das equipes humanas. E é perigoso.

A captura

Aqui está o problema. Eles não têm salvaguardas.

Ainda não. Por sua própria admissão. A empresa disse que ninguém na Terra construiu freios adequados para um sistema tão potente. Eles não impedirão que os bandidos o utilizem indevidamente se ele escapar muito cedo. Então o plano? Diminua a velocidade. Primeiro, entregue as chaves aos governos dos EUA e aliados. Então talvez mais tarde para todos os outros.

O Register cobriu bem a admissão. A Anthropic chamou a linha do tempo de “incerta”. Eles também abriram uma janela específica. Seis a doze meses. Eles acham que esses modelos da “classe Mythos” estarão amplamente disponíveis então. Amplamente disponível no mundo da segurança cibernética não significa exatamente segurança.

Por que isso assusta as pessoas

Mythos foi lançado em abril. As estatísticas são estranhas. Quando testado em benchmarks padrão, o Mythos gerou explorações funcionais 72% das vezes. O modelo padrão, Claude Opus 4. 6? Perto de zero por cento.

Pense nessa lacuna.

Pesquisadores que não conheciam o código pediram à IA que procurasse buracos enquanto dormiam. Eles acordaram. As façanhas estavam prontas. Funcional. Completo. Não foi adivinhação. Estava funcionando.

“Os modelos no nível do Mito se tornarão difundidos.” – Postagem no blog antrópico

Desde então, examinou milhares de projetos de código aberto. Ele encontrou mais de 23.000 falhas. Milhares deles eram de alta gravidade ou críticos. Uma grande falha foi no wolfSSL. Essa biblioteca criptográfica funciona em bilhões de dispositivos. Mythos encontrou uma maneira de falsificar certificados. Os invasores podem ter fingido ser qualquer site que você visita. Aconteceu. A equipe consertou. Por muito pouco.

A reação

As ferramentas de IA encontram bugs mais rápido do que qualquer um consegue corrigi-los.

Os programas de recompensa por bugs estão morrendo. Alguns desligaram completamente porque não conseguem controlar o volume. Os mantenedores do software de código aberto pediram à Anthropic que fizesse uma pausa. Só para respirar. A enxurrada de relatórios está afogando a sua capacidade.

O que Antrópico sugere? Mais IA.

Seu próprio cartão de sistema afirma que os defensores acabarão vencendo. Os hackers podem estar em vantagem agora. Isso não parece um conforto para ninguém. Quem quer viver no “agora” enquanto os hackers aprendem?