Anthropic is van plan een publieke versie van zijn cyberbeveiligingsmodel te lanceren. Mythos genoemd. Het kan softwarefouten sneller vinden dan de meeste teams van mensen. En het is gevaarlijk.
De vangst
Hier is het probleem. Ze hebben geen waarborgen.
Nog niet. Naar eigen zeggen. Het bedrijf zei dat niemand op aarde adequate remmen heeft gebouwd voor een systeem dat zo krachtig is. Ze zullen de slechteriken er niet van weerhouden het te misbruiken als het te snel naar buiten komt. Dus het plan? Vertraag het. Geef eerst de sleutels aan de Amerikaanse en geallieerde regeringen. Dan misschien later voor iedereen.
Het register dekte de toelating goed. Anthropic noemde de tijdlijn ‘onzeker’. Ze gooiden ook een specifiek raam eruit. Zes tot twaalf maanden. Ze denken dat deze ‘Mythos-klasse’-modellen dan overal verkrijgbaar zullen zijn. Algemeen beschikbaar in de cyberbeveiligingswereld schreeuwt niet bepaald veilig.
Waarom het mensen bang maakt
Mythos kwam in april uit. De statistieken zijn raar. Wanneer Mythos werd getest met standaardbenchmarks, genereerde het in 72% van de gevallen werkende exploits. Het standaardmodel, Claude Opus 4. 6? Bijna nul procent.
Denk eens aan die kloof.
Onderzoekers die de code niet kenden, vroegen de AI om gaten te zoeken terwijl ze sliepen. Ze werden wakker. De exploits waren klaar. Functioneel. Compleet. Het was niet gissen. Het werkte.
“Modellen op Mythos-niveau zullen wijdverbreid worden.” – Antropische blogpost
Sindsdien heeft het duizend open-sourceprojecten gescand. Er werden meer dan 23.00 gebreken gevonden. Duizenden daarvan waren zeer ernstig of kritiek. Een grote misser was bij wolfSSL. Die cryptobibliotheek draait op miljarden apparaten. Mythos heeft een manier gevonden om certificaten te vervalsen. Aanvallers hadden zich kunnen voordoen als elke site die u bezoekt. Het gebeurde. Het team heeft het opgelost. Nauwelijks.
De terugslag
AI-tools vinden bugs sneller dan iemand ze kan repareren.
Bug bounty-programma’s sterven. Sommigen zijn volledig afgesloten omdat ze het volume niet aankunnen. Beheerders van open-sourcesoftware hebben Anthropic gevraagd te pauzeren. Gewoon even op adem komen. De stroom aan rapporten verdrinkt hun capaciteit.
Wat suggereert Anthropic? Meer AI.
Hun eigen systeemkaart beweert dat verdedigers uiteindelijk zullen winnen. Hackers hebben nu misschien de overhand. Dat voelt voor niemand als een troost. Wie wil er in het ‘nu’ leven terwijl hackers leren?
