Claude Mythos: Die Waffe ohne Sicherheitsschlösser

по

28.05.2026

Anthropic plant die Veröffentlichung einer öffentlichen Version seines Cybersicherheitsmodells. Genannt Mythos. Es kann Softwarefehler schneller finden als die meisten Menschenteams. Und es ist gefährlich.

Der Haken

Hier liegt das Problem. Sie haben keine Schutzmaßnahmen.

Noch nicht. Nach eigener Aussage. Das Unternehmen sagte, niemand auf der Erde habe geeignete Bremsen für ein so leistungsstarkes System gebaut. Sie werden die Bösewichte nicht davon abhalten, es zu missbrauchen, wenn es zu früh herauskommt. Also der Plan? Machen Sie es langsamer. Übergeben Sie zunächst die Schlüssel an die Regierungen der USA und ihrer Verbündeten. Dann vielleicht später an alle anderen.

Das Register deckte die Zulassung gut ab. Anthropic bezeichnete den Zeitplan als „unsicher“. Sie haben auch ein bestimmtes Fenster herausgeworfen. Sechs bis zwölf Monate. Sie gehen davon aus, dass diese Modelle der „Mythos-Klasse“ dann weit verbreitet sein werden. Die Tatsache, dass sie in der Welt der Cybersicherheit weit verbreitet ist, ist nicht gerade sicher.

Warum es den Menschen Angst macht

Mythos erschien im April. Die Statistiken sind seltsam. Beim Test anhand von Standard-Benchmarks generierte Mythos in 72 % der Fälle funktionierende Exploits. Das Standardmodell, Claude Opus 4. 6? Nahezu null Prozent.

Denken Sie über diese Lücke nach.

Forscher, die keinen Code kannten, baten die KI, im Schlaf nach Löchern zu suchen. Sie sind aufgewacht. Die Heldentaten waren fertig. Funktional. Vollständig. Es war keine Vermutung. Es hat funktioniert.

„Modelle auf Mythos-Ebene werden weit verbreitet sein.“ – Anthropischer Blogbeitrag

Seitdem wurden tausend Open-Source-Projekte gescannt. Es wurden mehr als 23.000 Fehler gefunden. Tausende davon waren von hoher Schwere oder kritisch. Ein großer Fehler war bei wolfSSL. Diese Kryptobibliothek läuft auf Milliarden von Geräten. Mythos hat einen Weg gefunden, Zertifikate zu fälschen. Angreifer könnten sich als jede von Ihnen besuchte Website ausgeben. Es ist passiert. Das Team hat es behoben. Kaum.

Die Gegenreaktion

KI-Tools finden Fehler schneller, als irgendjemand sie beheben kann.

Bug-Bounty-Programme sterben aus. Einige haben komplett abgeschaltet, weil sie der Lautstärke nicht gewachsen sind. Betreuer von Open-Source-Software haben Anthropic gebeten, eine Pause einzulegen. Nur für einen Atemzug. Die Flut an Meldungen erschöpft ihre Kapazitäten.

Was schlägt Anthropic vor? Mehr KI.

Die Verteidiger ihrer eigenen Systemkarte behaupten, dass sie irgendwann gewinnen werden. Hacker könnten jetzt die Oberhand haben. Das fühlt sich für niemanden wie ein Trost an. Wer möchte im „Jetzt“ leben, während Hacker lernen?