Anthropic hat die Karten neu gemischt. Claude Mythos 5 – das neue Flaggschiff-Modell – führt 17 von 18 öffentlichen Benchmarks an, soll rund 10 Billionen Parameter haben und kann autonom Sicherheitslücken finden, die kein Mensch vorher kannte. Das ist kein Marketing-Hype. Das ist ein Paradigmenwechsel.
Was ist Claude Mythos 5?
Claude Mythos 5 ist das leistungsstärkste Modell von Anthropic – und nach aktuellen Benchmarks das leistungsstärkste kommerziell verfügbare KI-Modell überhaupt. Es ist der Nachfolger der Claude 3.5/4-Reihe und markiert einen Sprung, den viele Experten erst für 2027 erwartet hatten.
Die wichtigsten Fakten:
- Parameter: Geschätzt 10 Billionen (10T) – das größte kommerzielle LLM
- Benchmarks: Führt 17 von 18 öffentlichen Benchmarks an
- Fähigkeit: Autonomes Finden von Zero-Day-Schwachstellen
- Kontext: Erweitertes Kontextfenster für komplexe Aufgaben
- Sicherheit: Constitutional AI 2.0 mit verschärften Guardrails
- Verfügbar: Über Claude.ai, Claude Pro und die Anthropic API
Warum 10 Billionen Parameter wichtig sind
Parameter sind – stark vereinfacht – die “Synapsen” eines KI-Modells. Mehr Parameter bedeuten nicht automatisch bessere Ergebnisse, aber sie ermöglichen tieferes Verständnis und differenziertere Antworten.
Zum Vergleich:
| Modell | Geschätzte Parameter |
|---|---|
| Claude Mythos 5 | ~10 Billionen |
| GPT-5.4 | Nicht veröffentlicht |
| Gemini 3.1 Ultra | Nicht veröffentlicht |
| Llama 4 (größtes) | 400 Milliarden |
| Claude 3.5 Sonnet | ~175 Milliarden |
Der Sprung von hunderten Milliarden auf 10 Billionen ist nicht inkrementell. Es ist eine andere Größenordnung. Und offenbar zahlt sich das aus – die Benchmark-Ergebnisse sprechen eine deutliche Sprache.
17 von 18 Benchmarks: Die Dominanz in Zahlen
Claude Mythos führt in fast allen relevanten Benchmark-Kategorien. Das ist nicht normal. Typischerweise hat jedes Modell seine Stärken und Schwächen. Dass ein einziges Modell fast flächendeckend dominiert, ist ein Novum.
Bereiche in denen Mythos führt
- Reasoning: Mathematisches und logisches Denken
- Coding: Programmierung über alle gängigen Sprachen
- Textverständnis: Analyse komplexer Dokumente
- Instruktionsbefolgung: Präzise Umsetzung detaillierter Anweisungen
- Mehrsprachigkeit: Deutsch, Französisch, Japanisch und weitere Sprachen
- Wissenschaft: GPQA und andere Wissenschafts-Benchmarks
- Agentisches Handeln: Mehrstufige, autonome Aufgabenbearbeitung
Wo Mythos nicht führt
Den einen Benchmark, in dem Mythos nicht auf Platz 1 steht, hat Google Gemini 3.1 Ultra für sich entschieden – mit 94,3% beim GPQA Diamond Test (ein anspruchsvoller Wissenschafts-Benchmark). Das zeigt: Auch die Konkurrenz schläft nicht.
Autonome Zero-Day-Erkennung: Chance und Risiko
Die vielleicht beeindruckendste – und beunruhigendste – Fähigkeit von Claude Mythos: Es kann eigenständig bisher unbekannte Sicherheitslücken in Software finden. Sogenannte Zero-Day-Schwachstellen, für die es noch keinen Patch gibt.
Was das konkret bedeutet
- Für Cybersecurity: Unternehmen können ihre Systeme von KI prüfen lassen, bevor Angreifer zuschlagen
- Für Bug-Bounty-Jäger: Claude Mythos als Werkzeug für Sicherheitsforscher
- Für die Branche: Wenn KI Schwachstellen findet, können das auch böswillige Akteure nutzen
Anthropic hat diese Fähigkeit bewusst kommuniziert und gleichzeitig verschärfte Sicherheitsmaßnahmen implementiert. Das Modell wird nicht ohne Weiteres offensive Exploits generieren. Aber die Tatsache, dass die Fähigkeit existiert, verändert die Diskussion um KI-Sicherheit fundamental.
Capabara: Das Mid-Size-Modell
Parallel zu Mythos hat Anthropic Capabara vorgestellt – ein mittelgroßes Modell, das die Lücke zwischen dem kostengünstigen Haiku und dem leistungsstarken Mythos füllt.
| Eigenschaft | Haiku | Capabara | Mythos |
|---|---|---|---|
| Geschwindigkeit | Sehr schnell | Schnell | Mittel |
| Qualität | Gut | Sehr gut | Herausragend |
| Kosten (API) | Niedrig | Mittel | Hoch |
| Anwendung | Einfache Aufgaben | Allround | Komplexe Aufgaben |
Wann Capabara die richtige Wahl ist:
- Du brauchst gute Qualität, aber nicht die absolute Spitze
- API-Kosten spielen eine Rolle
- Geschwindigkeit ist wichtiger als maximale Tiefe
- Routine-Aufgaben wie Zusammenfassungen, Übersetzungen, Standard-Code
Wann du Mythos brauchst:
- Komplexe Reasoning-Aufgaben
- Autonome Agenten-Workflows
- Code-Reviews und Sicherheitsanalysen
- Wissenschaftliche Fragestellungen
- Alles wo das letzte Prozent zählt
Anthropic als Unternehmen: Die Zahlen
Hinter Claude steht Anthropic – und das Unternehmen hat sich 2026 zur ernsthaften Kraft im KI-Markt entwickelt.
- Geschätzter Jahresumsatz: ~19 Milliarden Dollar
- Mitarbeiter: Über 1.500
- Investoren: Google, Amazon, Spark Capital
- Bewertung: Über 100 Milliarden Dollar
Zum Vergleich: OpenAI wird auf ~25 Milliarden Dollar Jahresumsatz geschätzt. Anthropic holt mit großen Schritten auf. Und anders als OpenAI hat Anthropic nie versucht, alles für alle zu sein. Der Fokus liegt auf Sicherheit und Leistung – nicht auf Gadgets und Marktplätzen.
Warum Anthropics Ansatz funktioniert
Anthropic wurde 2021 von ehemaligen OpenAI-Mitarbeitern gegründet – unter anderem von Dario und Daniela Amodei. Ihr Kernargument damals: KI-Sicherheit muss von Anfang an mitgedacht werden, nicht nachträglich draufgeschraubt.
Das zeigt sich bei Mythos:
- Constitutional AI 2.0: Das Modell hat internalisierte Werte, die es auch ohne externe Filter sicher machen
- Transparenz: Anthropic veröffentlicht regelmäßig Sicherheitsberichte
- Responsible Disclosure: Die Zero-Day-Fähigkeit wurde proaktiv kommuniziert
- Stufenweises Deployment: Mythos wurde nicht über Nacht für alle freigeschaltet
Praktische Anwendungen: Wofür du Mythos nutzen kannst
Texterstellung und Content
Claude war schon immer stark bei Texten. Mythos hebt das auf ein neues Level. Lange, kohärente Artikel. Präzise Zusammenfassungen. Ton und Stil werden besser getroffen als bei jedem anderen Modell.
Programmierung
Von der Einzelfunktion bis zum kompletten Refactoring – Mythos versteht Code-Kontexte besser und generiert weniger Fehler. Besonders bei komplexen, mehrstufigen Coding-Aufgaben zeigt sich der Vorsprung.
Analyse und Reasoning
Finanzberichte durcharbeiten, wissenschaftliche Papers zusammenfassen, strategische Entscheidungen abwägen – hier spielt Mythos seine Parameterstärke voll aus.
Autonome Agenten
Mit Claude Code und der Anthropic API lassen sich Agenten bauen, die eigenständig mehrstufige Aufgaben erledigen. Mythos als “Gehirn” dieser Agenten macht sie deutlich zuverlässiger.
Was Mythos nicht kann
Trotz aller Superlative – kein Modell ist perfekt:
- Kein Echtzeit-Wissen: Mythos hat einen Wissens-Cutoff und keinen nativen Web-Zugang (anders als Gemini oder Perplexity)
- Halluzinationen: Seltener als bei anderen Modellen, aber nicht eliminiert
- Geschwindigkeit: 10 Billionen Parameter brauchen Rechenpower – Mythos ist langsamer als kleinere Modelle
- Kosten: Die API-Nutzung ist teurer als bei GPT-4o oder Gemini Flash
- Ökosystem: ChatGPT hat mehr Plugins, Integrationen und Drittanbieter-Tools
Ausblick: Was kommt nach Mythos?
Anthropic hat angedeutet, dass Mythos erst der Anfang einer neuen Modell-Generation ist. Die Kombination aus Constitutional AI, extremer Skalierung und agentischen Fähigkeiten deutet auf eine Zukunft hin, in der KI-Modelle nicht nur antworten, sondern aktiv handeln.
Für dich als Nutzer bedeutet das:
- Jetzt testen: Claude Pro für 20$/Monat gibt dir Zugang zu Mythos
- Workflows anpassen: Aufgaben die bisher zu komplex für KI waren, nochmal testen
- Kosten im Blick: Capabara für den Alltag, Mythos für die schweren Fälle
- Sicherheit ernst nehmen: Die Fähigkeiten wachsen – deine Verantwortung im Umgang damit auch
Weiterlesen:
- ChatGPT vs Claude: Der große Vergleich
- Die besten ChatGPT-Alternativen 2026
- Was ist ein LLM? Große Sprachmodelle erklärt
- KI-Agenten erklärt: Was sind AI Agents?
