Google hat nachgelegt. Gemini 3.1 ist nicht nur ein inkrementelles Update – es bringt Features die es so bei keinem Konkurrenten gibt. Interaktive 3D-Visualisierungen im Chat, Echtzeit-Multimodalität und ein Flash-Lite das 2,5-mal schneller ist als sein Vorgänger. Hier ist alles was du wissen musst.
Die Highlights auf einen Blick
| Feature | Was ist neu |
|---|---|
| Ultra: 94,3% GPQA Diamond | Bester Wert aller KI-Modelle bei Wissenschaft |
| Intelligence Index 57 | Gleichauf mit GPT-5.4 |
| Flash-Lite | 2,5x schneller als Vorgänger |
| Interaktive Visualisierungen | 3D-Modelle und Physik-Sims im Chat |
| Echtzeit Sprache + Bild | Multimodale Konversation live |
| Notebooks | Persistente Wissensräume |
| Erweitertes Kontextfenster | 1M+ Tokens |
Gemini 3.1 Ultra: Das Flaggschiff
94,3% bei GPQA Diamond
GPQA Diamond ist einer der härtesten KI-Benchmarks. Er testet Wissen und Reasoning auf PhD-Niveau in Physik, Chemie und Biologie. Gemini 3.1 Ultra erreicht 94,3% – mehr als jedes andere Modell. Ja, auch mehr als Claude Mythos.
| Modell | GPQA Diamond |
|---|---|
| Gemini 3.1 Ultra | 94,3% |
| Claude Mythos | Sehr hoch (unter 94,3%) |
| GPT-5.4 | Hoch |
| Muse Spark | Mittel |
Was das bedeutet: Für wissenschaftliche Fragestellungen, medizinische Recherche und akademische Arbeit ist Gemini 3.1 Ultra aktuell die beste Wahl.
Intelligence Index 57
Der Artificial Analysis Intelligence Index aggregiert verschiedene Benchmarks zu einer Gesamtbewertung. Gemini 3.1 erreicht 57 – exakt gleichauf mit GPT-5.4. Claude Mythos wird anders gemessen (Benchmark-Führerschaft statt Index), liegt aber in der gleichen Liga.
Was der Score bedeutet:
| Score-Bereich | Einordnung |
|---|---|
| 50-54 | Sehr gut (z.B. Muse Spark: 52) |
| 55-57 | Spitzenklasse (GPT-5.4, Gemini 3.1) |
| 58+ | Noch nicht erreicht |
Flash-Lite: 2,5x schneller
Nicht jede Aufgabe braucht das größte Modell. Flash-Lite ist Googles Antwort auf die Frage: Wie schnell und günstig kann KI sein, ohne dass die Qualität zu stark leidet?
Was Flash-Lite bietet
- Geschwindigkeit: 2,5x schneller als der Vorgänger
- Kosten: Deutlich günstiger als Pro oder Ultra (API)
- Qualität: Für die meisten Alltagsaufgaben ausreichend
- Kontext: Großes Kontextfenster auch in der Lite-Version
Wann du Flash-Lite nutzen solltest
| Aufgabe | Flash-Lite geeignet? |
|---|---|
| Kurze Fragen beantworten | Ja |
| E-Mails zusammenfassen | Ja |
| Einfache Übersetzungen | Ja |
| Code-Snippets generieren | Ja |
| Komplexe Analysen | Besser: Pro oder Ultra |
| Wissenschaftliche Recherche | Besser: Ultra |
| Kreative lange Texte | Besser: Pro |
Kosten-Vergleich (API)
| Modell | Input (1M Tokens) | Output (1M Tokens) | Geschwindigkeit |
|---|---|---|---|
| Flash-Lite | Am günstigsten | Am günstigsten | Am schnellsten |
| Flash | Günstig | Günstig | Schnell |
| Pro | Mittel | Mittel | Mittel |
| Ultra | Teuer | Teuer | Langsam |
Für Entwickler die APIs nutzen: Flash-Lite ist das “Haiku” von Google – extrem günstig, extrem schnell, überraschend fähig.
Interaktive Visualisierungen
Das spektakulärste neue Feature. Gemini 3.1 kann direkt im Chat interaktive Inhalte rendern:
3D-Modelle
Frag Gemini nach der Struktur eines Moleküls – und du bekommst ein drehbares 3D-Modell. Frag nach der Anatomie eines Herzens – und du kannst es von allen Seiten betrachten.
So funktioniert es:
- Du stellst eine Frage die eine visuelle Antwort nahelegt
- Gemini erkennt das und generiert eine interaktive Visualisierung
- Du kannst das Modell im Chat drehen, zoomen und manipulieren
- Optional: Export als Bild oder Link
Physik-Simulationen
“Zeig mir wie ein Pendel mit doppelter Masse schwingt” – und Gemini erstellt eine Live-Simulation im Chat. Du kannst Parameter ändern (Masse, Schwerkraft, Dämpfung) und die Auswirkungen in Echtzeit sehen.
Daten-Visualisierungen
Tabellen und Zahlen werden zu interaktiven Charts. Du kannst Filter setzen, Zeiträume anpassen und zwischen Diagramm-Typen wechseln – alles ohne ein separates Tool.
Warum das wichtig ist
Bisher war KI textbasiert. Bilder waren statisch. Interaktive Visualisierungen machen KI zu einem Werkzeug für Verständnis, nicht nur für Information. Besonders für Bildung, Wissenschaft und Datenanalyse ist das ein Gamechanger.
Echtzeit Sprache + Bild
Gemini 3.1 kann gleichzeitig sehen und sprechen – in Echtzeit. Du zeigst der KI etwas über die Kamera, und sie reagiert sofort per Sprache.
Anwendungsbeispiele
- Kochen: Halte ein Rezept vor die Kamera, Gemini liest es vor und gibt Tipps
- Reparatur: Zeige ein defektes Gerät, Gemini erklärt was kaputt sein könnte
- Einkaufen: Fotografiere ein Produkt im Laden, Gemini vergleicht Preise
- Lernen: Zeige eine Mathe-Aufgabe, Gemini erklärt den Lösungsweg live
- Reisen: Richte die Kamera auf eine Sehenswürdigkeit, Gemini erzählt die Geschichte
Technische Umsetzung
Gemini 3.1 verarbeitet Sprache, Bilder und Text in einem einzigen Modell – nativ multimodal. Es sind keine separaten Module die zusammengesteckt werden. Das macht die Echtzeit-Reaktion flüssig und natürlich.
Grenzen
- Benötigt stabile Internetverbindung (Verarbeitung in der Cloud)
- Funktioniert am besten auf Pixel-Phones und Android (iOS folgt)
- Nicht in allen Ländern verfügbar (Deutschland: Ja)
- Datenschutz: Kamera-Daten werden an Google-Server gesendet
Notebooks: Persistente Wissensräume
Ein komplett neues Konzept in Gemini. Jede Konversation kann zu einem persistenten Notebook werden:
- Dateien hochladen und dauerhaft im Kontext halten
- Custom Instructions pro Notebook
- Alte Chats verschieben in Notebooks
- Sync mit NotebookLM für tiefgehende Quellenanalyse
- Teilen mit anderen Nutzern
Mehr Details findest du in unserem separaten Artikel zu Gemini Notebooks.
Was Gemini 3.1 nicht kann (oder schlechter macht)
Kein Modell ist perfekt. Hier die ehrlichen Schwächen:
Textqualität
Bei kreativen Texten, Stilnachahmung und nuanciertem Schreiben liegt Claude weiter vorn. Gemini produziert gute Texte, aber sie haben oft einen leicht generischen Unterton.
Ökosystem
ChatGPTs Plugin-Marktplatz, Custom GPTs und Drittanbieter-Integrationen sind deutlich umfangreicher. Gemini lebt im Google-Ökosystem – außerhalb davon wird es dünn.
Coding
Solide, aber nicht auf dem Niveau von Claude Mythos oder GPT-5.4. Bei komplexen, mehrstufigen Coding-Aufgaben merkt man den Unterschied.
Datenschutz
Es bleibt Google. Die kostenlose Version nutzt deine Daten fürs Training. In Gemini Advanced kannst du dem widersprechen – aber die Skepsis gegenüber Googles Datenhunger ist berechtigt.
Gemini 3.1 vs. Vorgänger: Was hat sich geändert?
| Feature | Gemini 2.5 | Gemini 3.1 |
|---|---|---|
| GPQA Diamond | ~85% | 94,3% |
| Intelligence Index | ~50 | 57 |
| Flash-Lite Geschwindigkeit | Basis | 2,5x schneller |
| 3D-Visualisierungen | Nein | Ja |
| Echtzeit Sprache+Bild | Eingeschränkt | Voll |
| Notebooks | Nein | Ja |
| Kontextfenster | 1M Tokens | 1M+ Tokens |
Der Sprung von 2.5 auf 3.1 ist signifikant. Google hat nicht nur die Modellqualität verbessert, sondern komplett neue Interaktionsformen hinzugefügt.
Für wen lohnt sich Gemini Advanced?
Ja, wenn:
- Du im Google-Ökosystem arbeitest (Gmail, Docs, Drive, Sheets)
- Wissenschaftliche Fragestellungen dein Fokus sind
- Du das riesige Kontextfenster brauchst (ganze Bücher, große Codebasen)
- Interaktive Visualisierungen für dich nützlich sind (Bildung, Daten)
- Du bereits Google One hast (Gemini Advanced ist oft im Paket enthalten)
Nein, wenn:
- Textqualität deine oberste Priorität ist (nimm Claude)
- Du viele Drittanbieter-Integrationen brauchst (nimm ChatGPT)
- Datenschutz extrem wichtig ist (nimm Mistral oder lokale Modelle)
- Du nur gelegentlich KI nutzt (die kostenlose Version reicht)
Weiterlesen:
- Gemini vs ChatGPT: Der große Vergleich
- Google NotebookLM im Test
- Die besten KI-Tools 2026
- Die besten ChatGPT-Alternativen 2026
