Empirische Auswertung über Claude, ChatGPT, Perplexity und Gemini: welche Marken werden zitiert, welche verschwinden, woran liegt das? Inklusive reproduzierbarem Probing-Setup zum Selbstmessen.
Was die 400 Probes über alle 4 Modelle und 10 Marken konsistent zeigen.
Die untersuchten Hidden Champions verschwinden nicht aus den Modellen — sie werden in über 95% der relevanten Queries erwähnt. Was sich aber stark unterscheidet: wie Modelle antworten, wie tief sie eine Marke einbetten, und welche Quellen sie heranziehen.
Visibility-Index pro Marke, gemittelt über alle 4 Modelle. 100 = perfekt zitiert, hohe Mention-Density, oft an Position 1 in Listen.
| # | Marke | Typ | Visibility-Index | Citation-Rate | Density | Bestes Modell |
|---|---|---|---|---|---|---|
| 1 | Knauf | B2B |
95
|
100% | 13.6 | ChatGPT (GPT-5) |
| 2 | Stihl | Consumer |
92
|
100% | 11.8 | ChatGPT (GPT-5) |
| 3 | Miele | Consumer |
91
|
100% | 11.7 | Gemini 2.5 Pro |
| 4 | Festo | B2B |
90
|
100% | 12.9 | ChatGPT (GPT-5) |
| 5 | Kärcher | Mixed |
88
|
100% | 8.8 | Gemini 2.5 Pro |
| 6 | Würth | B2B |
87
|
95% | 9.9 | Gemini 2.5 Pro |
| 7 | Sennheiser | Consumer |
87
|
98% | 11.3 | ChatGPT (GPT-5) |
| 8 | Trumpf | B2B |
86
|
98% | 11.1 | ChatGPT (GPT-5) |
| 9 | Liebherr | B2B |
86
|
95% | 10.6 | Gemini 2.5 Pro |
| 10 | Hilti | B2B |
82
|
90% | 11.3 | ChatGPT (GPT-5) |
Selbe Marken, selbe Queries — vier völlig verschiedene Antwort-Stile.
Citation-Rate: 98.0% · Mention-Density: 17.6 · ⌀ Wörter: 577
Vielredner mit Tiefenprofil. GPT-5 schreibt ausführlich (577 Wörter im Schnitt), wiederholt die Marke häufig (Density 17.6) und liefert tendenziell strukturierte Top-N-Listen.
Citation-Rate: 99.0% · Mention-Density: 16.2 · ⌀ Wörter: 814
Längster Output. Gemini 2.5 Pro produziert die ausführlichsten Antworten (814 Wörter, Density 16.2). Reasoning-Tokens müssen großzügig budgetiert werden.
Citation-Rate: 100.0% · Mention-Density: 6.5 · ⌀ Wörter: 359
Strukturiert und knapp. Claude Sonnet 4.5 antwortet kompakter (359 Wörter, Density 6.5) — gute Trefferquote, weniger Wortrauschen.
Citation-Rate: 93.0% · Mention-Density: 4.9 · ⌀ Wörter: 263
Quellen-fokussiert. Perplexity Sonar Pro hält sich kurz (263 Wörter, Density 4.9) und liefert oft inline-Citation-Marker — nahe am klassischen Suchergebnis.
Die Modelle unterscheiden sich nicht primär darin, ob sie eine Marke kennen, sondern wie sie sie einbetten. GPT-5 und Gemini erzeugen ausführliche, dichte Profile (>500 Wörter, hohe Mention-Density). Claude und Perplexity antworten knapper, mit klarem Quellen-Fokus. Wer eine Marke "ranken" will, sollte nicht nur "werde ich erwähnt" messen, sondern "in welchem Stil, mit welcher Tiefe, mit welchen Quellen".
Hypothese vor der Studie: B2B-Hidden-Champions verschwinden eher als Consumer-Marken. Die Daten sagen etwas anderes.
Was das heißt: Die häufige Annahme "B2B hat in LLMs ein Visibility-Problem" trifft auf etablierte Hidden Champions mit starker Wikipedia/Press-Präsenz nicht zu. Die hier untersuchten Marken sind alle global tätige Marktführer mit jahrzehntelanger PR-Spur — und genau diese Spur lesen die Modelle.
Das bedeutet umgekehrt: Wer kein Wikipedia-Eintrag hat, keine deutschsprachige Wirtschaftspresse zitiert wird und keine starken Branchenmedien-Backlinks hat — der könnte tatsächlich aus den Antworten verschwinden. Diese Studie kann das aber nicht testen, weil sie bewusst auf etablierte Marken zielt. Die nächste Iteration sollte explizit "Mid-Tier"-Mittelständler aufnehmen.
Konkrete Brand-Modell-Kombinationen mit Citation-Rate unter 50%. Mit wenigen Treffern eher die Ausnahme als die Regel.
In dieser Probe gibt es keine echten Verschwinder — keine Marke fällt unter 50% Citation-Rate auf einem Modell. Das ist selbst ein Befund: Die etablierten Hidden Champions sind in allen 4 großen LLMs zuverlässig sichtbar.
Das interessante Pattern liegt nicht im "verschwinden", sondern in der Listen-Position: Wer nur an Position 6 oder 7 in einer "Top-Anbieter"-Liste landet, wird vom Endnutzer praktisch nicht gesehen. Diese Studie misst Position-Rank für Listen-Queries — die Daten dazu im CSV.
Verteilung der zitierten Quellen-Cluster über alle 400 Probes.
Über alle Modelle dominieren Wikipedia und die jeweiligen Firmen-Domains als Hauptquellen. Deutschsprachige Wirtschafts- und Industriepresse ist sichtbar präsent — internationale Quellen wie Reuters/Bloomberg deutlich seltener als bei einer reinen US-Probe.
Citation-Rate pro Query-Typ. Hilft zu verstehen, in welchen User-Suchen die Marke konkurriert.
Das gesamte Probing-Setup ist offen. Klont das Repo, ergänzt eure Marke, lasst es laufen — und vergleicht eure Marke mit den 10 Hidden Champions hier.
.env-Datei mit den vier Keys$ git clone https://github.com/craid/geo-citation-study $ cd geo-citation-study && npm install $ cp .env.example .env <- Keys eintragen $ node probe.js --brand=eure_marke --smoke <- 1 Marke × 4 Modelle × 10 Queries $ node analyze.js <- Aggregation + CSV-Export
Wir bauen GEO-Mess-Setups für Marken-Teams, die wissen wollen, wie LLMs sie heute beschreiben — und was sich ändert, wenn neue Quellen, neue Modelle oder neue Wettbewerber dazukommen.