Token

von Nicole Angela Buck

Was Token sind – und warum Du sie immer dann merkst, wenn KI plötzlich zu kosten anfängt

Token sind das einzige Konzept im KI-Vokabular, das aussieht wie ein technisches Detail, das Du ignorieren kannst, in Wahrheit aber Deinen Geldbeutel direkt berührt. Wer ChatGPT zahlt, wer Claude zahlt, wer KI über eine Schnittstelle anbindet – der zahlt für Token. Wer im kostenlosen Tool ans Limit kommt, ist an einem Token-Limit gescheitert.

Also lohnt es sich, einmal kurz zu verstehen, was das eigentlich ist.

Was ist ein Token?

Ein Token ist eine Einheit, in der KI Sprache misst. Nicht ganz ein Buchstabe, nicht ganz ein Wort, irgendwas dazwischen. Faustregel: Ein einfaches deutsches Wort wie „Haus" ist meistens ein Token. „Häuser" sind oft schon zwei. „Donaudampfschifffahrtsgesellschaftskapitän" sind sehr viele.

Die KI zerlegt jeden Text, den Du eingibst, in Token. Und jeden Text, den sie ausgibt, baut sie aus Token zusammen. Das ist ihre kleinste Recheneinheit, vergleichbar mit Pixeln bei Bildern oder Zellen in einer Tabelle.

Warum diese Zerlegung? Weil die Modelle nicht mit ganzen Sätzen rechnen können, sondern mit kleinen, gleichartigen Bausteinen. Token sind diese Bausteine. Sie sind so geschnitten, dass häufige Wortteile (wie „ung", „lich", „en") einzeln verarbeitet werden können, was die Berechnung effizienter macht.

Was Du wirklich wissen musst

Drei Sachen.

Erstens: Token sind Geld. Wenn Du Claude oder ChatGPT über die kostenpflichtige Variante nutzt, zahlst Du pro Token. Eine lange Anfrage mit langem Antworttext kostet mehr als eine kurze. Klingt logisch, ist aber für viele eine Überraschung, weil sie nicht sehen, wie viele Token gerade verbraucht werden.

Zweitens: Token sind das Limit. Jedes KI-Modell hat ein maximales Token-Volumen, das es auf einmal verarbeiten kann. Das nennt sich Kontextfenster (kommt in Woche 5). Wenn Du also ein langes Dokument hochlädst und die KI sagt „das ist zu lang" – dann sind Dir die Token ausgegangen.

Drittens: Eingabe und Ausgabe werden meistens getrennt gezählt. Bei Claude und ChatGPT zahlst Du für die Token, die Du reinsteckst (Deine Anfrage, hochgeladene Dokumente), und für die Token, die rauskommen (die Antwort). Output ist oft teurer als Input, weil das Generieren teurer ist als das Lesen.

Bei den kostenlosen Versionen siehst Du das alles nicht direkt, aber es wirkt im Hintergrund. Wenn der kostenlose Chat plötzlich sagt „Du hast Dein Limit erreicht", dann sind das Token-Grenzen.

Was Du damit machst

Erstmal: Nicht panisch werden. Im normalen Alltag mit der Chat-Oberfläche merkst Du Token kaum. Sie werden erst dann relevant, wenn Du anfängst, lange Dokumente hochzuladen, ganze Bücher zu analysieren oder eigene Anwendungen mit KI zu bauen.

Wenn Du regelmäßig längere Texte verarbeiten willst, dann lohnt es sich, ein bisschen Token-Bewusstsein zu entwickeln. Zwei Tipps:

Statt einen 50-Seiten-Bericht komplett hochzuladen, fass ihn vorher kurz zusammen oder lade nur die relevanten Kapitel hoch. Spart Token und liefert oft bessere Ergebnisse, weil die KI sich nicht durch Irrelevantes wühlen muss.

Wenn Du merkst, dass Antworten plötzlich abbrechen oder kürzer werden, kann das ein Token-Limit sein. In dem Fall: neuen Chat starten, Aufgabe in kleinere Teile zerlegen.

Im Prinzip ist es wie bei einem Telefongespräch mit Minutentarif. Die meisten Gespräche sind kurz genug, dass es egal ist. Aber wenn Du anfängst, stundenlang zu telefonieren, schaust Du auf die Uhr.

Verwandte Begriffe: Kontextfenster, Token-Limit, LLM
Stand: Mai 2026