- Rate-Limits und Kosten proaktiv verwalten
- Intelligente Entscheidungen zum Modell-Routing treffen
- Prompts optimieren, um eine bestimmte Länge zu erreichen
Wie man Nachrichten-Tokens zählt
Der Token-Zählungs-Endpunkt akzeptiert die gleiche strukturierte Liste von Eingaben wie beim Erstellen einer Nachricht, einschließlich Unterstützung für System-Prompts, Tools, Bilder und PDFs. Die Antwort enthält die Gesamtzahl der Eingabe-Tokens.Die Token-Anzahl sollte als Schätzung betrachtet werden. In einigen Fällen kann die tatsächliche Anzahl der Eingabe-Tokens, die beim Erstellen einer Nachricht verwendet werden, geringfügig abweichen.
Unterstützte Modelle
Der Token-Zählungs-Endpunkt unterstützt die folgenden Modelle:- Claude Opus 4
- Claude Sonnet 4
- Claude Sonnet 3.7
- Claude Sonnet 3.5
- Claude Haiku 3.5
- Claude Haiku 3
- Claude Opus 3
Tokens in einfachen Nachrichten zählen
JSON
Tokens in Nachrichten mit Tools zählen
Server-Tool-Token-Zählungen gelten nur für den ersten Sampling-Aufruf.
JSON
Tokens in Nachrichten mit Bildern zählen
JSON
Tokens in Nachrichten mit erweitertem Denken zählen
Siehe hier für weitere Details darüber, wie das Kontextfenster mit erweitertem Denken berechnet wird
- Denkblöcke aus vorherigen Assistenten-Antworten werden ignoriert und zählen nicht zu Ihren Eingabe-Tokens
- Aktuelles Assistenten-Denken zählt zu Ihren Eingabe-Tokens
JSON
Tokens in Nachrichten mit PDFs zählen
Die Token-Zählung unterstützt PDFs mit den gleichen Einschränkungen wie die Messages API.
JSON
Preisgestaltung und Rate-Limits
Die Token-Zählung ist kostenlos nutzbar, unterliegt jedoch Anfragen-pro-Minute-Rate-Limits basierend auf Ihrer Nutzungsstufe. Wenn Sie höhere Limits benötigen, kontaktieren Sie den Vertrieb über die Anthropic Console.Nutzungsstufe | Anfragen pro Minute (RPM) |
---|---|
1 | 100 |
2 | 2.000 |
3 | 4.000 |
4 | 8.000 |
Token-Zählung und Nachrichtenerstellung haben separate und unabhängige Rate-Limits — die Nutzung des einen zählt nicht gegen die Limits des anderen.
FAQ
Verwendet die Token-Zählung Prompt-Caching?
Verwendet die Token-Zählung Prompt-Caching?
Nein, die Token-Zählung liefert eine Schätzung ohne Verwendung von Caching-Logik. Obwohl Sie
cache_control
-Blöcke in Ihrer Token-Zählungsanfrage angeben können, erfolgt das Prompt-Caching nur während der tatsächlichen Nachrichtenerstellung.