SDK-Kostenverfolgung
Das Claude Code SDK bietet detaillierte Token-Nutzungsinformationen für jede Interaktion mit Claude. Dieser Leitfaden erklärt, wie Sie Kosten ordnungsgemäß verfolgen und die Nutzungsberichterstattung verstehen, insbesondere beim Umgang mit parallelen Tool-Verwendungen und mehrstufigen Gesprächen. Für die vollständige API-Dokumentation siehe die TypeScript SDK-Referenz.Token-Nutzung verstehen
Wenn Claude Anfragen verarbeitet, meldet es die Token-Nutzung auf Nachrichtenebene. Diese Nutzungsdaten sind wesentlich für die Kostenverfolgung und die angemessene Abrechnung von Benutzern.Schlüsselkonzepte
- Schritte: Ein Schritt ist ein einzelnes Anfrage/Antwort-Paar zwischen Ihrer Anwendung und Claude
- Nachrichten: Einzelne Nachrichten innerhalb eines Schritts (Text, Tool-Verwendungen, Tool-Ergebnisse)
- Nutzung: Token-Verbrauchsdaten, die an Assistenten-Nachrichten angehängt sind
Struktur der Nutzungsberichterstattung
Einzelne vs. parallele Tool-Verwendung
Wenn Claude Tools ausführt, unterscheidet sich die Nutzungsberichterstattung je nachdem, ob Tools sequenziell oder parallel ausgeführt werden:Beispiel für Nachrichtenfluss
So werden Nachrichten und Nutzung in einem typischen mehrstufigen Gespräch gemeldet:Wichtige Nutzungsregeln
1. Gleiche ID = Gleiche Nutzung
Alle Nachrichten mit demselbenid
-Feld melden identische Nutzung. Wenn Claude mehrere Nachrichten im selben Zug sendet (z.B. Text + Tool-Verwendungen), teilen sie dieselbe Nachrichten-ID und Nutzungsdaten.
2. Einmal pro Schritt berechnen
Sie sollten Benutzer nur einmal pro Schritt berechnen, nicht für jede einzelne Nachricht. Wenn Sie mehrere Assistenten-Nachrichten mit derselben ID sehen, verwenden Sie die Nutzung von einer beliebigen davon.3. Ergebnisnachricht enthält kumulative Nutzung
Die finaleresult
-Nachricht enthält die gesamte kumulative Nutzung aller Schritte im Gespräch:
Implementierung: Kostenverfolgungssystem
Hier ist ein vollständiges Beispiel für die Implementierung eines Kostenverfolgungssystems:Umgang mit Grenzfällen
Diskrepanzen bei Output-Token
In seltenen Fällen könnten Sie unterschiedlicheoutput_tokens
-Werte für Nachrichten mit derselben ID beobachten. Wenn dies auftritt:
- Verwenden Sie den höchsten Wert - Die letzte Nachricht in einer Gruppe enthält typischerweise die genaue Gesamtsumme
- Überprüfen Sie gegen Gesamtkosten - Die
total_cost_usd
in der Ergebnisnachricht ist maßgebend - Melden Sie Inkonsistenzen - Reichen Sie Probleme im Claude Code GitHub-Repository ein
Cache-Token-Verfolgung
Bei Verwendung von Prompt-Caching verfolgen Sie diese Token-Typen separat:Best Practices
- Verwenden Sie Nachrichten-IDs für Deduplizierung: Verfolgen Sie immer verarbeitete Nachrichten-IDs, um Doppelberechnungen zu vermeiden
- Überwachen Sie die Ergebnisnachricht: Das finale Ergebnis enthält maßgebende kumulative Nutzung
- Implementieren Sie Protokollierung: Protokollieren Sie alle Nutzungsdaten für Auditing und Debugging
- Behandeln Sie Fehler elegant: Verfolgen Sie partielle Nutzung auch wenn ein Gespräch fehlschlägt
- Berücksichtigen Sie Streaming: Für Streaming-Antworten akkumulieren Sie Nutzung während Nachrichten eintreffen
Referenz für Nutzungsfelder
Jedes Nutzungsobjekt enthält:input_tokens
: Verarbeitete Basis-Input-Tokenoutput_tokens
: In der Antwort generierte Tokencache_creation_input_tokens
: Token, die zur Erstellung von Cache-Einträgen verwendet wurdencache_read_input_tokens
: Aus dem Cache gelesene Tokenservice_tier
: Die verwendete Service-Stufe (z.B. “standard”)total_cost_usd
: Gesamtkosten in USD (nur in Ergebnisnachricht)
Beispiel: Aufbau eines Abrechnungs-Dashboards
So aggregieren Sie Nutzungsdaten für ein Abrechnungs-Dashboard:Verwandte Dokumentation
- TypeScript SDK-Referenz - Vollständige API-Dokumentation
- SDK-Übersicht - Erste Schritte mit dem SDK
- SDK-Berechtigungen - Tool-Berechtigungen verwalten