機能を探索
トークンカウント
トークンカウントを使用すると、メッセージをClaudeに送信する前にメッセージ内のトークン数を確認でき、プロンプトと使用状況について情報に基づいた決定を下すことができます。トークンカウントにより、以下のことが可能になります:
- レート制限とコストを事前に管理する
- スマートなモデルルーティングの決定を行う
- プロンプトを特定の長さに最適化する
メッセージのトークン数を数える方法
トークンカウントエンドポイントは、メッセージ作成と同じ構造化された入力リストを受け付け、システムプロンプト、ツール、画像、PDFのサポートも含まれています。レスポンスには入力トークンの合計数が含まれます。
トークン数は推定値と考えるべきです。場合によっては、メッセージ作成時に実際に使用される入力トークン数が少し異なる場合があります。
サポートされているモデル
トークンカウントエンドポイントは以下のモデルをサポートしています:
- Claude Opus 4
- Claude Sonnet 4
- Claude Sonnet 3.7
- Claude Sonnet 3.5
- Claude Haiku 3.5
- Claude Haiku 3
- Claude Opus 3
基本的なメッセージのトークン数をカウントする
JSON
ツールを含むメッセージのトークン数をカウントする
サーバーツールのトークン数は最初のサンプリング呼び出しにのみ適用されます。
JSON
画像を含むメッセージのトークン数をカウントする
JSON
拡張思考を含むメッセージのトークン数をカウントする
拡張思考でのコンテキストウィンドウの計算方法の詳細についてはこちらをご覧ください
- 以前のアシスタントターンからの思考ブロックは無視され、入力トークンとしてカウントされません
- 現在のアシスタントターンの思考は入力トークンとしてカウントされます
JSON
PDFを含むメッセージのトークン数をカウントする
トークンカウントは、Messages APIと同じ制限でPDFをサポートしています。
JSON
価格とレート制限
トークンカウントは無料で使用できますが、使用層に基づいた1分あたりのリクエスト数の制限があります。より高い制限が必要な場合は、Anthropic Consoleからセールスにお問い合わせください。
使用層 | 1分あたりのリクエスト数(RPM) |
---|---|
1 | 100 |
2 | 2,000 |
3 | 4,000 |
4 | 8,000 |
トークンカウントとメッセージ作成には別々の独立したレート制限があります - 一方の使用がもう一方の制限にカウントされることはありません。
よくある質問
トークンカウントはプロンプトキャッシュを使用しますか?
トークンカウントはプロンプトキャッシュを使用しますか?
いいえ、トークンカウントはキャッシュロジックを使用せずに推定値を提供します。トークンカウントリクエストでcache_control
ブロックを提供することはできますが、プロンプトキャッシュは実際のメッセージ作成時にのみ発生します。