The Admin API is unavailable for individual accounts. To collaborate with teammates and add members, set up your organization in Console → Settings → Organization.
- 正確な使用量追跡: レスポンストークンカウントのみに依存するのではなく、正確なトークン数と使用パターンを取得
- コスト照合: 財務・会計チーム向けに内部記録とAnthropic請求を照合
- 製品パフォーマンスと改善: システムへの変更が改善されたかを測定しながら製品パフォーマンスを監視、またはアラートを設定
- レート制限と優先ティアの最適化: プロンプトキャッシュや特定のプロンプトなどの機能を最適化して、割り当てられた容量を最大限活用、または専用容量を購入
- 高度な分析: Consoleで利用可能なものよりも深いデータ分析を実行
管理APIキーが必要このAPIは管理APIの一部です。これらのエンドポイントには、標準のAPIキーとは異なる管理APIキー(
sk-ant-admin...
で始まる)が必要です。管理者ロールを持つ組織メンバーのみが、Anthropic Consoleを通じて管理APIキーをプロビジョニングできます。パートナーソリューション
主要な可観測性プラットフォームは、カスタムコードを書くことなく、Claude API使用量とコストを監視するための即座に使用可能な統合を提供しています。これらの統合は、API使用量を効果的に管理するためのダッシュボード、アラート、分析を提供します。Datadog
自動トレースと監視を備えたLLM可観測性
Grafana Cloud
すぐに使えるダッシュボードとアラートを備えた簡単なLLM可観測性のためのエージェントレス統合
Honeycomb
OpenTelemetryを通じた高度なクエリと可視化
クイックスタート
過去7日間の組織の日次使用量を取得:統合にはUser-Agentヘッダーを設定統合を構築している場合は、使用パターンを理解するためにUser-Agentヘッダーを設定してください:
使用量API
/v1/organizations/usage_report/messages
エンドポイントを使用して、モデル、ワークスペース、サービスティア別の詳細な内訳で組織全体のトークン消費を追跡します。
主要概念
- 時間バケット: 固定間隔(
1m
、1h
、または1d
)で使用量データを集約 - トークン追跡: キャッシュされていない入力、キャッシュされた入力、キャッシュ作成、出力トークンを測定
- フィルタリングとグループ化: APIキー、ワークスペース、モデル、サービスティア、またはコンテキストウィンドウでフィルタリングし、これらの次元で結果をグループ化
- サーバーツール使用量: ウェブ検索などのサーバーサイドツールの使用量を追跡
基本例
モデル別日次使用量
フィルタリング付き時間別使用量
APIキーとワークスペースで使用量をフィルタリング
時間粒度制限
粒度 | デフォルト制限 | 最大制限 | 使用例 |
---|---|---|---|
1m | 60バケット | 1440バケット | リアルタイム監視 |
1h | 24バケット | 168バケット | 日次パターン |
1d | 7バケット | 31バケット | 週次/月次レポート |
コストAPI
/v1/organizations/cost_report
エンドポイントを使用して、USDでのサービスレベルのコスト内訳を取得します。
主要概念
- 通貨: すべてのコストはUSDで、最小単位(セント)の小数文字列として報告
- コストタイプ: トークン使用量、ウェブ検索、コード実行コストを追跡
- グループ化: 詳細な内訳のためにワークスペースまたは説明でコストをグループ化
- 時間バケット: 日次粒度のみ(
1d
)
優先ティアコストは異なる請求モデルを使用し、コストエンドポイントには含まれません。代わりに使用量エンドポイントを通じて優先ティア使用量を追跡してください。
基本例
ページネーション
両方のエンドポイントは大きなデータセットのページネーションをサポートしています:- 最初のリクエストを行う
has_more
がtrue
の場合、次のリクエストでnext_page
値を使用has_more
がfalse
になるまで続行
一般的な使用例
anthropic-cookbookで詳細な実装を探索:- 日次使用量レポート: トークン消費トレンドを追跡
- コスト配分: チャージバックのためにワークスペース別に費用を配分
- キャッシュ効率: プロンプトキャッシュを測定し最適化
- 予算監視: 支出しきい値のアラートを設定
- CSV エクスポート: 財務チーム向けレポートを生成
よくある質問
データはどのくらい新鮮ですか?
使用量とコストデータは通常、APIリクエスト完了から5分以内に表示されますが、時々遅延が長くなる場合があります。推奨されるポーリング頻度は?
APIは持続的な使用のために1分に1回のポーリングをサポートしています。短期間のバースト(例:ページ分割されたデータのダウンロード)の場合、より頻繁なポーリングが許可されます。頻繁な更新が必要なダッシュボードの結果をキャッシュしてください。コード実行使用量を追跡するにはどうすればよいですか?
コード実行コストは、説明フィールドのCode Execution Usage
の下にグループ化されたコストエンドポイントに表示されます。コード実行は使用量エンドポイントには含まれません。
優先ティア使用量を追跡するにはどうすればよいですか?
使用量エンドポイントでservice_tier
でフィルタリングまたはグループ化し、priority
値を探してください。優先ティアコストはコストエンドポイントでは利用できません。
Workbench使用量はどうなりますか?
WorkbenchからのAPI使用量はAPIキーに関連付けられていないため、その次元でグループ化してもapi_key_id
はnull
になります。
デフォルトワークスペースはどのように表現されますか?
デフォルトワークスペースに帰属する使用量とコストは、workspace_id
にnull
値を持ちます。
関連項目
使用量とコストAPIは、ユーザーにより良い体験を提供し、コストを管理し、レート制限を維持するのに役立ちます。これらの他の機能について詳しく学んでください:- 管理API概要
- 管理APIリファレンス
- 価格設定
- プロンプトキャッシュ - キャッシュでコストを最適化
- バッチ処理 - バッチリクエストで50%割引
- レート制限 - 使用量ティアを理解