Claude Codeは各インタラクションでトークンを消費します。平均コストは開発者1人あたり1日6ドルで、90%のユーザーの日次コストは12ドル未満に収まっています。 チーム使用の場合、Claude CodeはAPIトークン消費量に基づいて課金されます。平均して、Claude CodeはSonnet 4で開発者1人あたり月額約100-200ドルかかりますが、ユーザーが実行しているインスタンス数や自動化での使用状況によって大きく変動します。

コストを追跡する

  • /costを使用して現在のセッション使用量を確認
  • Anthropic Consoleユーザー:
  • ProおよびMaxプランユーザー: 使用量はサブスクリプションに含まれています

チームのコスト管理

Anthropic APIを使用する場合、Claude Codeワークスペースの総支出を制限できます。設定するには、これらの手順に従ってください。管理者はこれらの手順に従ってコストと使用量レポートを表示できます。 BedrockとVertexでは、Claude Codeはクラウドからメトリクスを送信しません。コストメトリクスを取得するために、いくつかの大企業はLiteLLMの使用を報告しています。これは企業がキーごとの支出を追跡するのに役立つオープンソースツールです。このプロジェクトはAnthropicとは無関係であり、セキュリティについて監査していません。

レート制限の推奨事項

チーム向けにClaude Codeを設定する際は、組織の規模に基づいて以下のユーザーあたりのToken Per Minute(TPM)およびRequest Per Minute(RPM)の推奨事項を検討してください:
チームサイズユーザーあたりTPMユーザーあたりRPM
1-5ユーザー200k-300k5-7
5-20ユーザー100k-150k2.5-3.5
20-50ユーザー50k-75k1.25-1.75
50-100ユーザー25k-35k0.62-0.87
100-500ユーザー15k-20k0.37-0.47
500+ユーザー10k-15k0.25-0.35
例えば、200ユーザーがいる場合、各ユーザーに20k TPMを要求し、合計400万TPM(200*20,000 = 400万)となります。 チームサイズが大きくなるにつれてユーザーあたりのTPMが減少するのは、大規模な組織では同時にClaude Codeを使用するユーザーが少なくなると予想されるためです。これらのレート制限は個々のユーザーレベルではなく組織レベルで適用されるため、他のユーザーがサービスを積極的に使用していない場合、個々のユーザーは計算された配分を一時的に超えて消費することができます。
大規模グループでのライブトレーニングセッションなど、異常に高い同時使用量が予想されるシナリオでは、ユーザーあたりより高いTPM配分が必要になる場合があります。

トークン使用量を削減する

  • コンパクトな会話:
    • Claudeはコンテキストが95%の容量を超えるとデフォルトで自動コンパクトを使用します
    • 自動コンパクトの切り替え: /configを実行し「Auto-compact enabled」に移動
    • コンテキストが大きくなったら手動で/compactを使用
    • カスタム指示を追加: /compact Focus on code samples and API usage
    • CLAUDE.mdに追加してコンパクションをカスタマイズ:
      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • 具体的なクエリを書く: 不要なスキャンを引き起こす曖昧なリクエストを避ける
  • 複雑なタスクを分解する: 大きなタスクを焦点を絞ったインタラクションに分割
  • タスク間で履歴をクリア: /clearを使用してコンテキストをリセット
コストは以下の要因によって大幅に変動する可能性があります:
  • 分析されるコードベースのサイズ
  • クエリの複雑さ
  • 検索または変更されるファイル数
  • 会話履歴の長さ
  • 会話をコンパクトにする頻度
  • バックグラウンドプロセス(俳句生成、会話要約)

バックグラウンドトークン使用量

Claude Codeはアイドル状態でも一部のバックグラウンド機能でトークンを使用します:
  • 俳句生成: タイピング中に表示される小さなクリエイティブメッセージ(1日約1セント)
  • 会話要約: claude --resume機能のために以前の会話を要約するバックグラウンドジョブ
  • コマンド処理: /costなどの一部のコマンドはステータスを確認するためにリクエストを生成する場合があります
これらのバックグラウンドプロセスは、アクティブなインタラクションがなくても少量のトークン(通常セッションあたり0.04ドル未満)を消費します。
チーム展開では、より広範囲な展開前に使用パターンを確立するために、小規模なパイロットグループから始めることをお勧めします。