Claude Code consome tokens para cada interação. O custo médio é de 6pordesenvolvedorpordia,comcustosdiaˊriospermanecendoabaixode6 por desenvolvedor por dia, com custos diários permanecendo abaixo de 12 para 90% dos usuários. Para uso em equipe, Claude Code cobra pelo consumo de tokens da API. Em média, Claude Code custa ~$100-200/desenvolvedor por mês com Sonnet 4, embora haja grande variação dependendo de quantas instâncias os usuários estão executando e se estão usando em automação.

Rastreie seus custos

Usando o comando /cost

O comando /cost não é destinado para assinantes Claude Max e Pro.
O comando /cost fornece estatísticas detalhadas de uso de tokens para sua sessão atual:
Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

Opções adicionais de rastreamento

Verifique uso histórico no Console Anthropic (requer função Admin ou Billing) e defina limites de gastos do workspace para o workspace Claude Code (requer função Admin).
Quando você autentica Claude Code pela primeira vez com sua conta do Console Anthropic, um workspace chamado “Claude Code” é automaticamente criado para você. Este workspace fornece rastreamento e gerenciamento centralizados de custos para todo o uso de Claude Code em sua organização.

Gerenciando custos para equipes

Ao usar a API Anthropic, você pode limitar o gasto total do workspace Claude Code. Para configurar, siga estas instruções. Administradores podem visualizar relatórios de custo e uso seguindo estas instruções. No Bedrock e Vertex, Claude Code não envia métricas de sua nuvem. Para obter métricas de custo, várias grandes empresas relataram usar LiteLLM, que é uma ferramenta de código aberto que ajuda empresas a rastrear gastos por chave. Este projeto não é afiliado à Anthropic e não auditamos sua segurança.

Recomendações de limite de taxa

Ao configurar Claude Code para equipes, considere estas recomendações de Token Por Minuto (TPM) e Solicitação Por Minuto (RPM) por usuário baseadas no tamanho de sua organização:
Tamanho da equipeTPM por usuárioRPM por usuário
1-5 usuários200k-300k5-7
5-20 usuários100k-150k2.5-3.5
20-50 usuários50k-75k1.25-1.75
50-100 usuários25k-35k0.62-0.87
100-500 usuários15k-20k0.37-0.47
500+ usuários10k-15k0.25-0.35
Por exemplo, se você tem 200 usuários, pode solicitar 20k TPM para cada usuário, ou 4 milhões de TPM total (200*20.000 = 4 milhões). O TPM por usuário diminui conforme o tamanho da equipe cresce porque esperamos que menos usuários usem Claude Code simultaneamente em organizações maiores. Estes limites de taxa se aplicam no nível da organização, não por usuário individual, o que significa que usuários individuais podem temporariamente consumir mais do que sua parcela calculada quando outros não estão usando ativamente o serviço.
Se você antecipa cenários com uso simultâneo excepcionalmente alto (como sessões de treinamento ao vivo com grandes grupos), pode precisar de alocações de TPM mais altas por usuário.

Reduza o uso de tokens

  • Conversas compactas:
    • Claude usa auto-compactar por padrão quando o contexto excede 95% da capacidade
    • Alternar auto-compactar: Execute /config e navegue para “Auto-compact enabled”
    • Use /compact manualmente quando o contexto ficar grande
    • Adicione instruções personalizadas: /compact Focus on code samples and API usage
    • Personalize a compactação adicionando ao CLAUDE.md:
      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • Escreva consultas específicas: Evite solicitações vagas que acionam varredura desnecessária
  • Divida tarefas complexas: Divida tarefas grandes em interações focadas
  • Limpe o histórico entre tarefas: Use /clear para redefinir o contexto
Os custos podem variar significativamente baseados em:
  • Tamanho da base de código sendo analisada
  • Complexidade das consultas
  • Número de arquivos sendo pesquisados ou modificados
  • Duração do histórico de conversação
  • Frequência de compactação de conversas
  • Processos em segundo plano (geração de haiku, resumo de conversação)

Uso de tokens em segundo plano

Claude Code usa tokens para algumas funcionalidades em segundo plano mesmo quando inativo:
  • Geração de haiku: Pequenas mensagens criativas que aparecem enquanto você digita (aproximadamente 1 centavo por dia)
  • Resumo de conversação: Trabalhos em segundo plano que resumem conversas anteriores para o recurso claude --resume
  • Processamento de comandos: Alguns comandos como /cost podem gerar solicitações para verificar status
Esses processos em segundo plano consomem uma pequena quantidade de tokens (tipicamente menos de $0.04 por sessão) mesmo sem interação ativa.

Rastreando mudanças de versão e atualizações

Informações da versão atual

Para verificar sua versão atual do Claude Code e detalhes da instalação:
claude doctor
Este comando mostra sua versão, tipo de instalação e informações do sistema.

Entendendo mudanças no comportamento do Claude Code

Claude Code recebe atualizações regularmente que podem alterar como os recursos funcionam, incluindo relatórios de custo:
  • Rastreamento de versão: Use claude doctor para ver sua versão atual
  • Mudanças de comportamento: Recursos como /cost podem exibir informações de forma diferente entre versões
  • Acesso à documentação: Claude sempre tem acesso à documentação mais recente, que pode ajudar a explicar o comportamento atual dos recursos

Quando os relatórios de custo mudam

Se você notar mudanças em como os custos são exibidos (como o comando /cost mostrando informações diferentes):
  1. Verifique sua versão: Execute claude doctor para confirmar sua versão atual
  2. Consulte a documentação: Pergunte diretamente ao Claude sobre o comportamento atual dos recursos, pois ele tem acesso à documentação atualizada
  3. Entre em contato com o suporte: Para questões específicas de cobrança, entre em contato com o suporte da Anthropic através de sua conta do Console
Para implantações em equipe, recomendamos começar com um pequeno grupo piloto para estabelecer padrões de uso antes de uma implementação mais ampla.