Gerencie custos de forma eficaz

Claude Code consome tokens para cada interação. O custo médio é de

6 por desenvolvedor por dia, com custos diários permanecendo abaixo de

12 para 90% dos usuários. Para uso em equipe, Claude Code cobra pelo consumo de tokens da API. Em média, Claude Code custa ~$100-200/desenvolvedor por mês com Sonnet 4, embora haja grande variação dependendo de quantas instâncias os usuários estão executando e se estão usando em automação.

Rastreie seus custos

Usando o comando `/cost`

O comando /cost não é destinado para assinantes Claude Max e Pro.

O comando /cost fornece estatísticas detalhadas de uso de tokens para sua sessão atual:

Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

Opções adicionais de rastreamento

Verifique uso histórico no Console Anthropic (requer função Admin ou Billing) e defina limites de gastos do workspace para o workspace Claude Code (requer função Admin).

Quando você autentica Claude Code pela primeira vez com sua conta do Console Anthropic, um workspace chamado “Claude Code” é automaticamente criado para você. Este workspace fornece rastreamento e gerenciamento centralizados de custos para todo o uso de Claude Code em sua organização.

Gerenciando custos para equipes

Ao usar a API Anthropic, você pode limitar o gasto total do workspace Claude Code. Para configurar, siga estas instruções. Administradores podem visualizar relatórios de custo e uso seguindo estas instruções. No Bedrock e Vertex, Claude Code não envia métricas de sua nuvem. Para obter métricas de custo, várias grandes empresas relataram usar LiteLLM, que é uma ferramenta de código aberto que ajuda empresas a rastrear gastos por chave. Este projeto não é afiliado à Anthropic e não auditamos sua segurança.

Recomendações de limite de taxa

Ao configurar Claude Code para equipes, considere estas recomendações de Token Por Minuto (TPM) e Solicitação Por Minuto (RPM) por usuário baseadas no tamanho de sua organização:

Tamanho da equipe	TPM por usuário	RPM por usuário
1-5 usuários	200k-300k	5-7
5-20 usuários	100k-150k	2.5-3.5
20-50 usuários	50k-75k	1.25-1.75
50-100 usuários	25k-35k	0.62-0.87
100-500 usuários	15k-20k	0.37-0.47
500+ usuários	10k-15k	0.25-0.35

Por exemplo, se você tem 200 usuários, pode solicitar 20k TPM para cada usuário, ou 4 milhões de TPM total (200*20.000 = 4 milhões). O TPM por usuário diminui conforme o tamanho da equipe cresce porque esperamos que menos usuários usem Claude Code simultaneamente em organizações maiores. Estes limites de taxa se aplicam no nível da organização, não por usuário individual, o que significa que usuários individuais podem temporariamente consumir mais do que sua parcela calculada quando outros não estão usando ativamente o serviço.

Se você antecipa cenários com uso simultâneo excepcionalmente alto (como sessões de treinamento ao vivo com grandes grupos), pode precisar de alocações de TPM mais altas por usuário.

Reduza o uso de tokens

Conversas compactas:
- Claude usa auto-compactar por padrão quando o contexto excede 95% da capacidade
- Alternar auto-compactar: Execute /config e navegue para “Auto-compact enabled”
- Use /compact manualmente quando o contexto ficar grande
- Adicione instruções personalizadas: /compact Focus on code samples and API usage
- Personalize a compactação adicionando ao CLAUDE.md:
  # Summary instructions When you are using compact, please focus on test output and code changes
Escreva consultas específicas: Evite solicitações vagas que acionam varredura desnecessária
Divida tarefas complexas: Divida tarefas grandes em interações focadas
Limpe o histórico entre tarefas: Use /clear para redefinir o contexto

Os custos podem variar significativamente baseados em:

Tamanho da base de código sendo analisada
Complexidade das consultas
Número de arquivos sendo pesquisados ou modificados
Duração do histórico de conversação
Frequência de compactação de conversas
Processos em segundo plano (geração de haiku, resumo de conversação)

Uso de tokens em segundo plano

Claude Code usa tokens para algumas funcionalidades em segundo plano mesmo quando inativo:

Geração de haiku: Pequenas mensagens criativas que aparecem enquanto você digita (aproximadamente 1 centavo por dia)
Resumo de conversação: Trabalhos em segundo plano que resumem conversas anteriores para o recurso claude --resume
Processamento de comandos: Alguns comandos como /cost podem gerar solicitações para verificar status

Esses processos em segundo plano consomem uma pequena quantidade de tokens (tipicamente menos de $0.04 por sessão) mesmo sem interação ativa.

Rastreando mudanças de versão e atualizações

Informações da versão atual

Para verificar sua versão atual do Claude Code e detalhes da instalação:

claude doctor

Este comando mostra sua versão, tipo de instalação e informações do sistema.

Entendendo mudanças no comportamento do Claude Code

Claude Code recebe atualizações regularmente que podem alterar como os recursos funcionam, incluindo relatórios de custo:

Rastreamento de versão: Use claude doctor para ver sua versão atual
Mudanças de comportamento: Recursos como /cost podem exibir informações de forma diferente entre versões
Acesso à documentação: Claude sempre tem acesso à documentação mais recente, que pode ajudar a explicar o comportamento atual dos recursos

Quando os relatórios de custo mudam

Se você notar mudanças em como os custos são exibidos (como o comando /cost mostrando informações diferentes):

Verifique sua versão: Execute claude doctor para confirmar sua versão atual
Consulte a documentação: Pergunte diretamente ao Claude sobre o comportamento atual dos recursos, pois ele tem acesso à documentação atualizada
Entre em contato com o suporte: Para questões específicas de cobrança, entre em contato com o suporte da Anthropic através de sua conta do Console

Para implantações em equipe, recomendamos começar com um pequeno grupo piloto para estabelecer padrões de uso antes de uma implementação mais ampla.

Primeiros passos

Construir com Claude Code

Claude Code SDK

Implantação

Administração

Configuração

Referência

Recursos

Gerencie custos de forma eficaz

Rastreie seus custos

Usando o comando `/cost`

Opções adicionais de rastreamento

Gerenciando custos para equipes

Recomendações de limite de taxa

Reduza o uso de tokens

Uso de tokens em segundo plano

Rastreando mudanças de versão e atualizações

Informações da versão atual

Entendendo mudanças no comportamento do Claude Code

Quando os relatórios de custo mudam

Primeiros passos

Construir com Claude Code

Claude Code SDK

Implantação

Administração

Configuração

Referência

Recursos

​Rastreie seus custos

​Usando o comando /cost

​Opções adicionais de rastreamento

​Gerenciando custos para equipes

​Recomendações de limite de taxa

​Reduza o uso de tokens

​Uso de tokens em segundo plano

​Rastreando mudanças de versão e atualizações

​Informações da versão atual

​Entendendo mudanças no comportamento do Claude Code

​Quando os relatórios de custo mudam

Rastreie seus custos

Usando o comando `/cost`

Opções adicionais de rastreamento

Gerenciando custos para equipes

Recomendações de limite de taxa

Reduza o uso de tokens

Uso de tokens em segundo plano

Rastreando mudanças de versão e atualizações

Informações da versão atual

Entendendo mudanças no comportamento do Claude Code

Quando os relatórios de custo mudam