Preços

Esta página fornece informações detalhadas sobre preços para modelos e recursos da Anthropic. Todos os preços estão em USD. Para as informações de preços mais atuais, visite anthropic.com/pricing.

Preços dos modelos

A tabela a seguir mostra os preços para todos os modelos Claude em diferentes níveis de uso:

Model	Base Input Tokens	5m Cache Writes	1h Cache Writes	Cache Hits & Refreshes	Output Tokens
Claude Opus 4.1	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Opus 4	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Sonnet 4	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 3.7	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 3.5 (deprecated)	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Haiku 3.5	$0.80 / MTok	$1 / MTok	$1.6 / MTok	$0.08 / MTok	$4 / MTok
Claude Opus 3 (deprecated)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Haiku 3	$0.25 / MTok	$0.30 / MTok	$0.50 / MTok	$0.03 / MTok	$1.25 / MTok

MTok = Milhão de tokens. A coluna “Base Input Tokens” mostra preços padrão de entrada, “Cache Writes” e “Cache Hits” são específicos para cache de prompt, e “Output Tokens” mostra preços de saída. O cache de prompt oferece durações de cache de 5 minutos (padrão) e 1 hora para otimizar custos para diferentes casos de uso.A tabela acima reflete os seguintes multiplicadores de preços para cache de prompt:

Tokens de escrita de cache de 5 minutos são 1,25 vezes o preço dos tokens de entrada base
Tokens de escrita de cache de 1 hora são 2 vezes o preço dos tokens de entrada base
Tokens de leitura de cache são 0,1 vezes o preço dos tokens de entrada base

Preços específicos por recurso

Processamento em lote

A API de Lote permite processamento assíncrono de grandes volumes de solicitações com 50% de desconto em tokens de entrada e saída.

Model	Batch input	Batch output
Claude Opus 4.1	$7.50 / MTok	$37.50 / MTok
Claude Opus 4	$7.50 / MTok	$37.50 / MTok
Claude Sonnet 4	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 3.7	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 3.5 (deprecated)	$1.50 / MTok	$7.50 / MTok
Claude Haiku 3.5	$0.40 / MTok	$2 / MTok
Claude Opus 3 (deprecated)	$7.50 / MTok	$37.50 / MTok
Claude Haiku 3	$0.125 / MTok	$0.625 / MTok

Para mais informações sobre processamento em lote, consulte nossa documentação de processamento em lote.

Preços de contexto longo

Ao usar Claude Sonnet 4 com a janela de contexto de 1M tokens habilitada, solicitações que excedem 200K tokens de entrada são automaticamente cobradas com taxas premium de contexto longo:

A janela de contexto de 1M tokens está atualmente em beta para organizações no nível de uso 4 e organizações com limites de taxa personalizados. A janela de contexto de 1M tokens está disponível apenas para Claude Sonnet 4.

≤ 200K tokens de entrada	> 200K tokens de entrada
Entrada: $3 / MTok	Entrada: $6 / MTok
Saída: $15 / MTok	Saída: $22.50 / MTok

Os preços de contexto longo se acumulam com outros modificadores de preços:

O desconto de 50% da API de Lote se aplica aos preços de contexto longo
Multiplicadores de cache de prompt se aplicam sobre os preços de contexto longo

Mesmo com a flag beta habilitada, solicitações com menos de 200K tokens de entrada são cobradas com taxas padrão. Se sua solicitação exceder 200K tokens de entrada, todos os tokens incorrem em preços premium.O limite de 200K é baseado apenas em tokens de entrada (incluindo leituras/escritas de cache). A contagem de tokens de saída não afeta a seleção do nível de preços, embora tokens de saída sejam cobrados com a taxa mais alta quando o limite de entrada é excedido.

Para verificar se sua solicitação de API foi cobrada com as taxas da janela de contexto de 1M, examine o objeto usage na resposta da API:

{
  "usage": {
    "input_tokens": 250000,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0,
    "output_tokens": 500
  }
}

Calcule o total de tokens de entrada somando:

input_tokens
cache_creation_input_tokens (se usando cache de prompt)
cache_read_input_tokens (se usando cache de prompt)

Se o total exceder 200.000 tokens, toda a solicitação foi faturada com taxas de contexto de 1M. Para mais informações sobre o objeto usage, consulte a documentação de resposta da API.

Preços de uso de ferramentas

Tool use requests are priced based on:

The total number of input tokens sent to the model (including in the tools parameter)
The number of output tokens generated
For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage. The additional tokens from tool use come from:

The tools parameter in API requests (tool names, descriptions, and schemas)
tool_use content blocks in API requests and responses
tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

Model	Tool choice	Tool use system prompt token count
Claude Opus 4.1	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 3.7	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 3.5 (Oct) (deprecated)	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 3.5 (June) (deprecated)	`auto`, `none` `any`, `tool`	294 tokens 261 tokens
Claude Haiku 3.5	`auto`, `none` `any`, `tool`	264 tokens 340 tokens
Claude Opus 3 (deprecated)	`auto`, `none` `any`, `tool`	530 tokens 281 tokens
Claude Sonnet 3	`auto`, `none` `any`, `tool`	159 tokens 235 tokens
Claude Haiku 3	`auto`, `none` `any`, `tool`	264 tokens 340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request. Para preços atuais por modelo, consulte nossa seção preços dos modelos acima. Para mais informações sobre implementação de uso de ferramentas e melhores práticas, consulte nossa documentação de uso de ferramentas.

Preços de ferramentas específicas

Ferramenta Bash

The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:

Command outputs (stdout/stderr)
Error messages
Large file contents

Consulte preços de uso de ferramentas para detalhes completos de preços.

Ferramenta de execução de código

The code execution tool usage is tracked separately from token usage. Execution time is a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Pricing: $0.05 per session-hour.

Ferramenta de editor de texto

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

Tool	Additional input tokens
`text_editor_20250429` (Claude 4)	700 tokens
`text_editor_20250124` (Claude Sonnet 3.7)	700 tokens
`text_editor_20241022` (Claude Sonnet 3.5 (deprecated))	700 tokens

Consulte preços de uso de ferramentas para detalhes completos de preços.

Ferramenta de busca na web

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Web search is available on the Anthropic API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns. Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Ferramenta de uso do computador

Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:

Model	Input tokens per tool definition
Claude 4 / Sonnet 3.7	735 tokens
Claude Sonnet 3.5 (deprecated)	683 tokens

Additional token consumption:

Screenshot images (see Vision pricing)
Tool execution results returned to Claude

If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Exemplos de preços para casos de uso de agentes

Entender os preços para aplicações de agentes é crucial ao construir com Claude. Estes exemplos do mundo real podem ajudá-lo a estimar custos para diferentes padrões de agentes.

Exemplo de agente de suporte ao cliente

Ao construir um agente de suporte ao cliente, aqui está como os custos podem se dividir:

Exemplo de cálculo para processar 10.000 tickets de suporte:

Média de ~3.700 tokens por conversa
Usando Claude Sonnet 4 a $3/MTok entrada,$ 15/MTok saída
Custo total: ~$22.20 por 10.000 tickets

Para um passo a passo detalhado deste cálculo, consulte nosso guia de agente de suporte ao cliente.

Preços de fluxo de trabalho de agente geral

Para arquiteturas de agentes mais complexas com múltiplas etapas:

Processamento de solicitação inicial
- Entrada típica: 500-1.000 tokens
- Custo de processamento: ~$0.003 por solicitação
Recuperação de memória e contexto
- Contexto recuperado: 2.000-5.000 tokens
- Custo por recuperação: ~$0.015 por operação
Planejamento e execução de ação
- Tokens de planejamento: 1.000-2.000
- Feedback de execução: 500-1.000
- Custo combinado: ~$0.045 por ação

Para um guia abrangente sobre padrões de preços de agentes, consulte nosso guia de casos de uso de agentes.

Estratégias de otimização de custos

Ao construir agentes com Claude:

Use modelos apropriados: Escolha Haiku para tarefas simples, Sonnet para raciocínio complexo
Implemente cache de prompt: Reduza custos para contexto repetido
Operações em lote: Use a API de Lote para tarefas não sensíveis ao tempo
Monitore padrões de uso: Acompanhe o consumo de tokens para identificar oportunidades de otimização

Para aplicações de agentes de alto volume, considere entrar em contato com nossa equipe de vendas empresariais para acordos de preços personalizados.

Considerações adicionais de preços

Limites de taxa

Os limites de taxa variam por nível de uso e afetam quantas solicitações você pode fazer:

Nível 1: Uso de nível básico com limites básicos
Nível 2: Limites aumentados para aplicações em crescimento
Nível 3: Limites mais altos para aplicações estabelecidas
Nível 4: Limites padrão máximos
Empresarial: Limites personalizados disponíveis

Para informações detalhadas sobre limites de taxa, consulte nossa documentação de limites de taxa. Para limites de taxa mais altos ou acordos de preços personalizados, entre em contato com nossa equipe de vendas.

Descontos por volume

Descontos por volume podem estar disponíveis para usuários de alto volume. Estes são negociados caso a caso.

Níveis padrão usam os preços mostrados acima
Clientes empresariais podem entrar em contato com vendas para preços personalizados
Descontos acadêmicos e de pesquisa podem estar disponíveis

Preços empresariais

Para clientes empresariais com necessidades específicas:

Limites de taxa personalizados
Descontos por volume
Suporte dedicado
Termos personalizados

Entre em contato com nossa equipe de vendas em sales@anthropic.com ou através do Console Anthropic para discutir opções de preços empresariais.

Faturamento e pagamento

O faturamento é calculado mensalmente com base no uso real
Os pagamentos são processados em USD
Opções de cartão de crédito e faturamento disponíveis
Rastreamento de uso disponível no Console Anthropic

Perguntas frequentes

Como o uso de tokens é calculado? Tokens são pedaços de texto que os modelos processam. Como estimativa aproximada, 1 token é aproximadamente 4 caracteres ou 0,75 palavras em inglês. A contagem exata varia por idioma e tipo de conteúdo. Existem níveis gratuitos ou testes? Novos usuários recebem uma pequena quantidade de créditos gratuitos para testar a API. Entre em contato com vendas para informações sobre testes estendidos para avaliação empresarial. Como os descontos se acumulam? Descontos da API de Lote e cache de prompt podem ser combinados. Por exemplo, usar ambos os recursos juntos fornece economias significativas de custos comparado a chamadas padrão da API. Quais métodos de pagamento são aceitos? Aceitamos os principais cartões de crédito para contas padrão. Clientes empresariais podem organizar faturamento e outros métodos de pagamento. Para perguntas adicionais sobre preços, entre em contato com support@anthropic.com.

Primeiros passos

Modelos e preços

Saiba mais sobre Claude

Capacidades

Ferramentas

Protocolo de Contexto do Modelo (MCP)

Casos de uso

Engenharia de prompts

Testar e avaliar

Fortalecer proteções

Centro legal

Preços dos modelos

Preços específicos por recurso

Processamento em lote

Preços de contexto longo

Preços de uso de ferramentas

Preços de ferramentas específicas

Ferramenta Bash

Ferramenta de execução de código

Ferramenta de editor de texto

Ferramenta de busca na web

Ferramenta de uso do computador

Exemplos de preços para casos de uso de agentes

Exemplo de agente de suporte ao cliente

Preços de fluxo de trabalho de agente geral

Estratégias de otimização de custos

Considerações adicionais de preços

Limites de taxa

Descontos por volume

Preços empresariais

Faturamento e pagamento

Perguntas frequentes

Primeiros passos

Modelos e preços

Saiba mais sobre Claude

Capacidades

Ferramentas

Protocolo de Contexto do Modelo (MCP)

Casos de uso

Engenharia de prompts

Testar e avaliar

Fortalecer proteções

Centro legal

​Preços dos modelos

​Preços específicos por recurso

​Processamento em lote

​Preços de contexto longo

​Preços de uso de ferramentas

​Preços de ferramentas específicas

​Ferramenta Bash

​Ferramenta de execução de código

​Ferramenta de editor de texto

​Ferramenta de busca na web

​Ferramenta de uso do computador

​Exemplos de preços para casos de uso de agentes

​Exemplo de agente de suporte ao cliente

​Preços de fluxo de trabalho de agente geral

​Estratégias de otimização de custos

​Considerações adicionais de preços

​Limites de taxa

​Descontos por volume

​Preços empresariais

​Faturamento e pagamento

​Perguntas frequentes

Preços dos modelos

Preços específicos por recurso

Processamento em lote

Preços de contexto longo

Preços de uso de ferramentas

Preços de ferramentas específicas

Ferramenta Bash

Ferramenta de execução de código

Ferramenta de editor de texto

Ferramenta de busca na web

Ferramenta de uso do computador

Exemplos de preços para casos de uso de agentes

Exemplo de agente de suporte ao cliente

Preços de fluxo de trabalho de agente geral

Estratégias de otimização de custos

Considerações adicionais de preços

Limites de taxa

Descontos por volume

Preços empresariais

Faturamento e pagamento

Perguntas frequentes