Precios de modelos
La siguiente tabla muestra los precios para todos los modelos Claude en diferentes niveles de uso:Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
---|---|---|---|---|---|
Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Sonnet 3.7 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Sonnet 3.5 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Millón de tokens. La columna “Base Input Tokens” muestra los precios estándar de entrada, “Cache Writes” y “Cache Hits” son específicos para prompt caching, y “Output Tokens” muestra los precios de salida. El prompt caching ofrece duraciones de caché de 5 minutos (predeterminado) y 1 hora para optimizar costos para diferentes casos de uso.
Precios específicos por característica
Procesamiento por lotes
La API de Lotes permite el procesamiento asíncrono de grandes volúmenes de solicitudes con un descuento del 50% tanto en tokens de entrada como de salida.Model | Batch input | Batch output |
---|---|---|
Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.5 (deprecated) | $1.50 / MTok | $7.50 / MTok |
Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Precios de uso de herramientas
Tool use requests are priced based on:- The total number of input tokens sent to the model (including in the
tools
parameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
- The
tools
parameter in API requests (tool names, descriptions, and schemas) tool_use
content blocks in API requests and responsestool_result
content blocks in API requests
tools
, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools
are provided, then a tool choice of none
uses 0 additional system prompt tokens.
Model | Tool choice | Tool use system prompt token count |
---|---|---|
Claude Opus 4.1 | auto , none any , tool | 346 tokens 313 tokens |
Claude Opus 4 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 4 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.7 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.5 (Oct) (deprecated) | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.5 (June) (deprecated) | auto , none any , tool | 294 tokens 261 tokens |
Claude Haiku 3.5 | auto , none any , tool | 264 tokens 340 tokens |
Claude Opus 3 (deprecated) | auto , none any , tool | 530 tokens 281 tokens |
Claude Sonnet 3 | auto , none any , tool | 159 tokens 235 tokens |
Claude Haiku 3 | auto , none any , tool | 264 tokens 340 tokens |
Precios de herramientas específicas
Herramienta Bash
The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:- Command outputs (stdout/stderr)
- Error messages
- Large file contents
Herramienta de ejecución de código
The code execution tool usage is tracked separately from token usage. Execution time is a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Pricing: $0.05 per session-hour.Herramienta de editor de texto
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:Tool | Additional input tokens |
---|---|
text_editor_20250429 (Claude 4) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7) | 700 tokens |
text_editor_20241022 (Claude Sonnet 3.5 (deprecated)) | 700 tokens |
Herramienta de búsqueda web
Web search usage is charged in addition to token usage:Herramienta de uso de computadora
Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:Model | Input tokens per tool definition |
---|---|
Claude 4 / Sonnet 3.7 | 735 tokens |
Claude Sonnet 3.5 (deprecated) | 683 tokens |
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Ejemplos de precios para casos de uso de agentes
Entender los precios para aplicaciones de agentes es crucial al construir con Claude. Estos ejemplos del mundo real pueden ayudarte a estimar costos para diferentes patrones de agentes.Ejemplo de agente de soporte al cliente
Al construir un agente de soporte al cliente, así es como podrían desglosarse los costos:Cálculo de ejemplo para procesar 10,000 tickets de soporte:
- Promedio de ~3,700 tokens por conversación
- Usando Claude Sonnet 4 a 15/MTok salida
- Costo total: ~$22.20 por 10,000 tickets
Precios de flujo de trabajo de agente general
Para arquitecturas de agentes más complejas con múltiples pasos:-
Procesamiento de solicitud inicial
- Entrada típica: 500-1,000 tokens
- Costo de procesamiento: ~$0.003 por solicitud
-
Recuperación de memoria y contexto
- Contexto recuperado: 2,000-5,000 tokens
- Costo por recuperación: ~$0.015 por operación
-
Planificación y ejecución de acciones
- Tokens de planificación: 1,000-2,000
- Retroalimentación de ejecución: 500-1,000
- Costo combinado: ~$0.045 por acción
Estrategias de optimización de costos
Al construir agentes con Claude:- Usa modelos apropiados: Elige Haiku para tareas simples, Sonnet para razonamiento complejo
- Implementa prompt caching: Reduce costos para contexto repetido
- Operaciones por lotes: Usa la API de Lotes para tareas no sensibles al tiempo
- Monitorea patrones de uso: Rastrea el consumo de tokens para identificar oportunidades de optimización
Para aplicaciones de agentes de alto volumen, considera contactar a nuestro equipo de ventas empresariales para arreglos de precios personalizados.
Consideraciones adicionales de precios
Límites de tasa
Los límites de tasa varían por nivel de uso y afectan cuántas solicitudes puedes hacer:- Nivel 1: Uso de nivel de entrada con límites básicos
- Nivel 2: Límites aumentados para aplicaciones en crecimiento
- Nivel 3: Límites más altos para aplicaciones establecidas
- Nivel 4: Límites estándar máximos
- Empresarial: Límites personalizados disponibles
Descuentos por volumen
Los descuentos por volumen pueden estar disponibles para usuarios de alto volumen. Estos se negocian caso por caso.- Los niveles estándar usan los precios mostrados arriba
- Los clientes empresariales pueden contactar ventas para precios personalizados
- Pueden estar disponibles descuentos académicos y de investigación
Precios empresariales
Para clientes empresariales con necesidades específicas:- Límites de tasa personalizados
- Descuentos por volumen
- Soporte dedicado
- Términos personalizados
Facturación y pago
- La facturación se calcula mensualmente basada en el uso real
- Los pagos se procesan en USD
- Opciones de tarjeta de crédito y facturación disponibles
- Seguimiento de uso disponible en la Consola de Anthropic