- Gestionar proactivamente los límites de tasa y costos
- Tomar decisiones inteligentes sobre el enrutamiento de modelos
- Optimizar prompts para que tengan una longitud específica
Cómo contar tokens de mensajes
El endpoint de conteo de tokens acepta la misma lista estructurada de entradas para crear un mensaje, incluyendo soporte para prompts de sistema, herramientas, imágenes y PDFs. La respuesta contiene el número total de tokens de entrada.El recuento de tokens debe considerarse una estimación. En algunos casos, el número real de tokens de entrada utilizados al crear un mensaje puede diferir en una pequeña cantidad.
Modelos compatibles
El endpoint de conteo de tokens es compatible con los siguientes modelos:- Claude Opus 4
- Claude Sonnet 4
- Claude Sonnet 3.7
- Claude Sonnet 3.5
- Claude Haiku 3.5
- Claude Haiku 3
- Claude Opus 3
Contar tokens en mensajes básicos
JSON
Contar tokens en mensajes con herramientas
Los recuentos de tokens de herramientas de servidor solo se aplican a la primera llamada de muestreo.
JSON
Contar tokens en mensajes con imágenes
JSON
Contar tokens en mensajes con pensamiento extendido
Consulta aquí para más detalles sobre cómo se calcula la ventana de contexto con pensamiento extendido
- Los bloques de pensamiento de turnos anteriores del asistente se ignoran y no cuentan para tus tokens de entrada
- El pensamiento del turno actual del asistente sí cuenta para tus tokens de entrada
JSON
Contar tokens en mensajes con PDFs
El conteo de tokens admite PDFs con las mismas limitaciones que la API de Mensajes.
JSON
Precios y límites de tasa
El conteo de tokens es gratuito de usar pero está sujeto a límites de solicitudes por minuto basados en tu nivel de uso. Si necesitas límites más altos, contacta con ventas a través de la Consola de Anthropic.Nivel de uso | Solicitudes por minuto (RPM) |
---|---|
1 | 100 |
2 | 2,000 |
3 | 4,000 |
4 | 8,000 |
El conteo de tokens y la creación de mensajes tienen límites de tasa separados e independientes — el uso de uno no cuenta para los límites del otro.
Preguntas frecuentes
¿El conteo de tokens utiliza el almacenamiento en caché de prompts?
¿El conteo de tokens utiliza el almacenamiento en caché de prompts?
No, el conteo de tokens proporciona una estimación sin utilizar la lógica de almacenamiento en caché. Aunque puedes proporcionar bloques
cache_control
en tu solicitud de conteo de tokens, el almacenamiento en caché de prompts solo ocurre durante la creación real del mensaje.