- Проактивно управлять ограничениями скорости и затратами
- Принимать разумные решения по маршрутизации моделей
- Оптимизировать запросы до определенной длины
Как подсчитать токены сообщения
Конечная точка подсчета токенов принимает тот же структурированный список входных данных для создания сообщения, включая поддержку системных запросов, инструментов, изображений и PDF. Ответ содержит общее количество входных токенов.Количество токенов следует рассматривать как оценку. В некоторых случаях фактическое количество входных токенов, используемых при создании сообщения, может незначительно отличаться.
Поддерживаемые модели
Конечная точка подсчета токенов поддерживает следующие модели:- Claude Opus 4
- Claude Sonnet 4
- Claude Sonnet 3.7
- Claude Sonnet 3.5
- Claude Haiku 3.5
- Claude Haiku 3
- Claude Opus 3
Подсчет токенов в базовых сообщениях
JSON
Подсчет токенов в сообщениях с инструментами
Подсчет токенов серверных инструментов применяется только к первому вызову сэмплирования.
JSON
Подсчет токенов в сообщениях с изображениями
JSON
Подсчет токенов в сообщениях с расширенным мышлением
Смотрите здесь для получения дополнительной информации о том, как рассчитывается контекстное окно с расширенным мышлением
- Блоки мышления из предыдущих ходов ассистента игнорируются и не учитываются в ваших входных токенах
- Мышление текущего хода ассистента учитывается в ваших входных токенах
JSON
Подсчет токенов в сообщениях с PDF
Подсчет токенов поддерживает PDF с теми же ограничениями, что и API сообщений.
JSON
Ценообразование и ограничения скорости
Подсчет токенов бесплатен для использования, но подлежит ограничениям запросов в минуту в зависимости от вашего уровня использования. Если вам нужны более высокие лимиты, свяжитесь с отделом продаж через Консоль Anthropic.Уровень использования | Запросов в минуту (RPM) |
---|---|
1 | 100 |
2 | 2,000 |
3 | 4,000 |
4 | 8,000 |
Подсчет токенов и создание сообщений имеют отдельные и независимые ограничения скорости — использование одного не учитывается в ограничениях другого.
FAQ
Использует ли подсчет токенов кэширование запросов?
Использует ли подсчет токенов кэширование запросов?
Нет, подсчет токенов предоставляет оценку без использования логики кэширования. Хотя вы можете предоставить блоки
cache_control
в вашем запросе на подсчет токенов, кэширование запросов происходит только во время фактического создания сообщения.