Цены на модели
В следующей таблице показаны цены на все модели Claude для различных уровней использования:Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
---|---|---|---|---|---|
Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Sonnet 3.7 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Sonnet 3.5 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Миллион токенов. Столбец “Base Input Tokens” показывает стандартные цены на входные данные, “Cache Writes” и “Cache Hits” относятся к кэшированию промптов, а “Output Tokens” показывает цены на выходные данные. Кэширование промптов предлагает как 5-минутную (по умолчанию), так и 1-часовую продолжительность кэша для оптимизации затрат для различных случаев использования.Таблица выше отражает следующие ценовые множители для кэширования промптов:
- Токены записи 5-минутного кэша стоят в 1,25 раза больше базовой цены входных токенов
- Токены записи 1-часового кэша стоят в 2 раза больше базовой цены входных токенов
- Токены чтения кэша стоят в 0,1 раза меньше базовой цены входных токенов
Цены на специфические функции
Пакетная обработка
Batch API позволяет асинхронную обработку больших объемов запросов со скидкой 50% как на входные, так и на выходные токены.Model | Batch input | Batch output |
---|---|---|
Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.5 (deprecated) | $1.50 / MTok | $7.50 / MTok |
Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Цены на длинный контекст
При использовании Claude Sonnet 4 с включенным окном контекста в 1 млн токенов, запросы, превышающие 200 тыс. входных токенов, автоматически тарифицируются по премиальным тарифам длинного контекста:Окно контекста в 1 млн токенов в настоящее время находится в бета-версии для организаций в уровне использования 4 и организаций с пользовательскими ограничениями скорости. Окно контекста в 1 млн токенов доступно только для Claude Sonnet 4.
≤ 200K входных токенов | > 200K входных токенов |
---|---|
Входные: $3 / MTok | Входные: $6 / MTok |
Выходные: $15 / MTok | Выходные: $22.50 / MTok |
- Скидка 50% Batch API применяется к ценам на длинный контекст
- Множители кэширования промптов применяются поверх цен на длинный контекст
Даже при включенном бета-флаге запросы с менее чем 200 тыс. входных токенов тарифицируются по стандартным тарифам. Если ваш запрос превышает 200 тыс. входных токенов, все токены тарифицируются по премиальным ценам.Порог в 200 тыс. основан исключительно на входных токенах (включая чтение/запись кэша). Количество выходных токенов не влияет на выбор ценового уровня, хотя выходные токены тарифицируются по более высокой ставке при превышении входного порога.
usage
в ответе API:
input_tokens
cache_creation_input_tokens
(при использовании кэширования промптов)cache_read_input_tokens
(при использовании кэширования промптов)
usage
см. документацию по ответам API.
Цены на использование инструментов
Tool use requests are priced based on:- The total number of input tokens sent to the model (including in the
tools
parameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
- The
tools
parameter in API requests (tool names, descriptions, and schemas) tool_use
content blocks in API requests and responsestool_result
content blocks in API requests
tools
, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools
are provided, then a tool choice of none
uses 0 additional system prompt tokens.
Model | Tool choice | Tool use system prompt token count |
---|---|---|
Claude Opus 4.1 | auto , none any , tool | 346 tokens 313 tokens |
Claude Opus 4 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 4 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.7 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.5 (Oct) (deprecated) | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.5 (June) (deprecated) | auto , none any , tool | 294 tokens 261 tokens |
Claude Haiku 3.5 | auto , none any , tool | 264 tokens 340 tokens |
Claude Opus 3 (deprecated) | auto , none any , tool | 530 tokens 281 tokens |
Claude Sonnet 3 | auto , none any , tool | 159 tokens 235 tokens |
Claude Haiku 3 | auto , none any , tool | 264 tokens 340 tokens |
Цены на конкретные инструменты
Инструмент Bash
The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:- Command outputs (stdout/stderr)
- Error messages
- Large file contents
Инструмент выполнения кода
The code execution tool usage is tracked separately from token usage. Execution time is a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Pricing: $0.05 per session-hour.Инструмент текстового редактора
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:Tool | Additional input tokens |
---|---|
text_editor_20250429 (Claude 4) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7) | 700 tokens |
text_editor_20241022 (Claude Sonnet 3.5 (deprecated)) | 700 tokens |
Инструмент веб-поиска
Web search usage is charged in addition to token usage:Инструмент использования компьютера
Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:Model | Input tokens per tool definition |
---|---|
Claude 4 / Sonnet 3.7 | 735 tokens |
Claude Sonnet 3.5 (deprecated) | 683 tokens |
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Примеры ценообразования для случаев использования агентов
Понимание ценообразования для агентских приложений имеет решающее значение при создании с Claude. Эти реальные примеры могут помочь вам оценить затраты для различных паттернов агентов.Пример агента поддержки клиентов
При создании агента поддержки клиентов затраты могут распределяться следующим образом:Пример расчета для обработки 10 000 заявок поддержки:
- В среднем ~3 700 токенов на разговор
- Использование Claude Sonnet 4 по цене 15/MTok выходных
- Общая стоимость: ~$22.20 за 10 000 заявок
Ценообразование общего рабочего процесса агента
Для более сложных архитектур агентов с несколькими шагами:-
Обработка первоначального запроса
- Типичный ввод: 500-1 000 токенов
- Стоимость обработки: ~$0.003 за запрос
-
Извлечение памяти и контекста
- Извлеченный контекст: 2 000-5 000 токенов
- Стоимость за извлечение: ~$0.015 за операцию
-
Планирование и выполнение действий
- Токены планирования: 1 000-2 000
- Обратная связь выполнения: 500-1 000
- Общая стоимость: ~$0.045 за действие
Стратегии оптимизации затрат
При создании агентов с Claude:- Используйте подходящие модели: Выбирайте Haiku для простых задач, Sonnet для сложного рассуждения
- Внедрите кэширование промптов: Снизьте затраты на повторяющийся контекст
- Пакетные операции: Используйте Batch API для задач, не критичных по времени
- Отслеживайте паттерны использования: Отслеживайте потребление токенов для выявления возможностей оптимизации
Для высоконагруженных агентских приложений рассмотрите возможность обращения к нашей команде корпоративных продаж для индивидуальных ценовых соглашений.
Дополнительные соображения по ценообразованию
Ограничения скорости
Ограничения скорости варьируются в зависимости от уровня использования и влияют на количество запросов, которые вы можете делать:- Уровень 1: Начальное использование с базовыми ограничениями
- Уровень 2: Увеличенные ограничения для растущих приложений
- Уровень 3: Более высокие ограничения для устоявшихся приложений
- Уровень 4: Максимальные стандартные ограничения
- Корпоративный: Доступны пользовательские ограничения
Скидки на объем
Скидки на объем могут быть доступны для пользователей с большими объемами. Они обсуждаются в индивидуальном порядке.- Стандартные уровни используют ценообразование, показанное выше
- Корпоративные клиенты могут связаться с отделом продаж для индивидуального ценообразования
- Могут быть доступны академические и исследовательские скидки
Корпоративное ценообразование
Для корпоративных клиентов со специфическими потребностями:- Пользовательские ограничения скорости
- Скидки на объем
- Выделенная поддержка
- Индивидуальные условия
Выставление счетов и оплата
- Выставление счетов рассчитывается ежемесячно на основе фактического использования
- Платежи обрабатываются в долларах США
- Доступны варианты оплаты кредитной картой и выставления счетов
- Отслеживание использования доступно в Anthropic Console