claude-opus-4-20250514
)claude-sonnet-4-20250514
)claude-3-7-sonnet-20250219
)claude-3-5-sonnet-20240620
e claude-3-5-sonnet-20241022
)claude-3-5-haiku-20241022
)claude-3-haiku-20240307
)claude-3-opus-20240229
)Model | Batch input | Batch output |
---|---|---|
Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.5 (deprecated) | $1.50 / MTok | $7.50 / MTok |
Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
custom_id
único para identificar a solicitação Messagesparams
com os parâmetros padrão da API Messagesrequests
:
custom_id
único e contém os parâmetros padrão que você usaria para uma chamada da API Messages.
params
para cada solicitação de mensagem é realizada assincronamente, e erros de validação são retornados quando o processamento de todo o lote termina. Você pode garantir que está construindo sua entrada corretamente verificando a forma da sua solicitação com a API Messages primeiro.in_progress
.
processing_status
do Message Batch indica o estágio de processamento em que o lote está. Começa como in_progress
, depois atualiza para ended
uma vez que todas as solicitações no lote terminaram de processar, e os resultados estão prontos. Você pode monitorar o estado do seu lote visitando o Console, ou usando o endpoint de recuperação:
Tipo de Resultado | Descrição |
---|---|
succeeded | Solicitação foi bem-sucedida. Inclui o resultado da mensagem. |
errored | Solicitação encontrou um erro e uma mensagem não foi criada. Possíveis erros incluem solicitações inválidas e erros internos do servidor. Você não será cobrado por essas solicitações. |
canceled | Usuário cancelou o lote antes que esta solicitação pudesse ser enviada para o modelo. Você não será cobrado por essas solicitações. |
expired | Lote atingiu sua expiração de 24 horas antes que esta solicitação pudesse ser enviada para o modelo. Você não será cobrado por essas solicitações. |
request_counts
do lote, que mostra quantas solicitações atingiram cada um desses quatro estados.
Os resultados do lote estão disponíveis para download na propriedade results_url
do Message Batch, e se a permissão da organização permitir, no Console. Devido ao tamanho potencialmente grande dos resultados, é recomendado fazer stream dos resultados de volta em vez de baixá-los todos de uma vez.
.jsonl
, onde cada linha é um objeto JSON válido representando o resultado de uma única solicitação no Message Batch. Para cada resultado transmitido, você pode fazer algo diferente dependendo do seu custom_id
e tipo de resultado. Aqui está um exemplo de conjunto de resultados:
result.error
será definido para nossa forma de erro padrão.
custom_id
.cache_control
idênticos em cada solicitação Message dentro do seu lotecache_control
para aumentar a probabilidade de acertos de cache.
custom_id
significativos para facilmente corresponder resultados com solicitações, já que a ordem não é garantida.request_too_large
.custom_id
único.created_at
do lote (não o ended_at
do processamento). Se mais de 29 dias se passaram, os resultados não serão mais visualizáveis.Quanto tempo leva para um lote processar?
A API Batches está disponível para todos os modelos?
Posso usar a API Message Batches com outros recursos da API?
Como a API Message Batches afeta os preços?
Posso atualizar um lote depois que foi enviado?
Há limites de taxa da API Message Batches e eles interagem com os limites de taxa da API Messages?
Como lidar com erros nas minhas solicitações de lote?
result
indicando se ela succeeded
, errored
, foi canceled
, ou expired
. Para resultados errored
, informações adicionais de erro serão fornecidas. Visualize o objeto de resposta de erro na referência da API.Como a API Message Batches lida com privacidade e separação de dados?
Posso usar cache de prompt na API Message Batches?