claude-opus-4-20250514
)claude-sonnet-4-20250514
)claude-3-7-sonnet-20250219
)claude-3-5-sonnet-20240620
및 claude-3-5-sonnet-20241022
)claude-3-5-haiku-20241022
)claude-3-haiku-20240307
)claude-3-opus-20240229
)Model | Batch input | Batch output |
---|---|---|
Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.5 (deprecated) | $1.50 / MTok | $7.50 / MTok |
Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
custom_id
params
객체requests
매개변수에 전달하여 배치를 생성할 수 있습니다:
custom_id
가 있고 Messages API 호출에 사용할 표준 매개변수가 포함되어 있습니다.
params
객체의 유효성 검사는 비동기적으로 수행되며, 유효성 검사 오류는 전체 배치 처리가 완료될 때 반환됩니다. 먼저 Messages API로 요청 형태를 확인하여 입력을 올바르게 구성하고 있는지 확인할 수 있습니다.in_progress
입니다.
processing_status
필드는 배치가 처리 중인 단계를 나타냅니다. in_progress
로 시작하여 배치의 모든 요청이 처리를 완료하고 결과가 준비되면 ended
로 업데이트됩니다. Console을 방문하거나 검색 엔드포인트를 사용하여 배치 상태를 모니터링할 수 있습니다:
결과 유형 | 설명 |
---|---|
succeeded | 요청이 성공했습니다. 메시지 결과를 포함합니다. |
errored | 요청에서 오류가 발생했고 메시지가 생성되지 않았습니다. 가능한 오류에는 잘못된 요청과 내부 서버 오류가 포함됩니다. 이러한 요청에 대해서는 청구되지 않습니다. |
canceled | 이 요청이 모델로 전송되기 전에 사용자가 배치를 취소했습니다. 이러한 요청에 대해서는 청구되지 않습니다. |
expired | 이 요청이 모델로 전송되기 전에 배치가 24시간 만료에 도달했습니다. 이러한 요청에 대해서는 청구되지 않습니다. |
request_counts
로 결과 개요를 볼 수 있으며, 이는 이 네 가지 상태에 도달한 요청 수를 보여줍니다.
배치 결과는 Message Batch의 results_url
속성에서 다운로드할 수 있으며, 조직 권한이 허용하는 경우 Console에서도 사용할 수 있습니다. 결과의 잠재적으로 큰 크기 때문에 모든 결과를 한 번에 다운로드하는 대신 결과를 스트리밍하는 것이 권장됩니다.
.jsonl
형식이며, 각 줄은 Message Batch의 단일 요청 결과를 나타내는 유효한 JSON 객체입니다. 각 스트리밍된 결과에 대해 custom_id
와 결과 유형에 따라 다른 작업을 수행할 수 있습니다. 다음은 결과 세트의 예입니다:
result.error
가 표준 오류 형태로 설정됩니다.
custom_id
필드를 사용하세요.cache_control
블록을 포함합니다cache_control
로 표시된 Pride and Prejudice의 전체 텍스트를 포함합니다.
custom_id
값을 사용합니다.request_too_large
오류가 발생할 수 있습니다.custom_id
가 있는지 확인합니다.created_at
(처리 ended_at
이 아님) 시간으로부터 29일이 지나지 않았는지 확인합니다. 29일이 지나면 결과를 더 이상 볼 수 없습니다.배치 처리에 얼마나 걸리나요?
Batches API가 모든 모델에서 사용 가능한가요?
Message Batches API를 다른 API 기능과 함께 사용할 수 있나요?
Message Batches API가 가격에 어떤 영향을 주나요?
제출된 후 배치를 업데이트할 수 있나요?
Message Batches API 속도 제한이 있고 Messages API 속도 제한과 상호 작용하나요?
배치 요청의 오류를 어떻게 처리하나요?
succeeded
, errored
, canceled
또는 expired
여부를 나타내는 result
필드가 있습니다. errored
결과의 경우 추가 오류 정보가 제공됩니다. API 레퍼런스에서 오류 응답 객체를 확인하세요.Message Batches API는 개인정보 보호와 데이터 분리를 어떻게 처리하나요?
Message Batches API에서 프롬프트 캐싱을 사용할 수 있나요?