Claude Sonnet 3.7은 토큰 효율적인 방식으로 도구를 호출할 수 있습니다. 요청은 출력 토큰에서 평균 14%, 최대 70%까지 절약하며, 이는 지연 시간도 줄여줍니다. 정확한 토큰 감소량과 지연 시간 개선은 전체 응답 형태와 크기에 따라 달라집니다.
토큰 효율적인 도구 사용은 베타 기능입니다. 프로덕션에서 사용하기 전에 응답을 평가해 주시기 바랍니다.모델 응답의 품질, API 자체, 또는 문서의 품질에 대한 피드백을 제공하려면 이 양식을 사용해 주세요—여러분의 의견을 기다리고 있습니다!
이 기능을 실험해보기로 선택하신다면, ConsolePrompt Improver를 사용하여 프롬프트를 개선하는 것을 권장합니다.
토큰 효율적인 도구 사용은 현재 disable_parallel_tool_use와 함께 작동하지 않습니다.Claude 4 모델(Opus 4.1, Opus 4, Sonnet 4)은 이 기능을 지원하지 않습니다. 베타 헤더 token-efficient-tools-2025-02-19는 API 요청을 중단시키지 않지만, 아무 작업도 수행하지 않습니다.
이 베타 기능을 사용하려면, 도구 사용 요청에 베타 헤더 token-efficient-tools-2025-02-19를 추가하기만 하면 됩니다. SDK를 사용하는 경우, anthropic.beta.messages와 함께 베타 SDK를 사용하고 있는지 확인하세요. 다음은 API와 함께 토큰 효율적인 도구를 사용하는 방법의 예시입니다:
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'
위의 요청은 평균적으로 일반 요청보다 더 적은 입력 및 출력 토큰을 사용해야 합니다. 이를 확인하려면 동일한 요청을 하되 베타 헤더 목록에서 token-efficient-tools-2025-02-19를 제거해 보세요.
프롬프트 캐싱의 이점을 유지하려면, 캐시하려는 요청에 대해 베타 헤더를 일관되게 사용하세요. 선택적으로 사용하면 프롬프트 캐싱이 실패합니다.