停止理由の処理

Messages APIにリクエストを送信すると、Claudeのレスポンスには、モデルがレスポンスの生成を停止した理由を示すstop_reasonフィールドが含まれます。これらの値を理解することは、異なるレスポンスタイプを適切に処理する堅牢なアプリケーションを構築するために重要です。 APIレスポンスのstop_reasonの詳細については、Messages APIリファレンスを参照してください。

stop_reasonとは？

stop_reasonフィールドは、すべての成功したMessages APIレスポンスの一部です。リクエストの処理における失敗を示すエラーとは異なり、stop_reasonはClaudeがレスポンス生成を正常に完了した理由を教えてくれます。

Example response

{
  "id": "msg_01234",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Here's the answer to your question..."
    }
  ],
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 100,
    "output_tokens": 50
  }
}

停止理由の値

end_turn

最も一般的な停止理由です。Claudeが自然にレスポンスを完了したことを示します。

if response.stop_reason == "end_turn":
    # 完全なレスポンスを処理
    print(response.content[0].text)

max_tokens

リクエストで指定されたmax_tokens制限に達したためClaudeが停止しました。

# トークン数を制限したリクエスト
response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=10,
    messages=[{"role": "user", "content": "Explain quantum physics"}]
)

if response.stop_reason == "max_tokens":
    # レスポンスが切り詰められた
    print("Response was cut off at token limit")
    # 続行するために別のリクエストを検討

stop_sequence

Claudeがカスタム停止シーケンスの1つに遭遇しました。

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    stop_sequences=["END", "STOP"],
    messages=[{"role": "user", "content": "Generate text until you say END"}]
)

if response.stop_reason == "stop_sequence":
    print(f"Stopped at sequence: {response.stop_sequence}")

tool_use

Claudeがツールを呼び出しており、実行を期待しています。

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    tools=[weather_tool],
    messages=[{"role": "user", "content": "What's the weather?"}]
)

if response.stop_reason == "tool_use":
    # ツールを抽出して実行
    for content in response.content:
        if content.type == "tool_use":
            result = execute_tool(content.name, content.input)
            # 最終レスポンスのためにClaudeに結果を返す

pause_turn

Claudeが長時間実行される操作を一時停止する必要がある場合に、ウェブ検索などのサーバーツールで使用されます。

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    tools=[{"type": "web_search_20250305", "name": "web_search"}],
    messages=[{"role": "user", "content": "Search for latest AI news"}]
)

if response.stop_reason == "pause_turn":
    # 会話を続行
    messages = [
        {"role": "user", "content": original_query},
        {"role": "assistant", "content": response.content}
    ]
    continuation = client.messages.create(
        model="claude-sonnet-4-20250514",
        messages=messages,
        tools=[{"type": "web_search_20250305", "name": "web_search"}]
    )

refusal

安全上の懸念によりClaudeがレスポンスの生成を拒否しました。

response = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[{"role": "user", "content": "[Unsafe request]"}]
)

if response.stop_reason == "refusal":
    # Claudeがレスポンスを拒否
    print("Claude was unable to process this request")
    # リクエストの言い換えや修正を検討

停止理由を処理するベストプラクティス

1. 常にstop_reasonをチェックする

レスポンス処理ロジックでstop_reasonをチェックすることを習慣にしましょう：

def handle_response(response):
    if response.stop_reason == "tool_use":
        return handle_tool_use(response)
    elif response.stop_reason == "max_tokens":
        return handle_truncation(response)
    elif response.stop_reason == "pause_turn":
        return handle_pause(response)
    elif response.stop_reason == "refusal":
        return handle_refusal(response)
    else:
        # end_turnやその他のケースを処理
        return response.content[0].text

2. max_tokensを適切に処理する

トークン制限によりレスポンスが切り詰められた場合：

def handle_truncated_response(response):
    if response.stop_reason == "max_tokens":
        # オプション1: ユーザーに警告
        return f"{response.content[0].text}\n\n[Response truncated due to length]"
        
        # オプション2: 生成を続行
        messages = [
            {"role": "user", "content": original_prompt},
            {"role": "assistant", "content": response.content[0].text}
        ]
        continuation = client.messages.create(
            model="claude-sonnet-4-20250514",
            max_tokens=1024,
            messages=messages + [{"role": "user", "content": "Please continue"}]
        )
        return response.content[0].text + continuation.content[0].text

3. pause_turnのリトライロジックを実装する

一時停止する可能性のあるサーバーツールの場合：

def handle_paused_conversation(initial_response, max_retries=3):
    response = initial_response
    messages = [{"role": "user", "content": original_query}]
    
    for attempt in range(max_retries):
        if response.stop_reason != "pause_turn":
            break
            
        messages.append({"role": "assistant", "content": response.content})
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            tools=original_tools
        )
    
    return response

停止理由 vs エラー

stop_reasonの値と実際のエラーを区別することが重要です：

停止理由（成功したレスポンス）

レスポンス本体の一部
生成が正常に停止した理由を示す
レスポンスには有効なコンテンツが含まれる

エラー（失敗したリクエスト）

HTTPステータスコード4xxまたは5xx
リクエスト処理の失敗を示す
レスポンスにはエラーの詳細が含まれる

try:
    response = client.messages.create(...)
    
    # stop_reasonを持つ成功したレスポンスを処理
    if response.stop_reason == "max_tokens":
        print("Response was truncated")
    
except anthropic.APIError as e:
    # 実際のエラーを処理
    if e.status_code == 429:
        print("Rate limit exceeded")
    elif e.status_code == 500:
        print("Server error")

ストリーミングの考慮事項

ストリーミングを使用する場合、stop_reasonは：

初期のmessage_startイベントではnull
message_deltaイベントで提供される
その他のイベントでは提供されない

with client.messages.stream(...) as stream:
    for event in stream:
        if event.type == "message_delta":
            stop_reason = event.delta.stop_reason
            if stop_reason:
                print(f"Stream ended with: {stop_reason}")

一般的なパターン

ツール使用ワークフローの処理

def complete_tool_workflow(client, user_query, tools):
    messages = [{"role": "user", "content": user_query}]
    
    while True:
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            tools=tools
        )
        
        if response.stop_reason == "tool_use":
            # ツールを実行して続行
            tool_results = execute_tools(response.content)
            messages.append({"role": "assistant", "content": response.content})
            messages.append({"role": "user", "content": tool_results})
        else:
            # 最終レスポンス
            return response

完全なレスポンスの確保

def get_complete_response(client, prompt, max_attempts=3):
    messages = [{"role": "user", "content": prompt}]
    full_response = ""
    
    for _ in range(max_attempts):
        response = client.messages.create(
            model="claude-sonnet-4-20250514",
            messages=messages,
            max_tokens=4096
        )
        
        full_response += response.content[0].text
        
        if response.stop_reason != "max_tokens":
            break
            
        # 中断したところから続行
        messages = [
            {"role": "user", "content": prompt},
            {"role": "assistant", "content": full_response},
            {"role": "user", "content": "Please continue from where you left off."}
        ]
    
    return full_response

stop_reasonの値を適切に処理することで、異なるレスポンスシナリオを適切に処理し、より良いユーザーエクスペリエンスを提供する、より堅牢なアプリケーションを構築できます。

APIの使用

APIリファレンス

SDK

例

サードパーティAPI

Admin APIの使用

サポートと設定

停止理由の処理

stop_reasonとは？

停止理由の値

end_turn

max_tokens

stop_sequence

tool_use

pause_turn

refusal

停止理由を処理するベストプラクティス

1. 常にstop_reasonをチェックする

2. max_tokensを適切に処理する

3. pause_turnのリトライロジックを実装する

停止理由 vs エラー

停止理由（成功したレスポンス）

エラー（失敗したリクエスト）

ストリーミングの考慮事項

一般的なパターン

ツール使用ワークフローの処理

完全なレスポンスの確保

APIの使用

APIリファレンス

SDK

例

サードパーティAPI

Admin APIの使用

サポートと設定

​stop_reasonとは？

​停止理由の値

​end_turn

​max_tokens

​stop_sequence

​tool_use

​pause_turn

​refusal

​停止理由を処理するベストプラクティス

​1. 常にstop_reasonをチェックする

​2. max_tokensを適切に処理する

​3. pause_turnのリトライロジックを実装する

​停止理由 vs エラー

​停止理由（成功したレスポンス）

​エラー（失敗したリクエスト）

​ストリーミングの考慮事項

​一般的なパターン

​ツール使用ワークフローの処理

​完全なレスポンスの確保

stop_reasonとは？

停止理由の値

end_turn

max_tokens

stop_sequence

tool_use

pause_turn

refusal

停止理由を処理するベストプラクティス

1. 常にstop_reasonをチェックする

2. max_tokensを適切に処理する

3. pause_turnのリトライロジックを実装する

停止理由 vs エラー

停止理由（成功したレスポンス）

エラー（失敗したリクエスト）

ストリーミングの考慮事項

一般的なパターン

ツール使用ワークフローの処理

完全なレスポンスの確保