Claude가 스크린샷 기능과 마우스/키보드 제어를 통해 자율적인 데스크톱 상호작용을 위한 컴퓨터 사용 도구로 컴퓨터 환경과 상호작용할 수 있습니다.
"computer-use-2025-01-24"
(Claude 4 모델 및 Claude Sonnet 3.7)"computer-use-2024-10-22"
(Claude Sonnet 3.5 (더 이상 사용되지 않음))모델 | 도구 버전 | 베타 플래그 |
---|---|---|
Claude 4 모델 | computer_20250124 | computer-use-2025-01-24 |
Claude Sonnet 3.7 | computer_20250124 | computer-use-2025-01-24 |
Claude Sonnet 3.5 v2 (더 이상 사용되지 않음) | computer_20241022 | computer-use-2024-10-22 |
1. Claude에게 컴퓨터 사용 도구와 사용자 프롬프트 제공
2. Claude가 컴퓨터 사용 도구 사용 결정
tool_use
의 stop_reason
을 가집니다.3. 도구 입력 추출, 컴퓨터에서 도구 평가, 결과 반환
tool_result
콘텐츠 블록을 포함하는 새로운 user
메시지로 대화를 계속합니다.4. Claude가 작업을 완료할 때까지 컴퓨터 사용 도구를 계속 호출
tool_use
stop_reason
으로 응답하고 3단계로 돌아가야 합니다.Claude 4 모델
computer_20250124
를 사용할 때, 이 베타 플래그를 포함하십시오:Claude Sonnet 3.7
computer_20250124
를 사용할 때, 이 베타 플래그를 포함하십시오:Claude Sonnet 3.5 v2 (더 이상 사용되지 않음)
computer_20241022
를 사용할 때, 이 베타 플래그를 포함하십시오:각 단계 후에 스크린샷을 찍고 올바른 결과를 달성했는지 신중하게 평가하십시오. 생각을 명시적으로 보여주십시오: "X 단계를 평가했습니다..." 올바르지 않다면 다시 시도하십시오. 단계가 올바르게 실행되었음을 확인한 후에만 다음 단계로 이동해야 합니다.
로 Claude에게 프롬프트할 수 있습니다.<robot_credentials>
와 같은 xml 태그 안에 사용자 이름과 비밀번호를 프롬프트에 제공하십시오. 로그인이 필요한 애플리케이션 내에서 컴퓨터 사용을 사용하면 프롬프트 주입의 결과로 나쁜 결과의 위험이 증가합니다. 모델에게 로그인 자격 증명을 제공하기 전에 프롬프트 주입 완화 가이드를 검토하십시오.사용자의 질문에 답하는 데 사용할 수 있는 함수 세트에 액세스할 수 있습니다. 여기에는 샌드박스 컴퓨팅 환경에 대한 액세스가 포함됩니다. 현재 아래 함수를 호출하는 것 외에는 파일을 검사하거나 외부 리소스와 상호작용할 수 있는 능력이 없습니다.일반 도구 사용과 마찬가지로, 사용자 제공
system_prompt
필드는 여전히 존중되고 결합된 시스템 프롬프트 구성에 사용됩니다.
[x, y]
에서 클릭computer_20250124
)
Claude 4 모델 및 Claude Sonnet 3.7에서 사용 가능:
예제 작업
매개변수 | 필수 | 설명 |
---|---|---|
type | 예 | 도구 버전 (computer_20250124 또는 computer_20241022 ) |
name | 예 | ”computer”여야 함 |
display_width_px | 예 | 픽셀 단위 디스플레이 너비 |
display_height_px | 예 | 픽셀 단위 디스플레이 높이 |
display_number | 아니오 | X11 환경용 디스플레이 번호 |
thinking
매개변수를 추가하십시오:
budget_tokens
매개변수는 Claude가 사고에 사용할 수 있는 토큰 수를 지정합니다. 이는 전체 max_tokens
예산에서 차감됩니다.
사고가 활성화되면, Claude는 응답의 일부로 추론 과정을 반환하여 다음을 도울 수 있습니다:
tool_use
결과를 실행하는 에이전트 루프컴퓨팅 환경 설정
작업 핸들러 구현
Claude의 도구 호출 처리
에이전트 루프 구현
스크린샷 캡처 실패
잘못된 좌표
작업 실행 실패
적절한 디스플레이 해상도 사용
적절한 스크린샷 처리 구현
작업 지연 추가
실행 전 작업 검증
디버깅을 위한 작업 로그
left_mouse_down
, left_mouse_up
과 같은 더 정밀한 마우스 제어 작업과 새로운 수정자 키 지원의 추가로 Claude Sonnet 3.7에서 개선되었습니다. 이러한 세밀한 제어를 사용하고 수정자 키와 클릭을 결합하여 셀 선택이 더 안정적일 수 있습니다.Model | Input tokens per tool definition |
---|---|
Claude 4 / Sonnet 3.7 | 735 tokens |
Claude Sonnet 3.5 (deprecated) | 683 tokens |