Claude Code는 각 상호작용마다 토큰을 소비합니다. 평균 비용은 개발자당 하루 6이며,906이며, 90%의 사용자에게 일일 비용은 12 미만으로 유지됩니다. 팀 사용의 경우, Claude Code는 API 토큰 소비량에 따라 요금을 부과합니다. 평균적으로 Claude Code는 Sonnet 4를 사용할 때 개발자당 월 ~$100-200의 비용이 들지만, 사용자가 실행하는 인스턴스 수와 자동화에서 사용하는지 여부에 따라 큰 차이가 있습니다.

비용 추적하기

/cost 명령어 사용하기

/cost 명령어는 Claude Max 및 Pro 구독자를 위한 것이 아닙니다.
/cost 명령어는 현재 세션에 대한 자세한 토큰 사용량 통계를 제공합니다:
Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

추가 추적 옵션

Anthropic Console에서 과거 사용량을 확인하고(관리자 또는 청구 역할 필요) Claude Code 워크스페이스에 대한 워크스페이스 지출 한도를 설정하세요(관리자 역할 필요).
Anthropic Console 계정으로 Claude Code를 처음 인증할 때, “Claude Code”라는 워크스페이스가 자동으로 생성됩니다. 이 워크스페이스는 조직의 모든 Claude Code 사용량에 대한 중앙 집중식 비용 추적 및 관리를 제공합니다.

팀을 위한 비용 관리

Anthropic API를 사용할 때, 전체 Claude Code 워크스페이스 지출을 제한할 수 있습니다. 구성하려면 이 지침을 따르세요. 관리자는 이 지침을 따라 비용 및 사용량 보고서를 볼 수 있습니다. Bedrock과 Vertex에서는 Claude Code가 클라우드에서 메트릭을 전송하지 않습니다. 비용 메트릭을 얻기 위해 여러 대기업에서 LiteLLM 사용을 보고했습니다. 이는 회사가 키별 지출을 추적하는 데 도움이 되는 오픈 소스 도구입니다. 이 프로젝트는 Anthropic과 관련이 없으며 보안을 감사하지 않았습니다.

속도 제한 권장사항

팀을 위해 Claude Code를 설정할 때, 조직 규모에 따른 사용자당 분당 토큰(TPM) 및 분당 요청(RPM) 권장사항을 고려하세요:
팀 규모사용자당 TPM사용자당 RPM
1-5명 사용자200k-300k5-7
5-20명 사용자100k-150k2.5-3.5
20-50명 사용자50k-75k1.25-1.75
50-100명 사용자25k-35k0.62-0.87
100-500명 사용자15k-20k0.37-0.47
500명 이상 사용자10k-15k0.25-0.35
예를 들어, 200명의 사용자가 있다면 각 사용자에 대해 20k TPM을 요청할 수 있으며, 이는 총 400만 TPM입니다(200*20,000 = 400만). 사용자당 TPM은 팀 규모가 커질수록 감소합니다. 이는 더 큰 조직에서 동시에 Claude Code를 사용하는 사용자가 적을 것으로 예상하기 때문입니다. 이러한 속도 제한은 개별 사용자가 아닌 조직 수준에서 적용되므로, 다른 사용자가 적극적으로 서비스를 사용하지 않을 때 개별 사용자가 계산된 할당량보다 일시적으로 더 많이 소비할 수 있습니다.
대규모 그룹과의 라이브 교육 세션과 같이 비정상적으로 높은 동시 사용량이 예상되는 시나리오가 있다면, 사용자당 더 높은 TPM 할당이 필요할 수 있습니다.

토큰 사용량 줄이기

  • 대화 압축:
    • Claude는 컨텍스트가 95% 용량을 초과할 때 기본적으로 자동 압축을 사용합니다
    • 자동 압축 토글: /config를 실행하고 “Auto-compact enabled”로 이동
    • 컨텍스트가 커질 때 /compact를 수동으로 사용
    • 사용자 지정 지침 추가: /compact Focus on code samples and API usage
    • CLAUDE.md에 추가하여 압축 사용자 지정:
      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • 구체적인 쿼리 작성: 불필요한 스캔을 유발하는 모호한 요청 피하기
  • 복잡한 작업 분해: 큰 작업을 집중된 상호작용으로 분할
  • 작업 간 기록 지우기: /clear를 사용하여 컨텍스트 재설정
비용은 다음에 따라 크게 달라질 수 있습니다:
  • 분석되는 코드베이스의 크기
  • 쿼리의 복잡성
  • 검색하거나 수정되는 파일 수
  • 대화 기록의 길이
  • 대화 압축 빈도
  • 백그라운드 프로세스(하이쿠 생성, 대화 요약)

백그라운드 토큰 사용량

Claude Code는 유휴 상태에서도 일부 백그라운드 기능을 위해 토큰을 사용합니다:
  • 하이쿠 생성: 타이핑하는 동안 나타나는 작은 창의적 메시지(하루 약 1센트)
  • 대화 요약: claude --resume 기능을 위해 이전 대화를 요약하는 백그라운드 작업
  • 명령어 처리: /cost와 같은 일부 명령어는 상태 확인을 위한 요청을 생성할 수 있습니다
이러한 백그라운드 프로세스는 적극적인 상호작용 없이도 소량의 토큰(일반적으로 세션당 $0.04 미만)을 소비합니다.

버전 변경 및 업데이트 추적

현재 버전 정보

현재 Claude Code 버전 및 설치 세부 정보를 확인하려면:
claude doctor
이 명령어는 버전, 설치 유형 및 시스템 정보를 보여줍니다.

Claude Code 동작 변경 이해

Claude Code는 비용 보고를 포함하여 기능 작동 방식을 변경할 수 있는 업데이트를 정기적으로 받습니다:
  • 버전 추적: claude doctor를 사용하여 현재 버전 확인
  • 동작 변경: /cost와 같은 기능이 버전에 따라 정보를 다르게 표시할 수 있습니다
  • 문서 접근: Claude는 항상 최신 문서에 접근할 수 있어 현재 기능 동작을 설명하는 데 도움이 됩니다

비용 보고가 변경될 때

비용이 표시되는 방식의 변경을 발견한 경우(/cost 명령어가 다른 정보를 표시하는 경우 등):
  1. 버전 확인: claude doctor를 실행하여 현재 버전 확인
  2. 문서 참조: 최신 문서에 접근할 수 있는 Claude에게 현재 기능 동작에 대해 직접 문의
  3. 지원 문의: 특정 청구 질문의 경우 Console 계정을 통해 Anthropic 지원에 문의
팀 배포의 경우, 더 넓은 롤아웃 전에 사용 패턴을 확립하기 위해 소규모 파일럿 그룹으로 시작하는 것을 권장합니다.