콘텐츠 조절은 디지털 애플리케이션에서 안전하고 존중적이며 생산적인 환경을 유지하는 데 중요한 측면입니다. 이 가이드에서는 Claude를 디지털 애플리케이션 내에서 콘텐츠를 조절하는 데 어떻게 사용할 수 있는지 논의합니다.
Claude를 사용한 콘텐츠 조절 구현 예시를 보려면 콘텐츠 조절 쿡북을 방문하세요.
비용 효율적이고 빠른 구현을 원하는 경우
의미론적 이해와 빠른 결정을 모두 원하는 경우
일관된 정책 결정이 필요한 경우
조절 정책이 시간이 지남에 따라 변경되거나 발전할 가능성이 있는 경우
조절 결정에 대한 해석 가능한 추론이 필요한 경우
별도의 모델을 유지하지 않고 다국어 지원이 필요한 경우
멀티모달 지원이 필요한 경우
이 영화는 정말 좋았어요, 정말 즐겼습니다. 주연 배우가 정말 대단했어요!
에서 콘텐츠 조절 시스템은 “대단했어요”가 실제 폭력의 표시가 아닌 은유임을 인식해야 합니다. 반대로, 명시적인 폭력 언급이 없음에도 불구하고 지금 이 게시물을 삭제하지 않으면 숨어야 할 거야. 너와 너의 가족을 찾아갈 거야.
라는 댓글은 콘텐츠 조절 시스템에 의해 플래그가 지정되어야 합니다.
unsafe_categories
목록은 특정 요구 사항에 맞게 사용자 정의할 수 있습니다. 예를 들어, 미성년자가 웹사이트에서 콘텐츠를 생성하지 못하도록 하려면 목록에 “미성년자 게시”를 추가할 수 있습니다.
explanation
필드를 제거하면 출력 토큰을 더욱 줄일 수 있습니다.moderate_message
함수는 안전하지 않은 콘텐츠 카테고리와 평가하려는 메시지를 포함하는 평가 프롬프트를 포함합니다. 프롬프트는 Claude에게 우리가 정의한 안전하지 않은 카테고리를 기반으로 메시지가 조절되어야 하는지 평가하도록 요청합니다.
그런 다음 모델의 평가를 파싱하여 위반이 있는지 확인합니다. 위반이 있는 경우, Claude는 위반된 카테고리 목록과 메시지가 안전하지 않은 이유에 대한 설명도 반환합니다.
assess_risk_level
함수를 구현합니다. 이 함수는 메시지와 안전하지 않은 카테고리 목록을 입력으로 받습니다.
함수 내에서 평가할 메시지, 안전하지 않은 카테고리 및 위험 수준 평가를 위한 특정 지침을 포함하는 Claude용 프롬프트가 생성됩니다. 프롬프트는 Claude에게 위험 수준, 위반된 카테고리 및 선택적 설명을 포함하는 JSON 객체로 응답하도록 지시합니다.
이 접근 방식은 위험 수준을 할당하여 유연한 콘텐츠 조절을 가능하게 합니다. 평가된 위험 수준에 따라 콘텐츠 필터링을 자동화하거나 인간 검토를 위해 댓글에 플래그를 지정하는 더 큰 시스템에 원활하게 통합될 수 있습니다. 예를 들어, 이 코드를 실행할 때 지금 이 게시물을 삭제하지 않으면 숨어야 할 거야. 너와 너의 가족을 찾아갈 거야.
댓글은 위험한 위협 때문에 고위험으로 식별됩니다. 반면에 5G 휴대폰을 멀리하세요!! 그들은 5G를 사용하여 당신을 통제하고 있습니다.
댓글은 중간 위험으로 분류됩니다.
explanation
태그를 통해 이를 수행합니다.
moderate_message_with_definitions
함수는 각 안전하지 않은 카테고리를 자세한 정의와 쌍으로 만들 수 있도록 하여 이전의 moderate_message
함수를 확장합니다. 이는 원래 함수의 unsafe_categories
목록을 unsafe_category_definitions
사전으로 대체하여 코드에서 발생합니다. 이 사전은 각 안전하지 않은 카테고리를 해당 정의에 매핑합니다. 카테고리 이름과 정의 모두 프롬프트에 포함됩니다.
주목할 만한 점은 전문적 조언
카테고리에 대한 정의가 이제 금지되어야 하는 재정 조언의 유형을 지정한다는 것입니다. 그 결과, 이전에 moderate_message
평가를 통과한 지금은 금에 투자하기 좋은 시기입니다!
라는 댓글이 이제 위반을 트리거합니다.
batch_moderate_messages
함수는 단일 Claude API 호출로 전체 메시지 배치의 조절을 처리합니다.
함수 내에서 평가할 메시지 목록, 정의된 안전하지 않은 콘텐츠 카테고리 및 해당 설명을 포함하는 프롬프트가 생성됩니다. 프롬프트는 Claude에게 위반이 포함된 모든 메시지를 나열하는 JSON 객체를 반환하도록 지시합니다. 응답의 각 메시지는 입력 목록에서 메시지의 위치에 해당하는 id로 식별됩니다.
특정 요구 사항에 맞는 최적의 배치 크기를 찾으려면 약간의 실험이 필요할 수 있습니다. 배치 크기가 클수록 비용을 낮출 수 있지만 품질이 약간 저하될 수도 있습니다. 또한 더 긴 응답을 수용하기 위해 Claude API 호출에서 max_tokens
매개변수를 늘려야 할 수도 있습니다. 선택한 모델이 출력할 수 있는 최대 토큰 수에 대한 자세한 내용은 모델 비교 페이지를 참조하세요.