max_tokens
의 합계가 모델의 컨텍스트 창을 초과하면 시스템이 자동으로 max_tokens
를 컨텍스트 제한 내에 맞게 조정했습니다. 이는 큰 max_tokens
값을 설정할 수 있고 시스템이 필요에 따라 이를 자동으로 줄인다는 의미였습니다.
확장된 사고 모델에서는 max_tokens
(사고가 활성화된 경우 사고 예산 포함)가 엄격한 제한으로 적용됩니다. 이제 프롬프트 토큰 + max_tokens
가 컨텍스트 창 크기를 초과하면 시스템이 유효성 검사 오류를 반환합니다.