max_tokens
para definir um limite rígido no comprimento máximo da resposta gerada. Isso impede que o Claude gere saídas excessivamente longas.
Nota: Quando a resposta atinge max_tokens
tokens, a resposta será cortada, talvez no meio de uma frase ou palavra, então esta é uma técnica bruta que pode exigir pós-processamento e geralmente é mais apropriada para respostas de múltipla escolha ou respostas curtas onde a resposta vem logo no início.
temperature
controla a aleatoriedade da saída. Valores mais baixos (por exemplo, 0,2) podem às vezes levar a respostas mais focadas e mais curtas, enquanto valores mais altos (por exemplo, 0,8) podem resultar em saídas mais diversas mas potencialmente mais longas.