Modelos de pensamento estendido

Todos os modelos Opus e Sonnet lançados após o Claude Sonnet 3.7 suportam modos de pensamento padrão e estendido. No modo padrão, esses modelos operam de forma semelhante aos modelos Claude anteriores. No modo de pensamento estendido, o Claude mostrará seu pensamento antes de fornecer sua resposta, permitindo que você tenha uma visão do seu processo de raciocínio.

Visão geral do pensamento estendido

Os modelos de pensamento estendido operam em dois modos:

Modo padrão: Semelhante aos modelos Claude anteriores, fornecendo respostas diretas sem mostrar o raciocínio interno
Modo de pensamento estendido: Mostra o processo de raciocínio do Claude antes de entregar a resposta final

Quando usar o modo padrão

O modo padrão funciona bem para a maioria dos casos de uso gerais, incluindo:

Geração de conteúdo geral
Assistência básica de codificação
Tarefas agênticas de rotina
Orientação para uso de computador
A maioria das aplicações conversacionais

Quando usar o modo de pensamento estendido

O modo de pensamento estendido se destaca nestas áreas-chave:

Análise complexa: Análise financeira, jurídica ou de dados envolvendo múltiplos parâmetros e fatores
Problemas avançados de STEM: Matemática, física, pesquisa e desenvolvimento
Manipulação de contexto longo: Processamento e síntese de informações de entradas extensas
Otimização de restrições: Problemas com múltiplos requisitos concorrentes
Geração detalhada de dados: Criação de tabelas abrangentes ou conjuntos de informações estruturadas
Seguimento de instruções complexas: Chatbots com prompts de sistema intrincados e muitos fatores a considerar
Tarefas criativas estruturadas: Escrita criativa que requer planejamento detalhado, esboços ou gerenciamento de múltiplos elementos narrativos

Para saber mais sobre como o pensamento estendido funciona, consulte Pensamento estendido.

Começando com modelos de pensamento estendido

Se você está experimentando o pensamento estendido pela primeira vez, aqui estão algumas dicas:

Comece com o modo padrão: Comece usando seu modelo Opus ou Sonnet escolhido sem pensamento estendido para estabelecer um desempenho de referência
Identifique oportunidades de melhoria: Tente ativar o modo de pensamento estendido com um orçamento baixo para ver se seu caso de uso se beneficiaria de um raciocínio mais profundo. Pode ser o caso de que seu uso se beneficiaria mais de prompts mais detalhados no modo padrão do que do pensamento estendido do Claude.
Implementação gradual: Se necessário, aumente incrementalmente o orçamento de pensamento enquanto testa o desempenho em relação aos seus requisitos.
Otimize o uso de tokens: Uma vez que você alcance um desempenho aceitável, defina limites apropriados de tokens para gerenciar custos.
Explore novas possibilidades: Nossos mais recentes modelos Opus e Sonnet, com e sem pensamento estendido, são mais capazes do que os modelos Claude anteriores em uma variedade de domínios. Encorajamos você a experimentar esses modelos para casos de uso onde você anteriormente experimentou limitações com outros modelos.

Construindo com modelos de pensamento estendido

Informações gerais do modelo

Para preços, tamanho da janela de contexto e outras informações sobre todos os modelos Claude atuais com suporte a pensamento estendido, consulte Visão geral de todos os modelos.

Alterações em max tokens e janela de contexto com modelos de pensamento estendido

Em modelos Claude mais antigos (anteriores aos modelos de pensamento estendido), se a soma dos tokens do prompt e max_tokens excedesse a janela de contexto do modelo, o sistema ajustaria automaticamente max_tokens para caber dentro do limite de contexto. Isso significava que você poderia definir um valor grande para max_tokens e o sistema o reduziria silenciosamente conforme necessário. Com modelos de pensamento estendido, max_tokens (que inclui seu orçamento de pensamento quando o pensamento está ativado) é aplicado como um limite estrito. O sistema agora retornará um erro de validação se os tokens do prompt + max_tokens excederem o tamanho da janela de contexto.

Migrando para modelos de pensamento estendido a partir de modelos mais antigos

Se você está transferindo prompts de outro modelo, seja outro modelo Claude ou de outro provedor de modelo, aqui estão algumas dicas:

Migração do modo padrão

Simplifique seus prompts: Os modelos de pensamento estendido requerem menos direcionamento. Remova qualquer linguagem de orientação específica do modelo que você tenha usado com versões anteriores, como linguagem sobre como lidar com verbosidade - essa linguagem provavelmente é desnecessária e economizará tokens e reduzirá custos.

De outra forma, geralmente não são necessárias alterações no prompt se você estiver usando esses modelos com o pensamento estendido desativado. Se encontrar problemas, aplique as melhores práticas gerais de engenharia de prompt.

Migração do modo de pensamento estendido

Ao usar o pensamento estendido, comece removendo todas as orientações de cadeia de pensamento (CoT) de seus prompts. Os modelos de pensamento estendido são projetados para funcionar efetivamente sem instruções explícitas de raciocínio.

Em vez de prescrever padrões de pensamento, observe primeiro o processo de pensamento natural do Claude e, em seguida, ajuste seus prompts com base no que você vê.
Se você quiser fornecer orientação de pensamento, pode incluir orientações em linguagem natural em seu prompt e o Claude será capaz de generalizar tais instruções em seu próprio pensamento.
Para mais dicas sobre como fazer prompts para pensamento estendido, consulte Dicas de pensamento estendido.

Migrando de outros provedores de modelos

Os modelos de pensamento estendido do Claude podem responder de maneira diferente a padrões de prompt otimizados para modelos de outros provedores. Recomendamos focar em instruções claras e diretas em vez de técnicas de prompt específicas do provedor. Remover tais instruções adaptadas para provedores de modelos específicos pode levar a um melhor desempenho, já que o Claude geralmente é bom em seguir instruções complexas por padrão.

Você pode usar nosso aprimorador de prompt otimizado em console.anthropic.com para obter assistência na migração de prompts.

Próximos passos

Experimente o cookbook de pensamento estendido

Explore exemplos práticos de pensamento em nosso cookbook.

Documentação de pensamento estendido

Saiba mais sobre como o pensamento estendido funciona e como implementá-lo junto com outros recursos, como uso de ferramentas e cache de prompts.

Release Notes

​Visão geral do pensamento estendido

​Quando usar o modo padrão

​Quando usar o modo de pensamento estendido

​Começando com modelos de pensamento estendido

​Construindo com modelos de pensamento estendido

​Informações gerais do modelo

​Alterações em max tokens e janela de contexto com modelos de pensamento estendido

​Migrando para modelos de pensamento estendido a partir de modelos mais antigos

​Migração do modo padrão

​Migração do modo de pensamento estendido

​Migrando de outros provedores de modelos

​Próximos passos

Experimente o cookbook de pensamento estendido

Documentação de pensamento estendido

Visão geral do pensamento estendido

Quando usar o modo padrão

Quando usar o modo de pensamento estendido

Começando com modelos de pensamento estendido

Construindo com modelos de pensamento estendido

Informações gerais do modelo

Alterações em max tokens e janela de contexto com modelos de pensamento estendido

Migrando para modelos de pensamento estendido a partir de modelos mais antigos

Migração do modo padrão

Migração do modo de pensamento estendido

Migrando de outros provedores de modelos

Próximos passos