Avant de commencer
Ce guide présuppose que vous avez déjà décidé d’utiliser le mode de réflexion étendue et que vous avez consulté nos étapes de base sur comment commencer avec la réflexion étendue ainsi que notre guide d’implémentation de la réflexion étendue.Considérations techniques pour la réflexion étendue
- Les jetons de réflexion ont un budget minimum de 1024 jetons. Nous recommandons de commencer avec le budget de réflexion minimum et d’augmenter progressivement pour ajuster selon vos besoins et la complexité de la tâche.
- Pour les charges de travail où le budget de réflexion optimal est supérieur à 32K, nous recommandons d’utiliser le traitement par lots pour éviter les problèmes de réseau. Les requêtes poussant le modèle à réfléchir au-delà de 32K jetons causent des requêtes de longue durée qui pourraient se heurter aux délais d’expiration du système et aux limites de connexions ouvertes.
- La réflexion étendue fonctionne mieux en anglais, bien que les sorties finales puissent être dans n’importe quelle langue que Claude supporte.
- Si vous avez besoin de réflexion en dessous du budget minimum, nous recommandons d’utiliser le mode standard, avec la réflexion désactivée, avec l’incitation traditionnelle de chaîne de pensée avec des balises XML (comme
<thinking>
). Voir incitation de chaîne de pensée.
Techniques d’incitation pour la réflexion étendue
Utilisez d’abord des instructions générales, puis dépannez avec des instructions plus détaillées étape par étape
Claude fonctionne souvent mieux avec des instructions de haut niveau pour simplement réfléchir profondément à une tâche plutôt qu’avec des conseils prescriptifs étape par étape. La créativité du modèle dans l’approche des problèmes peut dépasser la capacité d’un humain à prescrire le processus de réflexion optimal. Par exemple, au lieu de :Incitation multishot avec réflexion étendue
L’incitation multishot fonctionne bien avec la réflexion étendue. Lorsque vous fournissez à Claude des exemples de comment réfléchir aux problèmes, il suivra des modèles de raisonnement similaires dans ses blocs de réflexion étendue. Vous pouvez inclure des exemples few-shot dans votre incitation dans des scénarios de réflexion étendue en utilisant des balises XML comme<thinking>
ou <scratchpad>
pour indiquer des modèles canoniques de réflexion étendue dans ces exemples.
Claude généralisera le modèle au processus de réflexion étendue formel. Cependant, il est possible que vous obteniez de meilleurs résultats en donnant à Claude la liberté de réfléchir de la manière qu’il juge la meilleure.
Exemple :
Maximiser le suivi d’instructions avec la réflexion étendue
Claude montre un suivi d’instructions considérablement amélioré lorsque la réflexion étendue est activée. Le modèle typiquement :- Raisonne sur les instructions à l’intérieur du bloc de réflexion étendue
- Exécute ces instructions dans la réponse
- Soyez clair et spécifique sur ce que vous voulez
- Pour des instructions complexes, considérez les diviser en étapes numérotées que Claude devrait suivre méthodiquement
- Accordez à Claude suffisamment de budget pour traiter complètement les instructions dans sa réflexion étendue
Utiliser la réflexion étendue pour déboguer et orienter le comportement de Claude
Vous pouvez utiliser la sortie de réflexion de Claude pour déboguer la logique de Claude, bien que cette méthode ne soit pas toujours parfaitement fiable. Pour faire le meilleur usage de cette méthodologie, nous recommandons les conseils suivants :- Nous ne recommandons pas de repasser la réflexion étendue de Claude dans le bloc de texte utilisateur, car cela n’améliore pas les performances et peut en fait dégrader les résultats.
- Le préremplissage de la réflexion étendue est explicitement interdit, et modifier manuellement le texte de sortie du modèle qui suit son bloc de réflexion va probablement dégrader les résultats en raison de la confusion du modèle.
assistant
standard est toujours autorisé.
Parfois Claude peut répéter sa réflexion étendue dans le texte de sortie assistant. Si vous voulez une réponse propre, instruisez Claude de ne pas répéter sa réflexion étendue et de seulement sortir la réponse.
Tirer le meilleur parti des sorties longues et de la réflexion de forme longue
Pour les cas d’usage de génération de jeux de données, essayez des incitations telles que “Veuillez créer un tableau extrêmement détaillé de…” pour générer des jeux de données complets. Pour des cas d’usage tels que la génération de contenu détaillé où vous pourriez vouloir générer des blocs de réflexion étendue plus longs et des réponses plus détaillées, essayez ces conseils :- Augmentez à la fois la longueur maximale de réflexion étendue ET demandez explicitement des sorties plus longues
- Pour des sorties très longues (20 000+ mots), demandez un plan détaillé avec des comptes de mots jusqu’au niveau du paragraphe. Puis demandez à Claude d’indexer ses paragraphes au plan et de maintenir les comptes de mots spécifiés
Nous ne recommandons pas de pousser Claude à sortir plus de jetons pour le plaisir de sortir des jetons. Plutôt, nous vous encourageons à commencer avec un petit budget de réflexion et à augmenter selon les besoins pour trouver les paramètres optimaux pour votre cas d’usage.
Problèmes STEM complexes
Problèmes STEM complexes
Les problèmes STEM complexes nécessitent que Claude construise des modèles mentaux, applique des connaissances spécialisées, et travaille à travers des étapes logiques séquentielles—des processus qui bénéficient d’un temps de raisonnement plus long.
Cette tâche plus simple résulte typiquement en seulement quelques secondes de temps de réflexion.
Problèmes d'optimisation sous contraintes
Problèmes d'optimisation sous contraintes
L’optimisation sous contraintes défie Claude à satisfaire plusieurs exigences concurrentes simultanément, ce qui est mieux accompli en permettant un temps de réflexion étendue long pour que le modèle puisse aborder méthodiquement chaque contrainte.
Cette demande ouverte résulte typiquement en seulement quelques secondes de temps de réflexion.
Cadres de réflexion
Cadres de réflexion
Les cadres de réflexion structurés donnent à Claude une méthodologie explicite à suivre, ce qui peut fonctionner mieux lorsque Claude dispose d’un long espace de réflexion étendue pour suivre chaque étape.
Cette question stratégique large résulte typiquement en seulement quelques secondes de temps de réflexion.
Faire réfléchir Claude et vérifier son travail pour une cohérence améliorée et une gestion d’erreurs
Vous pouvez utiliser une incitation en langage naturel simple pour améliorer la cohérence et réduire les erreurs :- Demandez à Claude de vérifier son travail avec un test simple avant de déclarer une tâche terminée
- Instruisez le modèle d’analyser si son étape précédente a atteint le résultat attendu
- Pour les tâches de codage, demandez à Claude de passer en revue les cas de test dans sa réflexion étendue