While these tips apply broadly to all Claude models, you can find prompting tips specific to extended thinking models here.
Avant l’ingénierie des prompts
Ce guide suppose que vous avez :- Une définition claire des critères de réussite pour votre cas d’utilisation
- Des moyens de tester empiriquement ces critères
- Une première ébauche de prompt que vous souhaitez améliorer
Générateur de prompts
Vous n’avez pas de première ébauche de prompt ? Essayez le générateur de prompts dans la Console Anthropic !
Quand utiliser l’ingénierie des prompts
Ce guide se concentre sur les critères de réussite qui peuvent être contrôlés par l’ingénierie des prompts. Tous les critères de réussite ou les évaluations échouées ne se résolvent pas nécessairement par l’ingénierie des prompts. Par exemple, la latence et le coût peuvent parfois être améliorés plus facilement en sélectionnant un modèle différent.Prompting vs. finetuning
Prompting vs. finetuning
L’ingénierie des prompts est beaucoup plus rapide que d’autres méthodes de contrôle du comportement des modèles, comme le finetuning, et peut souvent produire des bonds de performance en beaucoup moins de temps. Voici quelques raisons de considérer l’ingénierie des prompts plutôt que le finetuning :
- Efficacité des ressources : Le fine-tuning nécessite des GPU haut de gamme et une grande mémoire, tandis que l’ingénierie des prompts ne nécessite que des entrées textuelles, ce qui la rend beaucoup plus économe en ressources.
- Rentabilité : Pour les services d’IA basés sur le cloud, le fine-tuning entraîne des coûts importants. L’ingénierie des prompts utilise le modèle de base, qui est généralement moins cher.
- Maintien des mises à jour du modèle : Lorsque les fournisseurs mettent à jour les modèles, les versions affinées peuvent nécessiter un réentraînement. Les prompts fonctionnent généralement entre les versions sans modifications.
- Gain de temps : Le fine-tuning peut prendre des heures, voire des jours. En revanche, l’ingénierie des prompts fournit des résultats quasi instantanés, permettant une résolution rapide des problèmes.
- Besoins minimaux en données : Le fine-tuning nécessite des données étiquetées substantielles et spécifiques à la tâche, qui peuvent être rares ou coûteuses. L’ingénierie des prompts fonctionne avec peu d’exemples, voire aucun.
- Flexibilité et itération rapide : Essayez rapidement diverses approches, ajustez les prompts et voyez les résultats immédiatement. Cette expérimentation rapide est difficile avec le fine-tuning.
- Adaptation au domaine : Adaptez facilement les modèles à de nouveaux domaines en fournissant un contexte spécifique au domaine dans les prompts, sans réentraînement.
- Améliorations de la compréhension : L’ingénierie des prompts est beaucoup plus efficace que le finetuning pour aider les modèles à mieux comprendre et utiliser le contenu externe tel que les documents récupérés.
- Préserve les connaissances générales : Le fine-tuning risque l’oubli catastrophique, où le modèle perd ses connaissances générales. L’ingénierie des prompts maintient les capacités générales du modèle.
- Transparence : Les prompts sont lisibles par l’homme, montrant exactement quelles informations le modèle reçoit. Cette transparence aide à la compréhension et au débogage.
Comment faire de l’ingénierie des prompts
Les pages d’ingénierie des prompts dans cette section ont été organisées des techniques les plus largement efficaces aux techniques plus spécialisées. Lors de la résolution des problèmes de performance, nous vous suggérons d’essayer ces techniques dans l’ordre, bien que l’impact réel de chaque technique dépendra de votre cas d’utilisation.- Générateur de prompts
- Soyez clair et direct
- Utilisez des exemples (multishot)
- Laissez Claude réfléchir (chaîne de pensée)
- Utilisez des balises XML
- Donnez un rôle à Claude (prompts système)
- Préremplissez la réponse de Claude
- Chaînez des prompts complexes
- Conseils pour les longs contextes