Antes de profundizar
Esta guía presupone que ya has decidido usar el modo de pensamiento extendido y has revisado nuestros pasos básicos sobre cómo comenzar con el pensamiento extendido así como nuestra guía de implementación de pensamiento extendido.Consideraciones técnicas para el pensamiento extendido
- Los tokens de pensamiento tienen un presupuesto mínimo de 1024 tokens. Recomendamos que comiences con el presupuesto mínimo de pensamiento y aumentes incrementalmente para ajustar según tus necesidades y la complejidad de la tarea.
- Para cargas de trabajo donde el presupuesto óptimo de pensamiento está por encima de 32K, recomendamos que uses procesamiento por lotes para evitar problemas de red. Las solicitudes que empujan al modelo a pensar por encima de 32K tokens causan solicitudes de larga duración que podrían encontrarse con tiempos de espera del sistema y límites de conexión abierta.
- El pensamiento extendido funciona mejor en inglés, aunque las salidas finales pueden estar en cualquier idioma que Claude soporte.
- Si necesitas pensamiento por debajo del presupuesto mínimo, recomendamos usar el modo estándar, con el pensamiento desactivado, con prompting tradicional de cadena de pensamiento con etiquetas XML (como
<thinking>
). Consulta prompting de cadena de pensamiento.
Técnicas de prompting para pensamiento extendido
Usa instrucciones generales primero, luego soluciona problemas con instrucciones más paso a paso
Claude a menudo funciona mejor con instrucciones de alto nivel para simplemente pensar profundamente sobre una tarea en lugar de orientación prescriptiva paso a paso. La creatividad del modelo para abordar problemas puede superar la capacidad humana de prescribir el proceso de pensamiento óptimo. Por ejemplo, en lugar de:Prompting multishot con pensamiento extendido
El prompting multishot funciona bien con el pensamiento extendido. Cuando proporcionas a Claude ejemplos de cómo pensar a través de problemas, seguirá patrones de razonamiento similares dentro de sus bloques de pensamiento extendido. Puedes incluir ejemplos few-shot en tu prompt en escenarios de pensamiento extendido usando etiquetas XML como<thinking>
o <scratchpad>
para indicar patrones canónicos de pensamiento extendido en esos ejemplos.
Claude generalizará el patrón al proceso formal de pensamiento extendido. Sin embargo, es posible que obtengas mejores resultados dando a Claude rienda suelta para pensar de la manera que considere mejor.
Ejemplo:
Maximizar el seguimiento de instrucciones con pensamiento extendido
Claude muestra un seguimiento de instrucciones significativamente mejorado cuando el pensamiento extendido está habilitado. El modelo típicamente:- Razona sobre las instrucciones dentro del bloque de pensamiento extendido
- Ejecuta esas instrucciones en la respuesta
- Sé claro y específico sobre lo que quieres
- Para instrucciones complejas, considera dividirlas en pasos numerados que Claude debería trabajar metódicamente
- Permite a Claude suficiente presupuesto para procesar las instrucciones completamente en su pensamiento extendido
Usar pensamiento extendido para depurar y dirigir el comportamiento de Claude
Puedes usar la salida de pensamiento de Claude para depurar la lógica de Claude, aunque este método no siempre es perfectamente confiable. Para hacer el mejor uso de esta metodología, recomendamos los siguientes consejos:- No recomendamos pasar el pensamiento extendido de Claude de vuelta en el bloque de texto del usuario, ya que esto no mejora el rendimiento y puede realmente degradar los resultados.
- El prellenado de pensamiento extendido está explícitamente no permitido, y cambiar manualmente el texto de salida del modelo que sigue a su bloque de pensamiento probablemente va a degradar los resultados debido a la confusión del modelo.
assistant
aún está permitido.
A veces Claude puede repetir su pensamiento extendido en el texto de salida del asistente. Si quieres una respuesta limpia, instruye a Claude que no repita su pensamiento extendido y que solo produzca la respuesta.
Aprovechar al máximo las salidas largas y el pensamiento de forma larga
Para casos de uso de generación de conjuntos de datos, prueba prompts como “Por favor crea una tabla extremadamente detallada de…” para generar conjuntos de datos comprensivos. Para casos de uso como generación de contenido detallado donde puedes querer generar bloques de pensamiento extendido más largos y respuestas más detalladas, prueba estos consejos:- Aumenta tanto la longitud máxima de pensamiento extendido Y pide explícitamente salidas más largas
- Para salidas muy largas (20,000+ palabras), solicita un esquema detallado con conteos de palabras hasta el nivel de párrafo. Luego pide a Claude que indexe sus párrafos al esquema y mantenga los conteos de palabras especificados
No recomendamos que empujes a Claude a producir más tokens por el bien de producir tokens. Más bien, te alentamos a comenzar with un presupuesto de pensamiento pequeño y aumentar según sea necesario para encontrar la configuración óptima para tu caso de uso.
Problemas STEM complejos
Problemas STEM complejos
Los problemas STEM complejos requieren que Claude construya modelos mentales, aplique conocimiento especializado y trabaje a través de pasos lógicos secuenciales—procesos que se benefician de un tiempo de razonamiento más largo.
Esta tarea más simple típicamente resulta en solo unos pocos segundos de tiempo de pensamiento.
Problemas de optimización con restricciones
Problemas de optimización con restricciones
La optimización con restricciones desafía a Claude a satisfacer múltiples requisitos competidores simultáneamente, lo cual se logra mejor cuando se permite un tiempo de pensamiento extendido largo para que el modelo pueda abordar metódicamente cada restricción.
Esta solicitud abierta típicamente resulta en solo unos pocos segundos de tiempo de pensamiento.
Marcos de pensamiento
Marcos de pensamiento
Los marcos de pensamiento estructurados dan a Claude una metodología explícita a seguir, lo cual puede funcionar mejor cuando a Claude se le da un espacio de pensamiento extendido largo para seguir cada paso.
Esta pregunta estratégica amplia típicamente resulta en solo unos pocos segundos de tiempo de pensamiento.
Haz que Claude reflexione y verifique su trabajo para mejorar la consistencia y el manejo de errores
Puedes usar prompting de lenguaje natural simple para mejorar la consistencia y reducir errores:- Pide a Claude que verifique su trabajo con una prueba simple antes de declarar una tarea completa
- Instruye al modelo para analizar si su paso anterior logró el resultado esperado
- Para tareas de codificación, pide a Claude que ejecute casos de prueba en su pensamiento extendido