Перед началом
Это руководство предполагает, что вы уже решили использовать режим расширенного мышления и ознакомились с нашими базовыми шагами по началу работы с расширенным мышлением, а также с нашим руководством по реализации расширенного мышления.Технические соображения для расширенного мышления
- Токены мышления имеют минимальный бюджет в 1024 токена. Мы рекомендуем начинать с минимального бюджета мышления и постепенно увеличивать его в зависимости от ваших потребностей и сложности задачи.
- Для рабочих нагрузок, где оптимальный бюджет мышления превышает 32K, мы рекомендуем использовать пакетную обработку, чтобы избежать проблем с сетью. Запросы, заставляющие модель думать более 32K токенов, вызывают долго выполняющиеся запросы, которые могут столкнуться с системными таймаутами и ограничениями открытых соединений.
- Расширенное мышление работает лучше всего на английском языке, хотя финальные выходные данные могут быть на любом языке, который поддерживает Claude.
- Если вам нужно мышление ниже минимального бюджета, мы рекомендуем использовать стандартный режим с отключенным мышлением, с традиционным промптингом цепочки рассуждений с XML-тегами (например,
<thinking>
). См. промптинг цепочки рассуждений.
Техники промптинга для расширенного мышления
Сначала используйте общие инструкции, затем устраняйте неполадки с более пошаговыми инструкциями
Claude часто работает лучше с высокоуровневыми инструкциями просто глубоко думать о задаче, а не с пошаговыми предписывающими указаниями. Креативность модели в подходе к проблемам может превосходить способность человека предписать оптимальный процесс мышления. Например, вместо:Многократный промптинг с расширенным мышлением
Многократный промптинг хорошо работает с расширенным мышлением. Когда вы предоставляете Claude примеры того, как обдумывать проблемы, он будет следовать похожим паттернам рассуждений в своих блоках расширенного мышления. Вы можете включить примеры few-shot в ваш промпт в сценариях расширенного мышления, используя XML-теги, такие как<thinking>
или <scratchpad>
, чтобы указать канонические паттерны расширенного мышления в этих примерах.
Claude обобщит паттерн на формальный процесс расширенного мышления. Однако возможно, что вы получите лучшие результаты, дав Claude свободу думать так, как он считает лучшим.
Пример:
Максимизация следования инструкциям с расширенным мышлением
Claude показывает значительно улучшенное следование инструкциям, когда включено расширенное мышление. Модель обычно:- Рассуждает об инструкциях внутри блока расширенного мышления
- Выполняет эти инструкции в ответе
- Будьте ясными и конкретными в том, что вы хотите
- Для сложных инструкций рассмотрите разбиение их на пронумерованные шаги, которые Claude должен методично проработать
- Позвольте Claude достаточный бюджет для полной обработки инструкций в его расширенном мышлении
Использование расширенного мышления для отладки и управления поведением Claude
Вы можете использовать выходные данные мышления Claude для отладки логики Claude, хотя этот метод не всегда полностью надежен. Чтобы максимально эффективно использовать эту методологию, мы рекомендуем следующие советы:- Мы не рекомендуем передавать расширенное мышление Claude обратно в текстовый блок пользователя, поскольку это не улучшает производительность и может фактически ухудшить результаты.
- Предварительное заполнение расширенного мышления явно не разрешено, и ручное изменение выходного текста модели, который следует за ее блоком мышления, вероятно, ухудшит результаты из-за путаницы модели.
assistant
все еще разрешено.
Иногда Claude может повторить свое расширенное мышление в выходном тексте помощника. Если вы хотите чистый ответ, проинструктируйте Claude не повторять свое расширенное мышление и выводить только ответ.
Максимальное использование длинных выходных данных и длинного мышления
Для случаев использования генерации наборов данных попробуйте промпты, такие как “Пожалуйста, создайте чрезвычайно подробную таблицу…” для генерации всеобъемлющих наборов данных. Для случаев использования, таких как подробная генерация контента, где вы можете захотеть генерировать более длинные блоки расширенного мышления и более подробные ответы, попробуйте эти советы:- Увеличьте как максимальную длину расширенного мышления, ТАК И явно попросите более длинные выходные данные
- Для очень длинных выходных данных (20,000+ слов) запросите подробный план с подсчетом слов вплоть до уровня абзаца. Затем попросите Claude проиндексировать свои абзацы к плану и поддерживать указанное количество слов
Мы не рекомендуем заставлять Claude выводить больше токенов ради вывода токенов. Скорее, мы поощряем вас начинать с небольшого бюджета мышления и увеличивать по мере необходимости, чтобы найти оптимальные настройки для вашего случая использования.
Сложные STEM-задачи
Сложные STEM-задачи
Сложные STEM-задачи требуют от Claude построения ментальных моделей, применения специализированных знаний и проработки последовательных логических шагов — процессов, которые выигрывают от более длительного времени рассуждений.
Эта более простая задача обычно приводит только к нескольким секундам времени мышления.
Задачи оптимизации с ограничениями
Задачи оптимизации с ограничениями
Оптимизация с ограничениями бросает вызов Claude одновременно удовлетворить множественные конкурирующие требования, что лучше всего достигается при предоставлении длительного времени расширенного мышления, чтобы модель могла методично обратиться к каждому ограничению.
Этот открытый запрос обычно приводит только к нескольким секундам времени мышления.
Фреймворки мышления
Фреймворки мышления
Структурированные фреймворки мышления дают Claude явную методологию для следования, которая может работать лучше всего, когда Claude дано длительное пространство расширенного мышления для следования каждому шагу.
Этот широкий стратегический вопрос обычно приводит только к нескольким секундам времени мышления.
Заставьте Claude размышлять и проверять свою работу для улучшения согласованности и обработки ошибок
Вы можете использовать простой промптинг на естественном языке для улучшения согласованности и уменьшения ошибок:- Попросите Claude проверить свою работу простым тестом перед объявлением задачи завершенной
- Проинструктируйте модель проанализировать, достиг ли ее предыдущий шаг ожидаемого результата
- Для задач кодирования поп