Мышление и усилие: adaptive thinking и effort

В этом уроке нет практического задания — просто прочитай и ответь на вопросы.

Дать модели подумать

На claude-opus-4-8 можно включить адаптивное мышление: модель сама решает, когда и сколько рассуждать перед ответом. Это поле thinking на верхнем уровне запроса:

resp = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[{"role": "user", "content": "Разбери жалобу клиента и предложи решение"}],
)

{"type": "adaptive"} — единственный рабочий режим включения на этой модели. Никаких ручных бюджетов.

Регулируем усилие через effort

Глубину работы крутят параметром effort внутри output_config:

resp = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "Классифицируй отзыв: позитив/негатив"}],
)

Значения: low, medium, high, xhigh, max (по умолчанию high). Для простой классификации хватит low — меньше токенов и быстрее. Для разбора сложной жалобы бери high.

Чего нельзя делать

На claude-opus-4-8 параметры budget_tokens, temperature и top_p удалены. Любой из них вернёт ошибку 400. Глубину мышления задавай через effort, а поведение модели — через сам промпт, а не через temperature.

Если тянешь старый код с temperature=0 или budget_tokens, просто убери эти поля и переходи на effort.

Мышление и усилие: adaptive thinking и effort

Дать модели подумать

Регулируем усилие через effort

Чего нельзя делать

Проверь себя