Дать модели подумать
На claude-opus-4-8 можно включить адаптивное мышление: модель сама решает, когда и сколько рассуждать перед ответом. Это поле thinking на верхнем уровне запроса:
resp = client.messages.create(
model="claude-opus-4-8",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[{"role": "user", "content": "Разбери жалобу клиента и предложи решение"}],
)
{"type": "adaptive"} — единственный рабочий режим включения на этой модели. Никаких ручных бюджетов.
Регулируем усилие через effort
Глубину работы крутят параметром effort внутри output_config:
resp = client.messages.create(
model="claude-opus-4-8",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "low"},
messages=[{"role": "user", "content": "Классифицируй отзыв: позитив/негатив"}],
)
Значения: low, medium, high, xhigh, max (по умолчанию high). Для простой классификации хватит low — меньше токенов и быстрее. Для разбора сложной жалобы бери high.
Чего нельзя делать
На claude-opus-4-8 параметры budget_tokens, temperature и top_p удалены. Любой из них вернёт ошибку 400. Глубину мышления задавай через effort, а поведение модели — через сам промпт, а не через temperature.
Если тянешь старый код с temperature=0 или budget_tokens, просто убери эти поля и переходи на effort.