Claude Opus 4.7: почему он сломает ваши пайплайны

Вы просто обновились до Claude Opus 4.7. Промпты те же, обвязка та же. А счёт за токены вырос вдвое, и recall на код-ревью упал. Что произошло?

Opus 4.7 это не drop-in замена для 4.6. Модель думает иначе, следует инструкциям буквальнее, реже плодит субагентов и агрессивнее рассуждает после каждого сообщения пользователя. Паттерны, которые работали раньше, теперь съедают токены без пропорционального роста качества.

Главный сдвиг в том, как вы формулируете свою роль. Относитесь к Claude как к инженеру, которому вы делегируете задачу, а не как к напарнику, с которым ведёте диалог. Каждый ход пользователя в интерактивной сессии запускает тяжёлое рассуждение. С 4.6 можно было размазывать инструкции по нескольким сообщениям, с 4.7 такой паттерн раздувает потребление токенов.

Что нужно менять. Во-первых, задавайте задачу целиком в первом сообщении: намерение, ограничения, критерии приёмки, нужные файлы и неявные предположения. Во-вторых, батчите вопросы, каждое сообщение добавляет overhead на reasoning. В-третьих, используйте auto mode (Shift+Tab) для доверенных задач, чтобы убрать лишние check-in.

Появился новый уровень усилий xhigh между high и max, и он теперь дефолт для Claude Code. Если вы не выставляли effort вручную, вас автоматом подняли на xhigh. Низкие уровни Opus 4.7 уважает строже, чем 4.6, поэтому если задача на low или medium кажется недотянутой, повышайте ступень.

Extended Thinking с budget_tokens ушёл в прошлое. Теперь adaptive thinking: модель сама решает, когда и сколько думать. Простые запросы получают быстрый ответ, сложные шаги глубокое рассуждение, бесполезные шаги пропускаются. На длинных агентных прогонах это экономит токены и время.

Поведение по дефолту тоже изменилось. Ответы калибруются по сложности задачи, инструменты вызываются реже, субагенты спаунятся скупее, тон стал прямее и меньше эмодзи. Самое болезненное это буквальное следование инструкциям. Модель не обобщает молча с одного пункта на другой, поэтому если нужно применить правило широко, прописывайте scope явно.

Код-ревью отдельная история. Recall на внутреннем бенчмарке Anthropic вырос на 11 процентных пунктов. Но если ваш харнесс говорит репортить только high-severity, модель может найти баг, оценить его как низкий и промолчать. Разделяйте поиск и фильтрацию: сначала сообщай обо всём, что нашёл, включая неуверенные находки, потом отдельный шаг фильтрации.

Context window теперь 1 миллион токенов, этого хватит, чтобы собрать фуллстек-приложение с нуля в одной сессии. Но context rot реален: внимание размывается, старый мусор начинает перетягивать модель. Компактьте проактивно, используйте /clear, rewind через double-Esc и субагентов для задач с большим промежуточным выводом.

Главный вывод. Opus 4.7 поощряет подробную постановку задачи и наказывает инкрементальные многоходовые диалоги. Дайте хорошо специфицированную задачу, поставьте xhigh, отпустите модель. Разница будет видна сразу.

Подробности и официальный гайд: https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-7

+1
0
+1
0
+1
0
+1
0
+1
0

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *