Секрет Claude Code: дело не в модели

Исходный код Claude Code утёк в сеть, и исследователь Себастьян Рашка (@rasbt) внимательно его изучил. Вывод оказался неожиданным: то, почему Claude Code так хорошо пишет код, это не магия модели, а тщательно спроектированный программный слой вокруг неё. По сути, если взять ту же архитектуру и подключить другую модель (DeepSeek, MiniMax, Kimi), результат будет сопоставимо сильным.
Вот что реально работает под капотом.
Живой контекст репозитория
При старте Claude Code не просто принимает ваш промпт. Он автоматически загружает main-ветку, текущую ветку, последние коммиты и файл CLAUDE.md. Агент с самого начала знает, где он находится в кодовой базе.
Агрессивное кэширование промптов
В коде есть чёткая граница между статическим и динамическим контентом. Статические части кэшируются глобально, чтобы при каждом обращении не перестраивать дорогостоящий контекст с нуля. Это напрямую влияет на скорость и стоимость работы агента.
Нормальные инструменты вместо чата с файлами
Вместо вызова grep через Bash используется выделенный Grep-инструмент с лучшей обработкой прав доступа. Для поиска файлов есть отдельный Glob-инструмент. А для понимания кода на уровне семантики подключён LSP (Language Server Protocol), который умеет строить иерархию вызовов и находить все references. Для веб-чата код это просто статический текст, а здесь это живая структура.
Борьба с раздуванием контекста
Это одна из главных проблем при работе с большими репозиториями. Решается несколькими способами: дедупликация чтения файлов (неизменённые файлы не переобрабатываются), запись тяжёлых результатов инструментов на диск с передачей в контекст только превью и ссылки, автоматическое усечение и компактизация длинных контекстов.
Структурированная память сессии
Claude Code ведёт отдельный markdown-файл для текущей беседы. В нём есть разделы: заголовок сессии, текущее состояние, список задач, файлы и функции, workflow, ошибки и исправления, результаты, логи. По сути, агент работает так же, как опытный разработчик, который ведёт заметки параллельно с кодингом.
Форки и субагенты
Claude Code распараллеливает работу через субагентов. Форкнутые агенты переиспользуют кэш родительского агента и видят общее состояние, но работают независимо. Это позволяет делать фоновую работу (суммаризацию, извлечение памяти, анализ) без загрязнения основного цикла агента.
Итог простой: разница между Claude Code и обычным веб-чатом это не промпт-инжиниринг и не другая модель. Это вся инфраструктура вокруг: контекст, кэш, инструменты, память. И это открывает интересную возможность: та же обёртка с другой моделью внутри может давать сопоставимый результат.
Источник: тред Себастьяна Рашки на X
