ИИ нужны три типа памяти: параметрическая, retrieval и агентская
Современные LLM умеют рассуждать, писать код и собирать сложные сценарии, но всё равно ведут себя как блестящий стажёр с амнезией. Утром помнили контекст, к вечеру всё забыли. Свежий обзор от исследователей BIGAI и Пекинского университета “The AI Hippocampus: How Far are We From Human Memory?” разбирает эту проблему по полочкам и показывает, куда движется индустрия.
Главный тезис простой и неожиданный одновременно. Одной памяти моделям недостаточно. Чтобы агент действительно стал системой, ему нужны сразу три разных механизма, и каждый отвечает за свой кусок реальности.
Первый слой это веса самой модели, та самая параметрическая память. В неё зашиты медленные, прочные, обобщённые знания о мире. Энциклопедия, которая дорого обновляется и легко устаревает.
Второй слой это retrieval, то есть внешний поиск по базе знаний или документам. Сюда уходит всё свежее и конкретное: вчерашние новости, внутренняя документация компании, последняя версия API. Модель не пытается это запомнить, она в нужный момент достаёт факт с полки.
Третий слой и есть та самая революция, о которой говорит обзор. Это память агента, где живут долгосрочные цели, предпочтения пользователя и накопленный опыт взаимодействий. Не статичный текст, а структура, которая помогает связать конкретную деталь с конкретным моментом времени.
Авторы делают важное наблюдение. Реальное узкое место в современных ИИ-системах это не объём хранилища, а контроль над ним. Когда что-то вспоминать, что забыть, что переписать и как при этом не сломать соседние знания. Модель с одной только параметрической памятью эрудирована, но застывшая. Модель с одним только retrieval достаёт факты, но теряет преемственность и здравый смысл о том, что вообще важно.
Внешняя память по этой логике это не “ещё немного контекста”, а индекс опыта. Она привязывает нужный факт к нужному моменту, вместо того чтобы пытаться впихнуть всё в замороженные параметры. Именно так ИИ перестаёт быть предсказателем следующего токена и становится системой.
Когда агенты начинают работать не секундами, а днями, память перестаёт быть приятной фичей и превращается в фундамент. На ней стоит персонализация, временное рассуждение, способность к самокоррекции и в перспективе воплощённое поведение роботов и ассистентов.
Обзор честно описывает и нерешённые проблемы. Длинный контекст дорогой и плохо масштабируется. Retrieval умеет загрязнять генерацию нерелевантными кусками. Редактирование памяти ломает соседние знания, как неаккуратный рефакторинг ломает соседний модуль. А мультимодальные системы вообще получают по полной: видео, аудио и действия порождают огромные грязные истории, которые пока некуда складывать.
До человеческой памяти ещё далеко. Но контуры будущего уже видны: не одно гигантское хранилище, а компромисс между постоянством весов, гибкостью retrieval и живым опытом агента.
Ссылка на статью: https://arxiv.org/abs/2601.09113
Источник: https://x.com/rohanpaul_ai/status/2049099963012194477
