03 - Память и знания агента

Что это

Разделение памяти, сессий, вики и базы знаний; куда класть факты, решения, инструкции и как не превращать поиск в помойку.

Связанные материалы

00 - Карта чтения PDF-серии · 01 - Из чего состоит AI-агент · 02 - Как ставить задачу AI-агенту · 04 - Инструменты, API и MCP · 05 - Задачи по расписанию: crons и scheduled agents

Источник

PDF extracted from /root/.hermes/cache/documents/
TXT extract: /root/.hermes/cache/pdf_series_extract/doc_f509324da261_03 - Память и знания агента.txt
Imported into vault: 2026-05-24

Содержимое

Память и знания агента Материал 3 - внутренняя операционка агента: слой знаний

Что он помнит, что забывает, какие виды памяти можно подключить и где в агентной системе живёт правда.

Для кого Что поймёте

Для тех, кто уже понял анатомию агента Почему “агент забыл” - не один диагноз, и хочет перестать путать context, session, а сигнал проверить, где лежала memory, wiki, skills, reports, vector memory информация и была ли она вообще и graph memory. подключена.

Что внутри Главный результат

Контекст, сессия, память, база знаний, Вы сможете решить, что дать агенту skills, reports, жизненный цикл памяти, сейчас, что сохранить, что положить в векторная и графовая память. базу знаний, а что нельзя сохранять вообще.

Содержание Логика материала

В Материале 1 мы разобрали, из чего состоит агент. В Материале 2 научились ставить ему задачу. Теперь открываем блок Внутренняя операционка агента и разбираем первый слой: где живёт информация.

Главная идея 2. Карта слоя знаний

Память - не склад всего подряд. Context → session → memory → wiki/docs → skill → report.

Жизненный цикл 4. Gate сохранения

Как факт становится памятью и когда его надо Что можно и нельзя сохранять в memory. удалить.

Виды памяти 6. Пример

Обычная, векторная, графовая и wiki-база. Маркетолог и агент-маркетолог.

Практика 8. Следующий шаг

Разложить факты по слоям и проверить себя. Tools, API и MCP - слой действий агента.

Главная идея Самая частая ошибка новичка - думать, что у агента есть одна большая “память”, куда можно сложить всё: переписку, документы, факты, инструкции, временные ошибки, секреты и результаты задач. Так агент быстро превращается в мусорный ящик. Он начинает тащить старые, случайные или неверные куски контекста в новые задачи.

Коротко

Память агента - не склад для всего. Короткие устойчивые факты живут в memory. Большие знания и правила живут в wiki/docs. Повторяемые процедуры живут в skills. Результаты задач живут в reports. Временный шум не должен жить нигде.

Context → Session → Memory → Wiki/docs → Skill → Report

Главная проверка

Когда агент “забыл”, сначала спросите не “почему он тупой?”, а: где эта информация должна была жить - в текущем контексте, сессии, памяти, базе знаний, skill или отчёте?

Что это НЕ такое Перед разбором слоёв уберём опасные мифы.

Memory не значит Session не значит

“Агент теперь помнит всё навсегда”. “Вся история чата - надёжное Память должна быть короткой, хранилище”. Сессия может разрастаться, устойчивой и отобранной. сжиматься и терять детали.

Wiki не значит Vector memory не значит

“Галлюцинации исчезли”. База знаний “Агент понял смысл всего бизнеса”. помогает, но не отменяет проверку Векторный поиск ищет похожие куски, источников. но может достать не то.

Graph memory не значит Skill не значит

“Все связи теперь правильные”. Граф “Агент стал экспертом во всём”. Skill - это полезен, но его надо строить, чистить и процедура, а не мешок фактов. проверять.

Безопасная формулировка

Агент может использовать память и источники знаний, если они включены, правильно оформлены и подключены к задаче. Но память, wiki, vector search и graph memory не заменяют проверку результата.

Карта слоя знаний Четыре слоя внутренней операционки

Знания → действия → расписание → команда. Сейчас разбираем первый слой: что агент знает, где это лежит и как не превратить знания в кашу.

Задача приходит сейчас → context помогает выполнить задачу → session хранит ход текущей работы → memory сохраняет короткие устойчивые факты → wiki/docs держат большие знания и источники → vector store помогает искать похожие фрагменты → graph memory помогает видеть связи между сущностями → skill говорит, как повторить процедуру → report фиксирует результат

Context Session

Что агент видит прямо сейчас. История текущего разговора или рабочего потока.

Memory Wiki/docs

Короткие устойчивые факты на будущее. Большие знания, правила, источники и source of truth.

Vector store Graph memory

Поиск похожих смыслов по фрагментам текста. Сеть сущностей и связей: кто, что, с чем связано.

Мини-словарь Context / контекст Session / сессия

Информация для текущей задачи: запрос, файлы, История текущего разговора или рабочего потока. ссылки, вводные, ограничения. Образ: то, что Может сжиматься и терять детали. Образ: блокнот лежит на столе прямо сейчас. текущего разговора.

Memory / память Wiki / база знаний

Короткие устойчивые факты: предпочтения, Документы, правила, источники, регламенты, FAQ, стабильные правила, важные пути, повторяющиеся описания продукта, карта проекта. Образ: шкаф с коррекции. Образ: карточка “это важно помнить”. инструкциями.

Skill / навык Report / отчёт

Повторяемая процедура: когда использовать, какие Сохранённый результат задачи: что сделано, где шаги пройти, какие ошибки помнить, как артефакт, чем проверено, что осталось проверить результат. неизвестным.

Embedding / эмбеддинг Graph / граф

Числовой отпечаток фрагмента текста. Нужен, Сеть узлов и связей: клиент → продукт → договор - чтобы искать не по точным словам, а по похожему > задача → риск. Помогает видеть отношения. смыслу.

Как факт становится памятью Память - это не кнопка “запомнить всё”. Хорошая память проходит маленький жизненный цикл.

Факт появился → решили, что он устойчивый → сжали до короткой формулировки → выбрали правильное место: memory / wiki / skill / report → сохранили → использовали в новой задаче → проверили, что факт всё ещё верный → обновили или удалили, если устарел

Отбор 2. Сжатие

Не каждый факт достоин памяти. Память должна быть короткой. Не Сначала решите, пригодится ли он сохраняйте простыню вместо ясного повторно. правила.

Место 4. Ревизия

Большой документ - в wiki/docs. Старые правила надо пересматривать. Повторяемый процесс - в skill. Итог Плохая память опаснее отсутствия работы - в report. памяти.

Gate: можно ли сохранять в memory? Перед сохранением задайте семь вопросов.
Это устойчиво? 2. Это пригодится снова?

Факт будет верен не только сегодня? Если нет повторного использования - это context или report, не memory.

Это коротко? 4. Это не секрет?

Можно сформулировать в 1-2 предложения? Пароли, токены, cookies, private keys - нельзя.

Это проверено? 6. Это не документ?

Догадка агента не становится фактом просто Большой текст кладём в wiki/docs, а не в memory. потому, что звучит уверенно.

У этого есть владелец? Решение

Кто обновит или удалит факт, когда он устареет? Если хотя бы 2-3 ответа слабые - не сохраняйте в memory. Выберите другой слой.

Короткое правило

Не копируйте книгу в память. Сохраните, где лежит книга, когда к ней обращаться и кто отвечает за её актуальность.

Хорошая и плохая память Плохо Хорошо

Пользователь вчера хотел сделать PDF, Пользователь предпочитает учебные потом передумал, потом сказал, что надо материалы на русском языке: просто, подумать. практично, без канцелярита и AI-воды.

Плохо Хорошо

Клиент прислал большой PDF на 40 Документы клиента по проекту X лежат страниц. в базе знаний проекта; перед выводами нужно ссылаться на конкретный документ.

Плохо Хорошо

Агент один раз ошибся при сборке PDF, Если ошибка сборки повторяется, значит всегда надо делать так-то. оформить причину и проверку как troubleshooting skill.

Главный критерий

Хорошая memory-запись помогает будущей работе. Плохая memory-запись тащит в будущее шум, устаревшие решения и случайные эмоции.

Куда класть информацию Один и тот же текст может выглядеть важным, но жить он должен в разных местах. Вот рабочая матрица.

В текущий context В session

То, что нужно именно для этой задачи: Ход текущей работы: уточнения, цель, вводные, файл, ссылка, формат промежуточные решения, текущая ветка результата, ограничения. обсуждения.

В memory В wiki/docs

Короткие устойчивые факты, которые Большие знания: продукт, FAQ, точно пригодятся позже: стиль, регламент, политика, инструкция, база постоянное правило, важный путь, кейсов, источники. повторяющаяся коррекция.

В skill В report

Повторяемый порядок действий: триггер, Итог выполненной задачи: результат, шаги, шаблон, ошибки, проверка, артефакт, проверка, ограничения, границы. следующий шаг.

В никуда

Не сохраняйте временный шум, случайные эмоции, сырые приватные переписки, секреты, токены, одноразовые ошибки и промежуточные догадки как факты.

Пример: маркетолог и агент-маркетолог Представим Telegram topic “Маркетинг”. Там работает человек-маркетолог и агент- маркетолог. Задача - подготовить идеи постов про AI-агента в продажах.

Сырые вводные

• Мы пишем для владельцев малого бизнеса. • Тон - живой, без хайпа. • Вот 3 старых поста. • Сегодня надо написать пост про AI-агента в продажах. • Не обещать рост продаж без пилота. • Результат положить в файл и дать чеклист проверки.

Сегодняшняя задача Постоянный тон

Context: написать конкретный пост сейчас. Memory или user profile: живой русский, без хайпа.

Старые посты Запрет обещаний

Wiki/docs/examples: база примеров, не память. Memory или policy doc: стабильное правило безопасности.

Как проверять текст Готовый draft

Skill: процедура проверки фактов, тона и claims. Report/artifact: результат задачи, который можно передать дальше.

Почему “агент забыл” - не диагноз Фраза “агент забыл” звучит просто, но причины могут быть разные.

Не дали в context Это было только в session

Документ нужен для задачи, но его не Информация была в старой ветке приложили и не указали источник. разговора, но не сохранена как устойчивый факт или отчёт.

Memory не включена Vector search достал не то

Факт не был сохранён или память Похожий по смыслу фрагмент оказался вообще не участвует в этой задаче. не самым правильным источником.

Wiki не подключена Report не сохранён

Документ лежит где-то в проекте, но Задача была выполнена, но итог не агенту не сказали, где искать. оставили в виде нормального результата.

Правильный вопрос

Не “почему агент забыл?”, а: какой слой должен был держать эту информацию и был ли он реально использован?

Wiki в стиле Karpathy простыми словами Karpathy-style LLM Wiki - это идея связанной базы знаний, которую можно пополнять и улучшать со временем. Проще: не просто “папка файлов”, а библиотека, где есть страницы понятий, сущностей, сравнений, источников и связей.

raw sources concept pages

Исходники: документы, статьи, транскрипты, Страницы понятий: memory, MCP, Kanban, approval, заметки. Их лучше не портить правками. gateway.

entity pages comparisons

Страницы сущностей: проекты, инструменты, Сравнения: memory vs session, skill vs wiki, tool vs роли, клиенты, продукты. API.

index log

Карта базы: где что лежит и как читать. История изменений: что добавили, что устарело, что требует проверки.

Важно

Karpathy-style wiki - полезный паттерн для скомпилированного знания. Это не магический стандарт и не гарантия истины. Источники, свежесть и проверка всё равно нужны.

Векторная память простыми словами Векторная память - это способ искать информацию не по точному слову, а по близкому смыслу.

Документ режется на фрагменты → каждый фрагмент превращается в embedding → embeddings сохраняются в vector store → вопрос пользователя тоже превращается в embedding → система ищет похожие фрагменты → найденные фрагменты подставляются агенту в context

Когда полезно Что даёт

Много документов, FAQ, постов, писем, Агент получает релевантные куски заметок, где надо быстро найти похожий текста перед ответом, а не пытается смысл. помнить всё внутри модели.

Главный риск Что проверять

Похожее не значит правильное. Vector Источник, дату, владельца документа, search может достать близкий, но совпадение с текущей задачей и устаревший или неподходящий отсутствие секретов в индексе. фрагмент.

Графовая память простыми словами Графовая память хранит не только тексты, но и связи между сущностями.

Образ

Векторная память похожа на поиск похожих страниц. Графовая память похожа на карту отношений: кто связан с каким проектом, договором, задачей, риском, решением и источником.

Клиент → проект → договор → ответственный → задача → риск Продукт → функция → ограничение → FAQ → источник Человек → роль → решение → дата → отчёт

Когда полезно Что даёт

Много сущностей и отношений: Можно отвечать не только “найди клиенты, проекты, продукты, роли, похожий текст”, но и “покажи связи и решения, зависимости. последствия”.

Главный риск Что проверять

Если связи построены ошибочно, агент Откуда взялась связь, кто её подтвердил, будет уверенно рассуждать по неверной когда она обновлялась и можно ли карте. показать источник.

Что можно прикрутить к агенту как память Не всё это нужно сразу. Для новичка важнее понимать уровни.

Короткая memory Файловая wiki

Факты и предпочтения: стиль, правила, Markdown/PDF/docs: инструкции, FAQ, постоянные ограничения. Самый регламенты, примеры, карта проекта. простой слой. Хороший слой для курса и команды.

Vector store Graph memory

Поиск похожих смыслов по большому Сущности и связи между ними. Полезно, корпусу документов. Полезно, когда когда важны отношения, зависимости и файлов много. история решений.

SQL/таблицы Reports archive

Структурные данные: клиенты, статусы, История выполненных задач: что суммы, даты, заявки. Лучше для точных сделано, где артефакт, чем проверено, полей, чем vector search. что дальше.

Не всё является memory

Если агент подключён к базе данных, это не значит, что база стала его “памятью”. Это внешний источник, который нужно правильно запрашивать, ограничивать и проверять.

Что нельзя сохранять Некоторые вещи не должны попадать ни в memory, ни в wiki, ни в vector store, ни в graph memory, ни в reports без отдельной политики хранения.

Секреты Платёжные данные

Пароли, токены, private keys, cookies, Карты, банковские реквизиты, OAuth/session-файлы. платёжные токены, финансовые доступы.

Чувствительные данные Сырые приватные переписки

Персональные, медицинские, Личные чаты и внутренние обсуждения юридические, клиентские NDA- без явного правила хранения. материалы без разрешения.

Временный шум Непроверенные выводы

Случайные эмоции, промежуточные Догадки, которые агент сказал уверенно, ошибки, одноразовые детали задачи. но не подтвердил источниками.

Безопасная привычка

Перед сохранением спросите: это устойчивый факт, источник, процедура, результат или просто шум? Если есть риск приватности - не сохраняйте без политики и approval.

Как просить агента работать с памятью Не надо говорить только “запомни всё”. Лучше давать точную команду.

Сохранить правило Не сохранять

Сохрани как устойчивое правило: Используй это только для текущей <короткий факт>. задачи. В memory не сохраняй.

Положить в wiki Сделать skill

Это большой документ. Не пиши его в Это повторяемая процедура. Оформи её memory. Положи в базу знаний и сделай как skill: когда использовать, шаги, короткую карту. ошибки, проверка.

Проверить актуальность Оставить report

Перед использованием проверь, не После задачи сохрани отчёт: что устарело ли это правило и есть ли сделано, где файл, чем проверено, что более свежий источник. осталось неизвестным.

Главное

Управление памятью - это не магия. Это дисциплина: что сохранить, куда сохранить, кто проверит, когда обновить.

Практика: куда положить факт? Разложите элементы по слоям:

context / session / memory / wiki/docs / vector store / graph memory / skill / report / nowhere

1 2

“Автор предпочитает живой русский стиль”. “Сегодня надо написать пост про AI-агента”.

3 4

“Вот PDF клиента на проверку”. “Как проверять PDF перед отдачей”.

5 6

“Готовый отчёт по задаче”. “Пароль от сервиса”.

7 8

“Список продуктов компании”. “1000 старых постов для поиска похожих тем”.

9 10

“Клиент связан с проектом, договором и “История текущего обсуждения”. ответственным менеджером”.

11 12

“FAQ поддержки”. “Случайная эмоциональная фраза в чате”.

Разбор упражнения Возможный разбор. В реальной системе решение зависит от политики проекта, но логика такая:

1 → memory/user profile 2 → context

Устойчивое предпочтение стиля. Текущая задача, не долговременная память.

3 → context или docs 4 → skill

Для задачи - context; если это база клиента - docs с Повторяемая процедура проверки. политикой доступа.

5 → report 6 → nowhere

Итог работы и ссылка на артефакт. Пароль нельзя сохранять в память/wiki/отчёт/index.

7 → wiki/docs или SQL 8 → vector store

Большое знание о компании или структурная Много текстов, по которым нужен смысловой таблица. поиск.

9 → graph memory 10 → session

Здесь важны связи между сущностями. Ход текущей работы.

11 → wiki/docs 12 → nowhere

База знаний поддержки. Не превращаем эмоцию момента в устойчивый факт.

Частые ошибки Сохранять всё в memory Путать session и memory

Память пухнет, агент тащит мусор в То, что было в разговоре, не обязательно новые задачи. стало устойчивым фактом.

Думать, что vector search решит всё Делать graph без источников

Похожий текст не всегда правильный, Красивая сеть связей бесполезна, если свежий или разрешённый к непонятно, откуда взялись связи. использованию.

Делать skill из факта Не сохранять report

Skill - это процедура, а не “запомни эту Большая работа умирает в чате, если нет мысль”. результата и ссылки на артефакт.

Ошибка курса на будущее

Если ученик не различает memory, wiki, vector store, graph memory, skill и report, он будет лечить все проблемы одним способом: “давай добавим в память”. Это почти всегда ухудшает систему.

Чеклист готовности После материала человек должен уметь ответить на эти вопросы:

Текущая задача Будущее

Что агент должен видеть прямо сейчас? Что нужно помнить на будущее?

База знаний Смысловой поиск

Что должно лежать в wiki/docs? Когда нужен vector store, а когда обычного документа достаточно?

Связи Процедура

Когда нужен graph memory, а когда это Что является skill, а не фактом? лишняя сложность?

Приватность Проверка

Что нельзя сохранять вообще? Как агент докажет, что использовал правильные знания?

Главный вывод

Хороший агент не “помнит всё”. Хороший агент работает с правильно разложенной информацией: текущий контекст, аккуратная память, живая база знаний, смысловой поиск, карта связей, повторяемые skills и отчёты, которые не теряются в чате.

Что дальше Мы разобрали слой знаний. Следующий слой внутренней операционки - действия.

Материал 4

Дальше разберём tools, API и MCP: чем агент действует руками, почему без доступа он может только объяснять, и где начинается риск внешних действий.

Слой 1 Слой 2

Знания: context, session, memory, wiki, vector store, Действия: tools, API, MCP, permissions, approval. graph memory, skill, report.

Слой 3 Слой 4

Время: crons и scheduled agents. Команда: Kanban, handoff и multi-agent.

Источники для дальнейшего чтения Эти источники помогают углубиться. Это не значит, что каждая система работает одинаково: точные команды и настройки всегда проверяются по текущей версии инструмента.

LangChain - Memory overview Базовая рамка short-term / long-term memory и типов памяти.

https://docs.langchain.com/oss/python/concepts/memory

MemGPT Идея memory tiers и управления контекстом как аналогия с операционной системой.

https://arxiv.org/abs/2310.08560

MemGPT project Проектная страница MemGPT/Letta как companion к paper: полезна для понимания memory tiers и agent state.

https://research.memgpt.ai/

Karpathy - LLM Wiki Informal-паттерн связанной wiki-базы знаний. Полезен как идея, но это не стандарт и не гарантия истины.

https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

Weaviate - What is a vector database Vendor explainer по vector database, embeddings и semantic search. Используется как понятное введение, не как единственная техническая база.

https://weaviate.io/blog/what-is-a-vector-database

Microsoft GraphRAG Пример graph-based подхода к retrieval-augmented generation.

https://microsoft.github.io/graphrag/

Google Cloud - Retrieval Augmented Generation Нейтральное vendor-объяснение RAG: как external knowledge/retrieval помогает отвечать на основе источников, а не только памяти модели.

https://cloud.google.com/use-cases/retrieval-augmented-generation

OWASP LLM02 - Sensitive Information Disclosure

Security anchor для блока: что нельзя сохранять в memory/wiki/context и почему sensitive data требует отдельной политики.

https://genai.owasp.org/llmrisk/llm022025-sensitive-information-disclosure/

NIST AI Risk Management Framework Общая рамка AI risk management: полезна для объяснения governance, ответственности и проверки при хранении знаний.

https://www.nist.gov/itl/ai-risk-management-framework

Hermes Agent docs Официальная документация Hermes по profiles, memory, skills, tools, gateway, cron и MCP.

https://hermes-agent.nousresearch.com/docs/

Полезные ссылки YouTube Видео и разборы Алексея Ульянова

https://youtube.com/@alekseiulianov

Telegram-канал Sprut AI Публичные материалы, новости и разборы

https://t.me/Sprut_AI