Когда применять RAG?

Часто меняются цены, регионы, интеграции. Нужна согласованность между поддержкой и маркетингом. Нужна проверяемость: какой URL лёг в основу ответа.

Глоссарий

RAG (Retrieval-Augmented Generation)

RAG — когда нейросеть отвечает не только из «памяти» обучения, а подмешивает найденные документы: ваш сайт, базу знаний, PDF. Так чаще получаются фактичные ответы про бренд.

Сначала поиск по корпусу, потом генерация ответа — классическая связка для корпоративных чатов и поиска.
Связано с GEO, llms.txt и цитированием.

Определение

RAG (по-англ. retrieval-augmented generation, «генерация с поиском») — схема, в которой модель перед ответом получает подобранные фрагменты из вашей базы: индекс сайта, внутренняя база знаний, тикеты, прайс. Ответ опирается на эти фрагменты, а не только на то, что «запомнила» модель при обучении. Поэтому обновление страниц, вопросов-ответов и таблиц может менять ответы в чат-ботах без переобучения самой модели.

Пример

Пользователь спрашивает про условия возврата. Система находит актуальный абзац из вашей справки и подставляет его в запрос к модели. В ответе — ваши формулировки и ссылка на страницу. Если в базе лежит устаревший абзац про «14 дней», а на сайте уже «30 дней», модель может выдать старую цифру — это уже не «магия RAG», а ошибка в данных.

Как считается

Типичный контур: тексты режутся на фрагменты, для них считаются векторные признаки, по вопросу пользователя ищут несколько лучших совпадений по смыслу, эти куски попадают в запрос к модели как контекст; модель просят не выходить за его пределы. Качество зависит от того, как режут текст, от даты материалов и от правила «что делать, если подходящего текста нет».

Как это работает на практике

На что смотреть в работе

Страницы-источники — чёткая структура, даты, канонические адреса, чтобы поиск по базе стабильно находил правду.
Доступ для краулеров — robots.txt и llms.txt не должны отрезать нужный корпус.
Контроль — сравнивайте LLM-Score и цитаты до и после выката новой базы знаний.

Как читать показатель

Схема с поиском снижает, но не убирает ошибочные утверждения: если в контекст попал неверный фрагмент, модель может его усилить. Проверяйте устойчивость через размноженные запросы.

Когда использовать

Часто меняются цены, регионы, интеграции.
Нужна согласованность между поддержкой и маркетингом.
Нужна проверяемость: какой URL лёг в основу ответа.

GEO (оптимизация под генеративные движки)llms.txt Цитирование (citation)LLM-Score

Проверить цитирование и ответы