Глоссарий
RAG (Retrieval-Augmented Generation)
Сначала поиск по корпусу, потом генерация ответа — классическая связка для корпоративных чатов и поиска.
Связано с GEO, llms.txt и цитированием.
Определение
RAG (по-англ. retrieval-augmented generation, «генерация с поиском») — схема, в которой модель перед ответом получает подобранные фрагменты из вашей базы: индекс сайта, внутренняя база знаний, тикеты, прайс. Ответ опирается на эти фрагменты, а не только на то, что «запомнила» модель при обучении. Поэтому обновление страниц, вопросов-ответов и таблиц может менять ответы в чат-ботах без переобучения самой модели.
Пример
Пользователь спрашивает про условия возврата. Система находит актуальный абзац из вашей справки и подставляет его в запрос к модели. В ответе — ваши формулировки и ссылка на страницу. Если в базе лежит устаревший абзац про «14 дней», а на сайте уже «30 дней», модель может выдать старую цифру — это уже не «магия RAG», а ошибка в данных.
Как считается
Типичный контур: тексты режутся на фрагменты, для них считаются векторные признаки, по вопросу пользователя ищут несколько лучших совпадений по смыслу, эти куски попадают в запрос к модели как контекст; модель просят не выходить за его пределы. Качество зависит от того, как режут текст, от даты материалов и от правила «что делать, если подходящего текста нет».
Как это работает на практике
На что смотреть в работе
- Страницы-источники — чёткая структура, даты, канонические адреса, чтобы поиск по базе стабильно находил правду.
- Доступ для краулеров — robots.txt и llms.txt не должны отрезать нужный корпус.
- Контроль — сравнивайте LLM-Score и цитаты до и после выката новой базы знаний.
Как читать показатель
Схема с поиском снижает, но не убирает ошибочные утверждения: если в контекст попал неверный фрагмент, модель может его усилить. Проверяйте устойчивость через размноженные запросы.
Когда использовать
- Часто меняются цены, регионы, интеграции.
- Нужна согласованность между поддержкой и маркетингом.
- Нужна проверяемость: какой URL лёг в основу ответа.