База знаний AI-агента

Показываем, как добавить материалы в базу знаний AI-агента, какие форматы поддерживаются и как подготовить полезные источники для ответов.

База знаний - это материалы, на которые AI-агент опирается при ответах пользователям. Именно база знаний помогает агенту понимать, о чём говорить, какие формулировки использовать и откуда брать факты для ответа. 

Зачем нужна база знаний

Без базы знаний агент будет отвечать слишком общо или недостаточно точно. База нужна, чтобы он ориентировался в вашем продукте, услугах, процессах, правилах работы и типовых вопросах пользователей.

Обычно в базу знаний загружают:

  • FAQ;
  • инструкции;
  • описание услуг и продуктов;
  • условия оплаты, доставки или доступа;
  • регламенты общения;
  • внутренние справки, на которые должен опираться агент.

Как добавить материалы

Во вкладке «База знаний» можно добавить материалы тремя способами:

  • загрузить файл;
  • вставить URL-ссылку;
  • описать информацию своими словами.

Если вы добавляете сайт, можно включить рекурсивный обход. В этом случае система попробует автоматически проиндексировать не только указанную страницу, но и другие страницы сайта.
При добавлении сайта в базу знаний индексируется до 50 страниц.

Агент может использовать загруженные материалы, чтобы находить нужную информацию и формировать ответы пользователям.

📍Поддерживаемые форматы файлов: PDF, DOCX, DOC, TXT, CSV.
Максимальный размер одного файла: до 10 МБ.

Также в источники можно добавлять изображения:

  • до 5 изображений на один источник;
  • размер каждого изображения: от 5 КБ до 5 МБ.

Лимиты базы знаний

🗂️ Для одного агента можно добавить до 20 источников.

Общего фиксированного лимита на суммарный размер базы знаний нет, но действует косвенное ограничение: если загрузить максимум источников, общий объём может составить до 200 МБ (20 файлов × 10 МБ).

После загрузки документа система автоматически разбивает текст на небольшие смысловые части, которые называются чанками 📝
Когда пользователь задаёт вопрос, агент ищет подходящие чанки и использует их для подготовки ответа.

❗️Лимит чанков: до 5 000 на одного агента.

Обработка документов

При загрузке материалов действуют следующие ориентиры:

  • документы объёмом до 50 страниц обрабатываются с таймаутом до 60 секунд;
  • извлечение тем и FAQ-пар также выполняется с таймаутом до 60 секунд;
  • из одного источника можно извлечь до 30 тем;
  • суммарно для одного агента доступно до 500 тем.

Что происходит после загрузки

После загрузки материалы обрабатываются системой. Пока источник не готов, агент может ещё не использовать его в ответах. Поэтому после добавления новых файлов лучше сначала дождаться статуса готовности, а затем ещё раз проверить ответы в тестовом чате.

Полезные советы

Чтобы база знаний работала лучше, старайтесь загружать понятные и актуальные материалы. Не стоит смешивать устаревшие инструкции с новыми или добавлять слишком много лишних документов “на всякий случай”. Чем чище и понятнее база, тем полезнее ответы агента.

👆 На этом пока всё