Сегменты базы знаний
Сегмент — это тема или категория, к которой относится документ-источник в базе знаний. Используйте сегменты, чтобы выделить в базе знаний логические разделы и разграничить доступ к информации.
Источник можно включить в один или несколько сегментов или оставить без сегмента.
Примеры сегментов:
- По целевой аудитории: «Физические лица», «Юридические лица», «Партнеры», «Технические специалисты».
- По продуктам и услугам: «Кредитование», «Инвестиции».
- По процессам: «Закупки», «Контроль качества».
Формирование сегментов
Укажите названия сегментов при загрузке файлов и настройке интеграций. Предварительно регистрировать сами сегменты не требуется, названия могут быть произвольными.
Чтобы изменить сегменты после загрузки источников:
- Перейдите в раздел Источники в проекте базы знаний.
- Отметьте источники и нажмите Сегменты.
- Задайте новый набор сегментов. Прежний набор сегментов будет удален и заменен новым.
При изменении набора сегментов в настройках интеграции новый набор применяется ко всем источникам из этой интеграции — как уже загруженным, так и будущим.
Поиск по сегментам
Вы можете задать область поиска в запросе к базе знаний через API и в тестовом диалоге. В область поиска можно включить как определенные сегменты, так и источники, у которых сегменты не заданы.
В настройках проекта доступно два режима поиска:
-
Строгий — поиск выполняется только в заданной области. Если в ней не найдено релевантной информации, система сообщает об отсутствии данных.
-
Расширяемый (выбран по умолчанию) — если в заданной области не найдено ни одного чанка, поиск выполняется по всей базе знаний.
Особенности расширяемого поискаСистема может найти в заданной области чанки с низкой релевантностью. Поскольку хотя бы один чанк найден, поиск не будет расширен на всю базу знаний. В результате ответ может быть неполным или неточным.
Чтобы повысить качество поиска в таких случаях, включите повторное ранжирование. Он оценит релевантность найденных чанков. Если реранкер отфильтрует их как неподходящие, система запустит поиск по всей базе знаний.
Оценка качества
Чтобы оценить качество ответов по отдельным сегментам базы знаний, добавьте в тест-сет столбец Segments.
Если для ответа на вопрос нужно искать информацию в определенных сегментах, укажите их через запятую. Для поиска по источникам, которые не относятся ни к одному сегменту, укажите include_without_segments
.
Для поиска по всей базе знаний оставьте поле пустым.
Пример значения: Контроль качества,include_without_segments
.