Интеграция с веб-сайтом
Интеграция позволяет загружать данные с веб-сайта в базу знаний, автоматически синхронизировать и переиндексировать их.
Обработка страниц из интеграции с веб-сайтом тарифицируется отдельно.
Какие данные будут загружены
Предусмотрено три варианта загрузки:
- Сайт целиком: страницы, найденные роботом при обходе сайта, начиная с главной страницы.
- Раздел: поиск ограничен вложенными (дочерними) страницами указанного раздела.
- Отдельные страницы.
- Общее количество страниц — не более 100.
- Загружается только текст HTML-страниц. Изображения не загружаются и не обрабатываются (однако могут появиться в ответе, поскольку в тексте есть ссылки на них). Файлы других форматов игнорируются.
Создание интеграции
Чтобы загрузить тексты страниц с сайта:
-
Перейдите в раздел Интеграции и нажмите Подключить → Веб-сайт.
Если при создании проекта вы выбрали Подключить интеграцию, то попадете на страницу новой интеграции автоматически.
-
Укажите настройки интеграции:
-
Название интеграции — используется как префикс к названиям источников, загруженных из этой интеграции.
-
Сегменты — к ним будут относиться источники, загруженные из этой интеграции. Сегменты позволяют сгруппировать источники с общей темой. В дальнейшем сегменты можно указывать в запросе к базе знаний для поиска информации только в этих сегментах. Подробнее читайте в разделе Сегменты.
-
Домен — адрес сайта. Допустим поддомен любого уровня.
-
Данные для скачивания:
-
Для варианта Раздел укажите начальный путь.
Например, если ввести
/features/1, то могут быть загружены страницы/features/1/docs,/features/1/pricing/discounts, но не/features/2. -
Для варианта Отдельные страницы укажите все пути к страницам, которые нужно загрузить.
-
-
Автоматически синхронизировать данные — включите для поддержания актуальности базы знаний, отключите для однократной загрузки.
предупреждениеПовторная обработка каждой страницы тарифицируется, даже если страница не менялась.
-
Автоматически перезапускать процесс индексации — включите, чтобы переиндексировать базу знаний после очередной синхронизации.
примечаниеВсе настройки впоследствии можно изменить.
-
Статус интеграции сразу после создания — «Идет обновление». Когда статус сменится на «Подключено», вы сможете просмотреть загруженные страницы в разделе Источники.
В дополнение к данным из интеграций вы можете загрузить файлы вручную.
После загрузки данных нужно проиндексировать базу знаний.
О принудительной синхронизации и изменении настроек читайте в разделе Управление интеграциями.