Перейти к основному содержимому

Интеграция с веб-сайтом

Интеграция позволяет загружать данные с веб-сайта в базу знаний, автоматически синхронизировать и переиндексировать их.

Обработка страниц из интеграции с веб-сайтом тарифицируется отдельно.

Какие данные будут загружены

Предусмотрено два варианта загрузки:

  • Указанные вами страницы.
  • Страницы, найденные роботом при обходе сайта, начиная с главной страницы.
Ограничения
  • Общее количество страниц — не более 100.
  • Загружается только текст HTML-страниц. Изображения не загружаются и не обрабатываются (однако могут появиться в ответе, поскольку в тексте есть ссылки на них). Файлы других форматов игнорируются.

Создание интеграции

Чтобы загрузить тексты страниц с сайта:

  1. Перейдите в раздел Интеграции и нажмите Подключить → Веб-сайт.

    Если при создании проекта вы выбрали Подключить интеграцию, то попадете на страницу новой интеграции автоматически.

  2. Укажите настройки интеграции:

    Настройки интеграции с веб-сайтом
    • Название интеграции — используется как префикс к названиям источников, загруженных из этой интеграции.

    • Сегменты — к ним будут относиться источники, загруженные из этой интеграции. Сегменты позволяют сгруппировать источники с общей темой. В дальнейшем сегменты можно указывать в запросе к базе знаний для поиска информации только в этим сегментах. Подробнее читайте в разделе Сегменты.

    • Домен — адрес сайта. Допустим поддомен любого уровня.

    • Выбрать ссылки для скачивания — активируйте, чтобы вручную указать страницы для загрузки в базу знаний.

    • Автоматически синхронизировать данные — включите для поддержания актуальности базы знаний, отключите для однократной загрузки.

      предупреждение

      Повторная обработка каждой страницы тарифицируется, даже если страница не менялась.

    • Автоматически перезапускать процесс индексации — включите, чтобы переиндексировать базу знаний после очередной синхронизации.

    примечание

    Все настройки впоследствии можно изменить.

Статус интеграции сразу после создания — «Идет обновление». Когда статус сменится на «Подключено», вы можете просмотреть загруженные страницы в разделе Источники.

Источники, загруженные с веб-сайта

В дополнение к данным из интеграций вы можете загрузить файлы вручную.

После загрузки данных нужно проиндексировать базу знаний.

к сведению

О принудительной синхронизации и изменении настроек читайте в разделе Управление интеграциями.