Перейти к основному содержимому

Загрузка файлов вручную

Чтобы загрузить данные в виде файлов, перейдите в раздел Источники и нажмите Добавить файл. Если при создании проекта вы выбрали Загрузить файлы вручную, окно загрузки откроется автоматически.

В интерфейсе можно загрузить до 100 файлов за один раз.

Источники
к сведению

Для загрузки файлов необходима роль не ниже KHUB_EDITOR.

Требования к файлам

  • Текстовые данные:

    • Допустимые форматы: PDF, DOCX, TXT, XML, JSON, YAML, MD, MDX, HTML.
    • Размер одного файла: до 25 Мб.
  • Табличные данные:

    • Допустимые форматы: CSV, XLSX.
    • Не более 10 файлов.
    • Размер одного файла: до 100 Мб.
    • Первая строка должна содержать названия столбцов.
    • Допустимые разделители в CSV: , или ;.
    • В XLSX не должно быть объединенных ячеек.
    предупреждение

    В XLSX обрабатывается только первый лист, остальные игнорируются.

  • Аудио и видео:

    • Допустимые форматы: MP3, MP4, MPEG4, WAV, AAC.
    • Размер одного файла: до 1 Гб.

Возобновляемая загрузка

Файлы свыше 40 Мб загружаются по частям. Если закрыть окно загрузки, она остановится. Файлы, которые были загружены частично, хранятся в течение суток.

Чтобы продолжить загрузку:

  1. В разделе Источники снова нажмите Добавить файл.
  2. В окне загрузки отображаются частично загруженные файлы. Вы можете удалить или добавить файлы, если требуется.
  3. Нажмите Сохранить.

💡 Рекомендации

  • Проверьте, что файлы не содержат конфиденциальную информацию. Все загруженные данные будут доступны для индексации и использования. Ваши клиенты или сотрудники смогут получить к ним доступ, когда будут обращаться к базе знаний.
  • Используйте текстовые файлы, где текст понятен системе. Например, сканированные документы не всегда хорошо распознаются. Это может повлиять на процесс индексации и качество ответов пользователям вашей базы знаний.
  • В окне загрузки после выбора файлов появляется возможность указать сегменты базы знаний, к которым будут относиться загружаемые файлы. Сегменты позволяют сгруппировать источники с общей темой. В дальнейшем сегменты можно указывать в запросе к базе знаний для поиска информации только по этим сегментам. Подробнее читайте в разделе Сегменты.
к сведению