Загрузка файлов вручную
Чтобы загрузить данные в виде файлов, перейдите в раздел Источники и нажмите Добавить файл. Если при создании проекта вы выбрали Загрузить файлы вручную, окно загрузки откроется автоматически.
В интерфейсе можно загрузить до 100 файлов за один раз.
к сведению
Для загрузки файлов необходима роль не ниже KHUB_EDITOR.
Требования к файлам
-
Текстовые данные:
- Допустимые форматы: PDF, DOCX, TXT, XML, JSON, YAML, MD, MDX, HTML.
- Размер одного файла: до 25 Мб.
-
Табличные данные:
- Допустимые форматы: CSV, XLSX.
- Не более 10 файлов.
- Размер одного файла: до 100 Мб.
- Первая строка должна содержать названия столбцов.
- Допустимые разделители в CSV:
,или;. - В XLSX не должно быть объединенных ячеек.
предупреждениеВ XLSX обрабатывается только первый лист, остальные игнорируются.
-
Аудио и видео:
- Допустимые форматы: MP3, MP4, MPEG4, WAV, AAC.
- Размер одного файла: до 1 Гб.
Возобновляемая загрузка
Файлы свыше 40 Мб загружаются по частям. Если закрыть окно загрузки, она остановится. Файлы, которые были загружены частично, хранятся в течение суток.
Чтобы продолжить загрузку:
- В разделе Источники снова нажмите Добавить файл.
- В окне загрузки отображаются частично загруженные файлы. Вы можете удалить или добавить файлы, если требуется.
- Нажмите Сохранить.
💡 Рекомендации
- Проверьте, что файлы не содержат конфиденциальную информацию. Все загруженные данные будут доступны для индексации и использования. Ваши клиенты или сотрудники смогут получить к ним доступ, когда будут обращаться к базе знаний.
- Используйте текстовые файлы, где текст понятен системе. Например, сканированные документы не всегда хорошо распознаются. Это может повлиять на процесс индексации и качество ответов пользователям вашей базы знаний.
- В окне загрузки после выбора файлов появляется возможность указать сегменты базы знаний, к которым будут относиться загружаемые файлы. Сегменты позволяют сгруппировать источники с общей темой. В дальнейшем сегменты можно указывать в запросе к базе знаний для поиска информации только по этим сегментам. Подробнее читайте в разделе Сегменты.
к сведению
- В дополнение к файлам вы можете настроить интеграции для загрузки данных из внешних систем.
- После загрузки данных нужно проиндексировать базу знаний.