Форматы файлов и интеграции — что можно загрузить в istok.ai
PDF, DOCX, XLSX, PPTX, CSV, TXT, HTML, Markdown, сканы с OCR — более 12 форматов из коробки. Загрузка drag-and-drop или через REST API. Индексация за 90 секунд.
Корпоративная информация живёт в десятках форматов. Финансовые отчёты — в XLSX. Презентации для совета директоров — в PPTX. Договоры — в PDF и DOCX. Техническая документация — в Markdown. Логи и выгрузки — в CSV и TXT. Старые регламенты — в сканированных PDF.
Любая AI-платформа, которая претендует на работу с корпоративными данными, должна понимать все эти форматы. istok.ai поддерживает более 12 типов файлов из коробки.
Поддерживаемые форматы
PDF — текстовые и сканированные (с OCR-распознаванием).
DOCX — документы Microsoft Word с сохранением структуры.
XLSX — таблицы Excel с данными и формулами.
PPTX — презентации PowerPoint со слайдами и заметками.
CSV / TSV — табличные данные и выгрузки.
TXT — простой текст.
HTML — веб-страницы и сохранённые письма.
Markdown — техническая документация, README-файлы.
Сканы — любой PDF с изображениями вместо текста.
Процесс загрузки
Два способа: drag-and-drop в веб-интерфейс или программная загрузка через REST API. При пакетной загрузке через API вы можете автоматизировать индексацию — например, настроить ежедневный импорт новых документов из внутренней файловой системы.
После загрузки документ проходит через пайплайн: парсинг → нормализация текста → разбивка на смысловые чанки → векторизация → индексация. Весь процесс — около 90 секунд, и документ готов для поиска и вопросов.
Управление доступом
RBAC-модель определяет, кто видит чьи документы. Разграничение по отделам, проектам, ролям. Каждый документ привязан к конкретному пользователю или проекту, и поиск работает с учётом прав доступа — сотрудник не увидит документы, к которым у него нет доступа.
Превью и оригиналы
Загруженные документы можно просматривать в браузере (встроенный превью) и скачивать в оригинальном формате. Фильтрация и поиск по названию позволяют быстро найти нужный файл в коллекции.