Анализ тендерной документации
Полный разбор PDF, DOCX, XLSX и сканированных документов. Извлечение товарных позиций, объёмов, требований и сроков — автоматически.
Запросить demoЗачем нужен автоматический разбор документации
Десятки файлов на тендер
Типичный тендер содержит от 5 до 30 документов. Технические задания, сметы, спецификации, чертежи — всё это нужно прочитать и понять.
Сканы вместо текста
Часть документов — это сканы с печатями и подписями. Без OCR их невозможно обработать автоматически. Наш сервис распознаёт их.
Таблицы и позиции
Из документов извлекаются товарные позиции, единицы измерения, объёмы и требования. Эти данные идут в расчёт себестоимости.
Что сервис делает с документами
Извлечение текста
PDF, DOCX, XLSX — полное извлечение без ограничений на размер. Каждый документ разбивается на части (document_chunks) для дальнейшего анализа.
OCR для сканов
Распознавание через worker-ocr. Результаты сохраняются и индексируются наравне с текстовыми документами.
Векторная индексация
Embeddings по document_chunks для semantic search. При финальном анализе сервис находит нужные фрагменты из сотен страниц документации.
Товарные позиции
Из таблиц и текстовых блоков извлекаются конкретные позиции. Каждая позиция идёт на этап research — поиск рыночных цен.