<< Назад
Принцип работы ABBYY Recognition Server
Работа системы:
- Документы сканируются с помощью станции сканирования или поступают на обработку через «горячую» папку в локальной сети и по электронной почте;
- Программа автоматически выполняет распознавание изображений и поиск штрих-кодов;
- При необходимости можно задействовать верификацию и визуально проверить результаты распознавания на станции верификации;
- Поток распознанных изображений разделяется на документы. Программа позволяет определить тип каждого документа и присвоить ему соответствующие атрибуты;
- Документы экспортируются в нужном формате (сохраняются в папку, загружаются в СЭД, отправляются по электронной почте и т.д.).
Этапы обработки документов:
Импорт изображений и предварительная обработка
Различные форматы файлов:
- Конвертация изображений из форматов: JPEG, TIFF, BMP, PDF, DjVu и другие.
Импорт изображений из различных источников:
- Импорт из локальной или сетевой папки: поддержаны входящие папки со сложной структурой (со вложенными подпапками), при экспорте программа автоматически повторяет структуру входящей папки.
- Импорт вложений из писем, присланных по электронной почте. Пользователи могут посылать изображения на распознавание как из своей почтовой программы, так и непосредственно с сетевых сканеров и МФУ.
- Импорт через станцию сканирования. Документы могут поступать с разных станций сканирования разными пакетами.
Предварительная обработка:
- Автоматическое определение ориентации;
- Исправление перекоса;
- Разделение сдвоенных книжных страниц.
Распознавание и конвертация
Высокое качество распознавания и восстановления оформления документа:
- Поддержка 191 языка распознавания печатного текста, включая языки на основе латинского, греческого, тайского, армянского и кириллического алфавитов, а также японский, корейский, китайский и тайский языки.
- Распознавание многоязычных документов.
- Режим быстрого распознавания увеличивает скорость обработки изображений хорошего качества в 2-2,5 раза.
- Поддержано распознавание различных типов текста: типографская печать, печатная машинка, матричный принтер, MICR (E13B), OCR-A, OCR-B.
Распознавание штрих-кодов:
- Поддержано распознавание наиболее популярных одномерных и двумерных штрих-кодов.
- Автоматически идентифицируются и распознаются штрих-коды, расположенные на странице под любым углом к горизонтали.
Контроль качества распознавания:
- Установка порога качества распознавания изображений, основанная на допустимом количестве неуверенно распознанных символов на страницу.
Преобразование PDF-файлов
Обработка заданий
Разделение и сборка документов:
- Разделение документов в потоке по пустым листам, листам с разделительным штрих-кодом, по фиксированному количеству страниц в документе.
- Возможна сборка одностраничных изображений из каждой обрабатываемой подпапки в отдельный файл.
Многопроцессорная работа:
- Запуск нескольких параллельных процессов распознавания позволяет эффективно задействовать ресурсы многопроцессорной системы.
- Предусмотрена масштабируемость на несколько компьютеров в локальной сети: можно легко расширять мощность системы, увеличивая количество станций обработки. Подключение дополнительных станций через консоль администрирования занимает всего несколько минут.
- Задание расписания для отдельных станций обработки или групп станций дает возможность управлять загрузкой вычислительных мощностей в течение рабочего дня или недели.
Равномерная загрузка:
- Менеджер сервера автоматически распределяет задания между станциями обработки, выравнивая нагрузку между процессорами.
- Менеджер сервера самостоятельно разделяет многостраничный документ на части и отправляет каждую из частей на свободную станцию обработки. Затем все части документа снова будут собраны в одно задание. Таким образом, распознавание/конвертация нескольких частей одного документа происходит одновременно.
Отказоустойчивость:
- Периодическая проверка работоспособности станций.
- Автоматическое восстановление связи со станцией после временного сбоя в работе станции.
- Автоматический запуск менеджера сервера после перезагрузки операционной системы.
- Автоматическое возвращение задания в очередь или перенаправление задания на другую доступную станцию в случае сбоя в работе станции.
Верификация
Станция верификации позволяет оператору проверять, правильно ли была проанализирована страница, создавать и редактировать блоки, проверять неуверенно распознанные символы, а также редактировать распознанный текст.
После верификации и устранения ошибок, страница будет отправлена на дальнейшую обработку или проэкспортирована. При неудовлетворительных результатах распознавания, оператор станции верификации может отправить страницу на повторную обработку.
Индексирование
Индексирование позволяет присваивать атрибуты распознанным документам: «дата», «номер документа», «краткое содержание» и другие. Индексирование документов может быть осуществлено:
Экспорт результатов
- Публикация документов в локальную или сетевую папку с сохранением структуры вложенных подпапок.
- Публикация документов в библиотеки Microsoft Office SharePoint® Server.
- Отправка распознанных документов получателям по электронной почте. Документ может быть отправлен на тот же адрес, с которого поступило изображение для распознавания, или на любой другой адрес, указанный в задании.
- Правила для формирования имени выходного файла и папки, в которую его следует сохранить. Имена файла и папки могут быть сформированы с использованием значения разделительного штрих-кода, даты и времени поступления документа и т.д.
Настройка системы:
Настройка процесса обработки
Администрирование
- Администрирование приложения при помощи централизованной консоли управления на базе Microsoft® Management Console (MMC).
- Конфигурирование системы.
- Настройка параметров процессов обработки, расписаний, приоритетов выполнения заданий. Управление очерёдностью выполнения заданий.
- Управление правами пользователей.
- Просмотр журнала событий.
- Получение уведомлений о сбоях в работе системы по электронной почте .
Дополнительно:
Архитектура ABBYY Recognition Server 3.0 >>
Возможности для установки и интеграции >>
Новое в версии 3.0 >>
<< Назад