/Pages/ProductsPage.aspx

ABBYY Recognition Server и Google Search Appliance

Поиск нужной информации в считанные секунды давно стал актуальной проблемой для многих организаций. Зачастую поиск документа или данных занимает слишком много времени у сотрудников, что отрицательно сказывается на работе в целом. Быстрый поиск документов в рамках предприятия может быть осуществлен благодаря специальным поисковым серверам, которые индексируют документы внутри организации. Примером тому - поисковый сервер Google Search Appliance (GSA).

Google Search Appliance (GSA) представляет собой специализированное сетевое устройство, предназначенное для решения проблемы поиска информации во внутренней сети предприятия. Google Search Appliance автоматически индексирует документы в корпоративной системе для осуществления поиска. Google Search Appliance позволяет вести поиск по более 200 форматам документов, среди которых HTML, DOC, XLS, TXT и другие.

Однако не все документы хранятся в подходящем для индексирования формате. Множество документов хранится в виде графических изображений, поиск по содержимому которых невозможен. Примерами таких документов могут быть факсы, копии отсканированных договоров, презентации и другие документы. Для осуществления поиска по графическим образам документов, прежде всего необходимо перевести их в текстовый формат для возможности индексирования. Самым удобным способом для этого является интеграция системы распознавания в работу поискового сервера.

ABBYY Recognition Server представляет собой единое серверное решение для распознавания и конвертации документов. При работе с Google Search Appliance, ABBYY Recognition Server осуществляет функционал распознавания и позволяет индексировать текст отсканированных или присланных по факсу документов. Теперь для индексирования доступны документы в форматах TIFF, JPEG, PDF, DjVu и т.п. В основе ABBYY Recognition Server лежит мощная технология обработки документов на более 190 языках.

Схема работы Google Search Appliance и ABBYY Recognition Server:

  1. Google Search Appliance автоматически индексирует документы в корпоративной системе. Если в систему поступают документы в графических форматах, которых нет возможности проиндексировать, то такие документы направляются на обработку в ABBYY Recognition Server.
  2. ABBYY Recognition Server распознает документы и отправляет результаты в виде XML-фида в Google Search Appliance для индексирования, после чего данные документы становятся доступны для поиска.

Преимущества совместного решения:

  1. Ни один документ не останется ненайденным. Совместное решение Google Search Appliance и ABBYY Recognition Server позволяют вести поиск по более 200 форматов файлов, в том числе TIFF, JPEG, PDF, DjVu и другим.
  2. Готовое к использованию решение. Не нужно вручную сортировать документы и отправлять на графические документы на предварительную обработку. Совместная решение Google Search Appliance и ABBYY Recognition Server позволяет автоматически обрабатывать графические документы до их индексирования в системе.
  3. Масштабируемость. ABBYY Recognition Server может быть установлен на отдельном компьютере в корпоративной сети, а также производить обработку одновременно на нескольких процессорах, что быстро и легко производить обработку документов.


Rambler's Top100