Д. П. Маталов, Е. Л. Плискин "Веб-сервис на основе SDK для распознавания документов" |
Аннотация. Статья обобщает опыт разработки веб-службы на основе SDK для распознавания документов (OCR). Рассматриваются вопросы устойчивости и производительности веб-службы: способность не терять данные при высокой нагрузке и после перезапуска; способность своевременно обнаруживать ошибки, ограничивать их распространение и длительность; а также свойство детерминированности веб-службы в условиях параллельной обработки множества запросов. Высокая производительность подразумевает умеренные накладные расходы, связанные с приёмом запросов и отправкой ответов клиентам, помимо собственно распознавания. Описанное решение может применяться для создания веб-службы из любого SDK, который позволяет обрабатывать входные документы и получать из них выходные файлы, в том числе не обязательно в связи с технологиями оптического распознавания. Ключевые слова: SDK, SOAP, REST, Java, Web service, оптическое распознавание, OCR, многопоточность. Стр. 32-43. 