 |
Д.Л. Шоломов, А.Г. Волков, Д.В. Полевой "Об идентификации документа в терминах задачи линейного программирования" |
 |
Аннотация. В работе предложен метод описания шаблона документа с помощью правил взаимного расположения его примитивных элементов, при котором решение задачи идентификации слабоструктурированного документа сводится к решению задачи целочисленного линейного программирования. При этом максимизируемый функционал описывает отображение шаблона на конкретный экземпляр документа, а правила взаимного расположения элементов преобразуются в набор линейных неравенств. Ключевые слова: распознавание документов, описание шаблона, привязка шаблона, гибкие формы, идентификация документа, линейное программирование, массовый ввод документов, графические примитивы, распознавание текста, распознавание накладных. Стр. 74-80. Полная версия статьи в формате pdf. Литература1. Постников В.В. Автоматическая идентификация и распознавание структурированных документов. // Диссертация на соискание ученой степени кандидата технических наук. Москва, 2001. 2. Cesarini F., Gori M., Marinai S., and Soda G., INFORMys: A Flexible Invoice-Like Form-Reader System. // IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 20, no. 7, pp. 730-745, July 1998. 3. Cracknell C., Downton A.C., Du L., An Object-Oriented form Description Language and Approach to Handwritten Form Processing. // ICDAR’97, IEEE, 1997 4. Peng H., Long F., Chi Z., and Siu W.-C., Document image template matching based on component block list. // Pattern Recognition Letters, 2001 5. Таха Х.А. Введение в исследование операций. // М.: «Вильямс», Изд.6, 2001. 6. Шевченко В.Н., Золотых Н.Ю. Линейное и целочисленное линейное программирование. // Учебное пособие Нижегородского ГУ, 2002. 7. Шоломов Д.Л. Синтаксические методы контекстной обработки в задачах распознавания текста. // Диссертация на соискание ученой степени кандидата технических наук. Москва, 2007. 8. Шоломов Д.Л., Постников В.В., Марченко А.А., Усков А.В. Постобработка результатов OCR распознавания, использующая частично-определенный синтаксис. // Труды ИСА РАН. Т. 16. С. 146-163, 2005. 9. Шоломов Д.Л. Коррекция распознанного текста с использованием методов классификации. // Труды ИСА РАН, т. 29. с. 356-380, 2007. 10. Арлазаров В.В., Малых В.А., Шоломов Д.Л. Распознавание изображений документов с использованием алгоритма «Рулетки» // Труды ИСА РАН. т.63, №4, с. 35-38, 2013.
|