|
К. Б. Булатов, Д. А. Ильин, Д. В. Полевой, Ю. С. Чернышова "Проблемы распознавания машиночитаемых зон с использованием малоформатных цифровых камер мобильных устройств" |
|
Аннотация. Задача распознавания полученных с помощью сканирования изображений документов является классической, и в литературе описано множество методов ее решения. Распознавание машиночитаемых зон (machine-readable zone, MRZ) с камер мобильных устройств гораздо сложнее из-за слабо контролируемых условий съемки, особенностей и разнообразия камер, а также ввиду особенностей документов с машиночитаемой зоной. В данной работе рассматривается задача распознавания MRZ-документов на фотографиях и кадрах видеопотока, полученных с камер распространенных мобильных устройств, таких как смартфоны и планшетные компьютеры. Спецификация MRZ описана в стандарте ICAO 9303 и главным образом разработана для распознавания документов с использованием специализированных сканеров и программно-аппаратных комплексов регистрации документов. В работе описаны проблемы захвата изображений MRZ-документов на естественных сценах, характерные искажения изображений, проблемы распознавания символов в условиях искажений и проблемы пост-обработки результатов распознавания с использованием языковой модели MRZ-документов. Ключевые слова: машиночитаемая зона, обработка изображений, оптическое распознавание символов, пост-обработка результатов распознавания, сканирование, мобильные устройства. Стр. 85-93. K. B. Bulatov, D. V. Polevoy, D. A. Ilin, Y. S. Chernyshova"Problems of machine-readable zone recognition captured with digital mobile cameras"Abstract. The scanned documents recognition task is a classical problem with a variety of known solutions. A machine-readable zone (MRZ) recognition on mobile devices, on the other hand, is much more complicated due to properties of mobile device cameras and the specification of MRZ documents. In this paper, we discuss the task of MRZ recognition on an image or video stream captured from widespread mobile device cameras, such as smartphones or tablets cameras. MRZ is described in the ICAO 9303 standard and is designed mainly for recognition using specialized scanners and document readers. We discuss the problems of capturing MRZ documents in natural scenes, image distortions and problems of symbol recognition in poor capturing conditions, along with post-processing of recognition results using the MRZ language model. Keywords: мachine-readable zone, image processing, OCR, recognition post-processing, scanners, mobile devices. Полная версия статьи в формате pdf. REFERENCES 1. ICAO Doc 9303 Part 1. 2006. Machine Readable Travel Documents — Machine Readable Passports. Sixth Edition. In two volumes. International Civil Aviation Organization. 2. ICAO Doc 9303 Part 2. 2005. Machine Readable Travel Documents — Machine Readable Visas. Third Edition. International Civil Aviation Organization. 3. ICAO Doc 9303 Part 3. 2008. Machine Readable Travel Documents — Machine Readable Official Travel Documents. In two volumes. International Civil Aviation Organization. 4. Arlazarov V. V., Zhukovskiy A., Krivtsov V., Nikolaev D., Polevoy D. Analiz osobennostey ispolzovaniya statsionarnykh i mobilnykh malorazmernykh tsifrovykh video kamer dlya raspoznavaniya dokumentov // Informatsionnye tekhnologii i vychislitelnye sistemy. 2014. № 3. C. 71–78. 5. Llados J., Lumbreras F., Chapaprieta V., Queralt J. ICAR: Identity Card Automatic Reader // Proceedings of Sixth International Conference on Document Analysis and Recognition, 2001. P. 470–474. 6. Bessmeltsev V.; Bulushev E., Goloshevsky N. High-speed OCR algorithm for portable passport readers // Graphicon’ 11. 2011. P. 25–29. 7. Doermann D., Liang J., Huiping L. Progress in camerabased document image analysis //. Proceedings of Seventh International Conference on Document Analysis and Recognition. 2003. V. 1. P. 606–616. 8. Sholomov D. L., Postnikov V. V., Marchenko A. A., Uskov A. V. Post-obrabotka rezultatov OCR raspoznavaniya ispolzuyushchaya chastichno opredelennyy sintaksis // Sb. trudov ISA RAN "Intellektualnye informatsionnye tekhnologii. Kontseptsii i instrumentariy". M.: KomKniga/URSS, 2005. T. 16. C. 146–165. 9. Bouchaffra D., Govindaraju V., Srihari S. N. Postprocessing of Recognized Strings Using Nonstationary Markovian Models // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1997. V. 21. № 10. P. 990–999. 10. Kukich K. Techniques for Automatically Correcting Words in Text. ACM computing survey, Computational Linguistic 1992. V. 24, N 4, P. 377–439. 11. Llobet R., Cerdan-Navarro J.-R., Perez-Cortes J., Arlandis J. ?OCR Post-processing Using Weighted Finite-State Transducers?. Pattern Recognition (ICPR), 2010. P. 2021–2024. 12. Sholomov D. L. Korrektsiya raspoznannogo teksta s ispolzovaniem metodov klassifikatsii. // Sb. trudov ISA RAN. 2007. T. 17, C. 352–366. 13. Klyatskin V. M., Kotovich N. V., Slavin O. A. Opredelenie rasstoyaniya mezhdu slovami v algoritmakh slovarnoy korrektirovki rezultatov raspoznavaniya. // Tekhnologiya program. i khran. dannykh. V sb.: Trudy ISA RAN / pod red. V. L. Arlazarova, N. Ye. Yemelyanova. M.: Lenand/URSS, 2009. S. 260–266. 14. Slavin O. A., Yanishevskiy I. M., Bogdanova Ye. B. Algoritm podtverzhdeniya rezultatov raspoznavaniya s pomoshchyu slovarya // Inf. tekhnol. i vych. sis. 2011. № 3.
|