Интеллектуальный анализ данных и распознавание образов
А.Е. Жуковский "Методы межкадровой интеграции результатов обнаружения документов в видеопотоке мобильного устройства"
Интеллектуальные системы и технологии
Обработка и анализ изображений и сигналов
Машинное обучение
А.Е. Жуковский "Методы межкадровой интеграции результатов обнаружения документов в видеопотоке мобильного устройства"

Аннотация.

Работа посвящена задаче обнаружения положения документа в видеопотоке, полученном с мобильного устройства. Особое внимание уделено методам интеграции положений документа, полученных на последовательности кадров. Описывается основанный на фильтре Калмана алгоритм для выбора положений документа по набору предоставленных альтернатив, их интеграции и уточнения в видеопотоке. Приводится анализ работы алгоритма на данных, предоставленных в рамках конкурса ICDAR’15 по обнаружению документов со смартфона.

Ключевые слова:

обнаружение документа, видеопоток, интеграция, проективное преобразование, мобильные камеры, фильтр Калмана.

Стр. 15-22.

DOI: 10.14357/20790279180502

Полная версия статьи в формате pdf. 

Литература

1. Арлазаров В.В., Жуковский А.Е., Кривцов В.Е., Николаев Д.П., Полевой Д.В. Анализ особенностей использования стационарных и мобильных малоразмерных цифровых видео камер для распознавания документов. // Информационные технологии и вычислительные системы. Том 3. 2014. С. 71-81.
2. Liang J., Doermann D., Li H. Camera-based analysis of text and documents: a survey, Int. J. of Document Analysis and Recognition, vol. 7, Issue 2, 2005, pp. 84-104
3. Doermann D., Liang J., Li H. Progress in Camera-Based Document Image Analysis, IEEE Proc. 7th Int. Conf. on Document Analysis and Recognition, Vol.1, 2003, pp. 606-616
4. Bulatov K., Arlazarov V.V., Chernov T., Slavin O. and Nikolaev D. Smart IDReader: Document Recognition in Video Stream, 2017 14th IAPR Int. Conf. on Document Analysis and Recognition (ICDAR), 2017, pp. 39-44. doi: 10.1109/ICDAR.2017.347
5. Burie JC., Chazalon J., Coustaty M., Eskenazi S., Luqman M.M., Mehri M., Nayef N., Ogier JM., Prum S., Rusinol M. ICDAR2015 Competition on Smartphone Document Capture and OCR (SmartDoc), 13th Int. Conf. on Document Analysis and Recognition. 2015.
6. Арлазаров В.В., Жуковский А.Е., Кривцов В.Е., Постников В.В. Использование графа пересечений в задаче обнаружения документа на изображении, полученном со смартфона // Искусственный интеллект и принятие решений. Том 2. С. 60-69, 2016
7. Zhukovsky A. et al. “Segments Graph-Based Approach for Document Capture in a Smartphone Video Stream,” 2017 14th IAPR Int. Conf. on Document Analysis and Recognition (ICDAR), 2017, pp. 337-342, doi: 10.1109/ICDAR.2017.63
8. Skoryukina N, Shemyakina Y., Arlazarov V. L., Faradjev I. Document localization algorithms based on feature points and straight lines, Proc. SPIE 10696, 10th Int. Conf. on Machine Vision (ICMV 2017), pp. 1-8, 2018, DOI: 10.1117/12.2311478
9. Кормен Т., Лейзерсон Ч., Ривест Р., Штайн К. Алгоритмы: построение и анализ. 2-е изд., М.: Вильямс, 2005.
10. Kalman R.E. A New Approach to Linear Filtering and Prediction Problems, J. of Basic Engineering
82, 35, 1960.
11. Hartley R., Zisserman A. Multiple view geometry in computer vision, Cambridge University Press, New York, 2003
12. Шемякина Ю.А., Жуковский А.Е., Фараджев И.А. Исследование алгоритмов вычисления проективного преобразования в задаче наведения на планарный объект по особым точкам // Искусственный интеллект и принятие решений. Том 1. 2017. С. 43-49
13. Shemyakina Y., Zhukovsky A., Faradjev I. The Calculation of a Projective Transformation in the Problem of Planar Object Targeting by Feature Points, Proc. SPIE 10341, ICMV 2016, 10341 ed., 9th Int. Conf. on Machine Vision, 2017, vol. 10341, pp. 1-6, 2017, DOI: 10.1117/12.2268590
14. Bay H., Tuytelaars T., Gool L.V. Surf: Speeded up robust features, European Conf. on Computer Vision (ECCV), 2006, pp. 404-417
15. Calonder M., Lepetit V., Strecha C., Fua P. BRIEF: Binary Robust Independent Elementary Features, 11th European Conf. on Computer Vision (ECCV), 2010
16. Fischler M.A., Bolles R.C.. Random sample consensus: A paradigm for model fitting with applications to image analysis and automated cartography, Communications of the ACM, 24(6), 1981, pp. 381-395
17. Everingham M., Gool L.V., Williams C., Winn J. and Zisserman A. “The PASCAL visual object classes (VOC) challenge” IJCV, vol. 88, no. 2, 2010, pp. 303–338
 

2024-74-1
2023-73-4
2023-73-3
2023-73-2

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".