Математические модели социально-экономических процессов
А.В. Шешкус, Д.П. Маталов, В.В. Арлазаров, Д.П. Николаев "Исследование композиции алгоритмов компьютерного зрения, базирующихся на машинном обучении, для решения задачи локализации и классификации объектов"
Системный анализ в медицине и биологии
Когнитивные технологии
Методы искусственного интеллекта и интеллектуальные системы
А.В. Шешкус, Д.П. Маталов, В.В. Арлазаров, Д.П. Николаев "Исследование композиции алгоритмов компьютерного зрения, базирующихся на машинном обучении, для решения задачи локализации и классификации объектов"

Аннотация.

В данной работе исследуется подход к построению композиции алгоритмов машинного обучения для решения задачи локализации и классификации объектов на изображении. Приводятся подробные описания и анализ таких алгоритмов машинного обучения как метод Виолы-Джонса и метод классификации изображений с помощью сверточных нейронных сетей. Анализ экспериментальных данных показывает применимость описываемого подхода для решения сложных задач распознавания объектов на изображении.

Ключевые слова:

глубокое обучение, метод Виолы-Джонса, машинное зрение, локализация объектов, классификация объектов, сверточные нейронные сети, композиция алгоритмов машинного обучения.

Стр. 29-36.

Полная версия статьи в формате pdf. 

DOI: 10.14357/20790279190103

Литература

1. Cheng G., Han J. A survey on object detection in optical remote sensing images //ISPRS Journal of Photogrammetry and Remote Sensing. – 2016. – Vol. 117. – P. 11-28.
2. Sirmacek B., Unsalan C. Urban-area and building detection using SIFT keypoints and graph theory //IEEE Transactions on Geoscience and Remote Sensing. – 2009. – Vol. 47. – №. 4. – P. 1156-1167.
3. Lin X. et al. Semi-automatic road tracking by template matching and distance transform //Urban Remote Sensing Event, 2009 Joint. – IEEE, 2009. – P. 1-7.
4. Baltsavias E.P. Object extraction and revision by image analysis using existing geodata and knowledge: current status and steps towards operational systems //ISPRS journal of photogrammetry and remote sensing. – 2004. – Vol. 58. – №. 3-4. – P. 129-151.
5. Blaschke T., Lang S., Hay G. (ed.). Object-based image analysis: spatial concepts for knowledgedriven remote sensing applications. – Springer Science & Business Media. 2008.
6. Felzenszwalb P.F., Girshick R.B., McAllester D. Cascade object detection with deformable part models //Computer vision and pattern recognition (CVPR), 2010 IEEE conference on. – IEEE, 2010. – P. 2241-2248.
7. Sivic J., Zisserman A. Video Google: A text retrieval approach to object matching in videos // Proceedings Ninth IEEE International Conference on Computer Vision. – IEEE, 2003. – P. 1470.
8. Krizhevsky A., Sutskever I., Hinton G.E. Imagenet classification with deep convolutional neural networks //Advances in neural information processing systems. – 2012. – P. 1097-1105.
9. Simonyan K., Zisserman A. Very deep convolutional networks for large-scale image recognition //arXiv preprint arXiv:1409.1556. – 2014.
10. Viola P., Jones M. Robust Real-time Object Detection // International Journal of Computer Vision. 2002.
11. LeCun Y. et al. Object recognition with gradientbased learning //Shape, contour and grouping in computer vision. – Springer, Berlin, Heidelberg, 1999. – P. 319-345.
12. Dollár P. et al. Integral channel features. – 2009.
13. Kuznetsova E., Shvets E., Nikolaev D. Viola-Jones based hybrid framework for real-time object detection in multispectral images //Eighth International Conference on Machine Vision (ICMV 2015). – International Society for Optics and Photonics, 2015. – Vol. 9875. – P. 98750N.
14. Isukapalli R., Elgammal A., Greiner R. Learning to detect objects of many classes using binary classifiers //Computer Vision–ECCV 2006. – Springer, Berlin, Heidelberg, 2006. – P. 352-364.
15. Usilin S. et al. Visual appearance based document image classification //Image Processing (ICIP), 2010 17th IEEE International Conference on. – IEEE, 2010. – P. 2133-2136.
16. Арлазаров, В.В., Маталов Д.П., Усилин С.А. Локализация образа печати на документе, удостоверяющем личность, методом машинного обучения // Труды ИСА РАН. Спецвыпуск. 2018. С. 158-166.
17. Redmon J. et al. You only look once: Unified, real-time object detection //Proceedings of the IEEE conference on computer vision and pattern recognition. – 2016. – P. 779-788.
18. Liu W. et al. Ssd: Single shot multibox detector //European conference on computer vision. – Springer, Cham, 2016. – P. 21-37.
19. Ilin D. et al. Fast integer approximations in convolutional neural networks using layer-bylayer training //Ninth International Conference on Machine Vision (ICMV 2016). – International Society for Optics and Photonics, 2017. – Vol. 10341. – P. 103410Q.
20. Limonova E., Sheshkus A., Nikolaev D. Computational optimization of convolutional neural networks using separated filters architecture // International Journal of Applied Engineering Research. – 2016. – Vol. 11. – №. 11. – P. 7491-7494.
21. Li H. et al. A convolutional neural network cascade for face detection //Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. – 2015. – P. 5325-5334.
22. Гайер А.В., Шешкус А.В., Чернышова Ю.С. Аугментация обучающей выборки «на лету» для обучения нейронных сетей // Труды ИСА РАН. 2018. С. 150-157.
23. Liu W. et al. A survey of deep neural network architectures and their applications // Neurocomputing. – 2017. – Vol. 234. – P. 11-26.
24. Датасет локализации и распознавания танков [Электронный ресурс] URL: ftp://vis.iitp.ru/tank_recognition (дата обращения 13.02.2019)
 

2024-74-1
2023-73-4
2023-73-3
2023-73-2

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".