 |
А.В. Шешкус, Д.П. Маталов, В.В. Арлазаров, Д.П. Николаев "Исследование композиции алгоритмов компьютерного зрения, базирующихся на машинном обучении, для решения задачи локализации и классификации объектов" |
 |
Аннотация. В данной работе исследуется подход к построению композиции алгоритмов машинного обучения для решения задачи локализации и классификации объектов на изображении. Приводятся подробные описания и анализ таких алгоритмов машинного обучения как метод Виолы-Джонса и метод классификации изображений с помощью сверточных нейронных сетей. Анализ экспериментальных данных показывает применимость описываемого подхода для решения сложных задач распознавания объектов на изображении. Ключевые слова: глубокое обучение, метод Виолы-Джонса, машинное зрение, локализация объектов, классификация объектов, сверточные нейронные сети, композиция алгоритмов машинного обучения. Стр. 29-36. Полная версия статьи в формате pdf. DOI: 10.14357/20790279190103 Литература 1. Cheng G., Han J. A survey on object detection in optical remote sensing images //ISPRS Journal of Photogrammetry and Remote Sensing. – 2016. – Vol. 117. – P. 11-28. 2. Sirmacek B., Unsalan C. Urban-area and building detection using SIFT keypoints and graph theory //IEEE Transactions on Geoscience and Remote Sensing. – 2009. – Vol. 47. – №. 4. – P. 1156-1167. 3. Lin X. et al. Semi-automatic road tracking by template matching and distance transform //Urban Remote Sensing Event, 2009 Joint. – IEEE, 2009. – P. 1-7. 4. Baltsavias E.P. Object extraction and revision by image analysis using existing geodata and knowledge: current status and steps towards operational systems //ISPRS journal of photogrammetry and remote sensing. – 2004. – Vol. 58. – №. 3-4. – P. 129-151. 5. Blaschke T., Lang S., Hay G. (ed.). Object-based image analysis: spatial concepts for knowledgedriven remote sensing applications. – Springer Science & Business Media. 2008. 6. Felzenszwalb P.F., Girshick R.B., McAllester D. Cascade object detection with deformable part models //Computer vision and pattern recognition (CVPR), 2010 IEEE conference on. – IEEE, 2010. – P. 2241-2248. 7. Sivic J., Zisserman A. Video Google: A text retrieval approach to object matching in videos // Proceedings Ninth IEEE International Conference on Computer Vision. – IEEE, 2003. – P. 1470. 8. Krizhevsky A., Sutskever I., Hinton G.E. Imagenet classification with deep convolutional neural networks //Advances in neural information processing systems. – 2012. – P. 1097-1105. 9. Simonyan K., Zisserman A. Very deep convolutional networks for large-scale image recognition //arXiv preprint arXiv:1409.1556. – 2014. 10. Viola P., Jones M. Robust Real-time Object Detection // International Journal of Computer Vision. 2002. 11. LeCun Y. et al. Object recognition with gradientbased learning //Shape, contour and grouping in computer vision. – Springer, Berlin, Heidelberg, 1999. – P. 319-345. 12. Dollár P. et al. Integral channel features. – 2009. 13. Kuznetsova E., Shvets E., Nikolaev D. Viola-Jones based hybrid framework for real-time object detection in multispectral images //Eighth International Conference on Machine Vision (ICMV 2015). – International Society for Optics and Photonics, 2015. – Vol. 9875. – P. 98750N. 14. Isukapalli R., Elgammal A., Greiner R. Learning to detect objects of many classes using binary classifiers //Computer Vision–ECCV 2006. – Springer, Berlin, Heidelberg, 2006. – P. 352-364. 15. Usilin S. et al. Visual appearance based document image classification //Image Processing (ICIP), 2010 17th IEEE International Conference on. – IEEE, 2010. – P. 2133-2136. 16. Арлазаров, В.В., Маталов Д.П., Усилин С.А. Локализация образа печати на документе, удостоверяющем личность, методом машинного обучения // Труды ИСА РАН. Спецвыпуск. 2018. С. 158-166. 17. Redmon J. et al. You only look once: Unified, real-time object detection //Proceedings of the IEEE conference on computer vision and pattern recognition. – 2016. – P. 779-788. 18. Liu W. et al. Ssd: Single shot multibox detector //European conference on computer vision. – Springer, Cham, 2016. – P. 21-37. 19. Ilin D. et al. Fast integer approximations in convolutional neural networks using layer-bylayer training //Ninth International Conference on Machine Vision (ICMV 2016). – International Society for Optics and Photonics, 2017. – Vol. 10341. – P. 103410Q. 20. Limonova E., Sheshkus A., Nikolaev D. Computational optimization of convolutional neural networks using separated filters architecture // International Journal of Applied Engineering Research. – 2016. – Vol. 11. – №. 11. – P. 7491-7494. 21. Li H. et al. A convolutional neural network cascade for face detection //Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. – 2015. – P. 5325-5334. 22. Гайер А.В., Шешкус А.В., Чернышова Ю.С. Аугментация обучающей выборки «на лету» для обучения нейронных сетей // Труды ИСА РАН. 2018. С. 150-157. 23. Liu W. et al. A survey of deep neural network architectures and their applications // Neurocomputing. – 2017. – Vol. 234. – P. 11-26. 24. Датасет локализации и распознавания танков [Электронный ресурс] URL: ftp://vis.iitp.ru/tank_recognition (дата обращения 13.02.2019)
|