Журнал «Труды Института системного анализа Российской академии наук» - В.В. Арлазаров, К.Б. Булатов, А.В. Усков "Модель системы распознавания объектов в видеопотоке мобильного устройства"

Просматривается номер 2018-S1

English (United Kingdom)

Russian (CIS)

Интеллектуальный анализ данных и распознавание образов

Н.С. Скорюкина, А.Н. Миловзоров, Д.В. Полевой, В.В. Арлазаров "Метод распознавания объектов живописи в неконтролируемых условиях с обучением по одному примеру"

А.Е. Жуковский "Методы межкадровой интеграции результатов обнаружения документов в видеопотоке мобильного устройства"

И.А. Кунина, Е.И. Панфилова, М.А. Поволоцкий "Детектирование пешеходных переходов на изображениях дороги на основе метода динамического выравнивания временных рядов"

О.А. Славин, В.Л. Арлазаров "Метод классификации распознанных страниц деловых документов на основе текстовых ключевых точек"

О.О. Петрова, К.Б. Булатов "Методы пост-обработки результатов распознавания машиночитаемой зоны документов"

А.Е. Марченко, Е.И. Ершов, Д.А. Шепелев, Д.С. Сидорчук, В.П. Божкова, Д.П. Николаев "Разработка языка описания наблюдаемых свойств распознаваемых объектов в отсутствие примеров"

Интеллектуальные системы и технологии

Е.Е. Лимонова, Н.Л. Рженев, А.В. Усков, М.И. Нейман-заде "Быстрая реализация расстояния Хэминга на VLIW-архитектурах на примере платформы Эльбрус"

В.В. Арлазаров, К.Б. Булатов, А.В. Усков "Модель системы распознавания объектов в видеопотоке мобильного устройства"

А.А. Иванова, С.А. Гладилин, А.Е. Жуковский, Е.Л. Плискин "База данных для административного учета научных публикаций"

А.С. Ингачева, А.В. Шешкус, Т.С. Чернов, Е.Е. Лимонова, В.В. Арлазаров "Рентгеновский компьютерный томограф – новый инструмент в распознавании"

Н.О. Бесшапошников, А.Г. Кушниренко, А.А. Левин "Метод автокалибровки параметров управления учебным роботом с помощью библиотеки машинного зрения OpenCV"

Обработка и анализ изображений и сигналов

А.Е. Жуковский, Е.Е. Лимонова, Д.П. Николаев "Реализация классических алгоритмов анализа изображений через полносверточные нейронные сети"

В.Е. Прун "Уменьшение влияния сильнопоглощающих включений на восстановление алгебраическим методом в задаче компьютерной томографии"

Б.И. Савельев, И.Б. Мамай, Д.П. Николаев, В.Л. Арлазаров, К.Б. Булатов, Н.С. Скорюкина "Метод согласования графа проективных преобразований для задачи панорамирования плоских объектов"

Д.В. Тропин, Д.П. Николаев, Д.Г. Слугин "Метод совмещения изображений на основе максимизации резкости"

Ю.А. Шемякина, А.Е. Жуковский, И.А. Коноваленко, Д.П. Николаев "Алгоритм автоматического кадрирования цифровых изображений при проективном преобразовании"

Машинное обучение

А.В. Гайер, А.В. Шешкус, Ю.С. Чернышова "Аугментация обучающей выборки «на лету» для обучения нейронных сетей"

В.В. Арлазаров, Д.П. Маталов, С.А. Усилин "Локализация образа печати на документе, удостоверяющем личность, методом машинного обучения"

A.Е. Лынченко, А.В. Шешкус, В.Л. Арлазаров "Алгоритм классификации документов, удостоверяющих личность, на проективно-искаженных изображениях на основе обучаемой метрики подобия"

В.А. Малых, В.А. Лялин "К вопросу о классификации зашумленных текстов"

Ю.С. Чернышова, М.А. Алиев, А.В. Шешкус "Оптическое распознавание шрифтов на изображениях, полученных со смартфонов, и его использование для определения подлинности документов, удостоверяющих личность"

Д.А. Ильин "Быстрая локализация текстовых полей на изображения документов низкого качества"

Д.Е. Иванов, Д.В. Полевой, Д.Л. Шоломов "Отбор информативных элементов для обучения легкого сверточного нейросетевого классификатора в условиях сильного дисбаланса обучающей выборки"


	В.В. Арлазаров, К.Б. Булатов, А.В. Усков "Модель системы распознавания объектов в видеопотоке мобильного устройства"
Аннотация. В работе исследована задача автоматического распознавания объектов с использованием видеопотока в качестве цифрового образа. Рассматриваются варианты формализации системы распознавания в видеопотоке, обсуждаются свойства динамической модели системы распознавания. Описываются задача интеграции результатов распознавания объекта и задача останова, возникающие в системе распознавания со временем, в отсутствии естественного ограничения на количество входных изображений. Представлены формальные постановки задач интеграции и останова в рамках модели взаимодействия системы распознавания с пользователем. Ключевые слова: распознавание образов, видеопоток, мобильные устройства, системы распознавания, OCR. Стр. 73-82. DOI: 10.14357/20790279180508 Полная версия статьи в формате pdf. Литература 1. Bulatov K., Arlazarov V.V., Chernov T., Slavin O., Nikolaev D. “Smart IDReader: Document Recognition in Video Stream” // 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). – 2017. –V. 6, – P. 39-44. 2. Арлазаров В.В., Жуковский А., Кривцов В., Николаев Д., Полевой Д. Анализ особенностей использования стационарных и мобильных малоразмерных цифровых видео камер для распознавания документов // Информационные технологии и вычислительные системы. – 2014. – № 3. – С. 71-78. 3. Wemhoener D., Yalniz I.Z., Manmatha R. “Creating an Improved Version Using Noisy OCR from Multiple Editions” // 12th IAPR International Conference on Document Analysis and Recognition (ICDAR). – 2013. – P. 160-164. 4. Rokach L. “Ensemble-based classifiers” // Artificial Intelligence Review. – 2010. – Vol. 33, No. 1. – P. 1-39. 5. Kittler et al. “On Combining Classifiers” // IEEE Trans. Pattern Analysis and Machine Intelligence. – 1998. – Vol. 20, No. 3. – P. 226-239. 6. Ting K.M., Witten I.H. “Issues in Stacked Generalization” // Journal of Artificial Intelligence Research. – 1999. – Vol. 10, No. 1. – P. 271-289. 7. Kuncheva L.I., Bezdek J.C., Duin R.P. “Decision templates for multiple classifier fusion: an experimental comparison” // Pattern Recognition. – 2001. – Vol. 34, No. 2. – P. 299-314. 8. Nguyen T.T. et al. “A Novel Combining Classifier Method Based on Variational Inference” // Pattern Recognition. – 2016. – Vol. 49, No. C. – P. 198-212. 9. Петровский А.Б. Методы групповой классификации многопризнаковых объектов (часть 1) // Искусственный интеллект и принятие решений. – 2009. – № 3. – С. 3-14. 10. Петровский А.Б. Методы групповой классификации многопризнаковых объектов (часть 2) // Искусственный интеллект и принятие решений. – 2009. – № 4. – С. 3-14. 11. LeCun Y. et al. “Gradient-Based Learning Applied to Document Recognition” // Proceedings of the IEEE. – 1998. 12. Krizhevsky A., Sutskever I., Hinton G.E. “ImageNet Classification with Deep Convolutional Neural Networks” // Advances in Neural Information Processing Systems 25 / ed. by F. Pereira [et al.]. – Curran Associates, Inc., 2012. – P. 1097-1105. 13. Taigman Y. et al. “DeepFace: Closing the Gap to Human-Level Performance in Face Verification” // IEEE Conference on Computer Vision and Pattern Recognition. – 2014. – P. 1701-1708. 14. Moosavi-Dezfooli S., Fawzi A., Frossard P. “DeepFool: a simple and accurate method to fool deep neural networks” // CoRR. – 2015. – Vol abs/1511.04599. 15. Papernot N. et al. “The Limitations of Deep Learning in Adversarial Settings” // CoRR. – 2015. – Vol. abs/1511.07528. 16. Su J., Vargas D.V., Sakurai K. “One pixel attack for fooling deep neural networks” // CoRR. – 2017. – Vol. abs/1710.08864. 17. Sung Cheol Park, Min Kyu Park, Moon Gi Kang. “Super-resolution image reconstruction: a technical overview” // IEEE Signal Processing Magazine. – 2003. – V.20. – N. 3. – P. 21-36. 18. Semwal A., Chamoli A., Mukesh C.A., Salman A. “A Survey: The Methods & Techniques of Super-Resolution Image Reconstruction” // International Journal for Scientific Research & Development. – 2017. – V. 4. – I. 12. – P. 243-249. 19. International standard ISO/IEC 14496-12 “Information technology – Coding of audio-visual objects – Part 12: ISO base media file format”. ISO/IEC. – 2005. – 94 p. 20. Arlazarov V.L., Loginov A.S., Slavin O.A. “Characteristics of Optical Text Recognition Programs” // Programming and Computer Software. – 2002. – Vol. 28, No. 3. – P. 148-161. 21. Арлазаров В.В., Кляцкин В.М. Решение задачи определения достоверности результатов распознавания символа в системе Cognitive Forms // Документооборот. Концепции и инструментарий. Сборник трудов Института системного анализа РАН. – 2004. – 208 с. 22. Kimura S. et al. “A Man-Machine Cooperating System Based on the Generalized Reject Model” // 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). – 2017. – V. 1. – P. 1324-1329.

2024-74-1

2023-73-4

2023-73-3

2023-73-2

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".