Журнал «Труды Института системного анализа Российской академии наук» - А.В. Гайер, А.В. Шешкус, Ю.С. Чернышова "Аугментация обучающей выборки «на лету» для обучения нейронных сетей"

Просматривается номер 2018-S1

Интеллектуальный анализ данных и распознавание образов

Н.С. Скорюкина, А.Н. Миловзоров, Д.В. Полевой, В.В. Арлазаров "Метод распознавания объектов живописи в неконтролируемых условиях с обучением по одному примеру"

А.Е. Жуковский "Методы межкадровой интеграции результатов обнаружения документов в видеопотоке мобильного устройства"

И.А. Кунина, Е.И. Панфилова, М.А. Поволоцкий "Детектирование пешеходных переходов на изображениях дороги на основе метода динамического выравнивания временных рядов"

О.А. Славин, В.Л. Арлазаров "Метод классификации распознанных страниц деловых документов на основе текстовых ключевых точек"

О.О. Петрова, К.Б. Булатов "Методы пост-обработки результатов распознавания машиночитаемой зоны документов"

А.Е. Марченко, Е.И. Ершов, Д.А. Шепелев, Д.С. Сидорчук, В.П. Божкова, Д.П. Николаев "Разработка языка описания наблюдаемых свойств распознаваемых объектов в отсутствие примеров"

Интеллектуальные системы и технологии

Е.Е. Лимонова, Н.Л. Рженев, А.В. Усков, М.И. Нейман-заде "Быстрая реализация расстояния Хэминга на VLIW-архитектурах на примере платформы Эльбрус"

В.В. Арлазаров, К.Б. Булатов, А.В. Усков "Модель системы распознавания объектов в видеопотоке мобильного устройства"

А.А. Иванова, С.А. Гладилин, А.Е. Жуковский, Е.Л. Плискин "База данных для административного учета научных публикаций"

А.С. Ингачева, А.В. Шешкус, Т.С. Чернов, Е.Е. Лимонова, В.В. Арлазаров "Рентгеновский компьютерный томограф – новый инструмент в распознавании"

Н.О. Бесшапошников, А.Г. Кушниренко, А.А. Левин "Метод автокалибровки параметров управления учебным роботом с помощью библиотеки машинного зрения OpenCV"

Обработка и анализ изображений и сигналов

А.Е. Жуковский, Е.Е. Лимонова, Д.П. Николаев "Реализация классических алгоритмов анализа изображений через полносверточные нейронные сети"

В.Е. Прун "Уменьшение влияния сильнопоглощающих включений на восстановление алгебраическим методом в задаче компьютерной томографии"

Б.И. Савельев, И.Б. Мамай, Д.П. Николаев, В.Л. Арлазаров, К.Б. Булатов, Н.С. Скорюкина "Метод согласования графа проективных преобразований для задачи панорамирования плоских объектов"

Д.В. Тропин, Д.П. Николаев, Д.Г. Слугин "Метод совмещения изображений на основе максимизации резкости"

Ю.А. Шемякина, А.Е. Жуковский, И.А. Коноваленко, Д.П. Николаев "Алгоритм автоматического кадрирования цифровых изображений при проективном преобразовании"

Машинное обучение

А.В. Гайер, А.В. Шешкус, Ю.С. Чернышова "Аугментация обучающей выборки «на лету» для обучения нейронных сетей"

В.В. Арлазаров, Д.П. Маталов, С.А. Усилин "Локализация образа печати на документе, удостоверяющем личность, методом машинного обучения"

A.Е. Лынченко, А.В. Шешкус, В.Л. Арлазаров "Алгоритм классификации документов, удостоверяющих личность, на проективно-искаженных изображениях на основе обучаемой метрики подобия"

В.А. Малых, В.А. Лялин "К вопросу о классификации зашумленных текстов"

Ю.С. Чернышова, М.А. Алиев, А.В. Шешкус "Оптическое распознавание шрифтов на изображениях, полученных со смартфонов, и его использование для определения подлинности документов, удостоверяющих личность"

Д.А. Ильин "Быстрая локализация текстовых полей на изображения документов низкого качества"

Д.Е. Иванов, Д.В. Полевой, Д.Л. Шоломов "Отбор информативных элементов для обучения легкого сверточного нейросетевого классификатора в условиях сильного дисбаланса обучающей выборки"


	А.В. Гайер, А.В. Шешкус, Ю.С. Чернышова "Аугментация обучающей выборки «на лету» для обучения нейронных сетей"
Аннотация. В работе исследуется аугментация «на лету» – метод увеличения репрезентативности обучающей выборки прямо во время обучения искусственных нейронных сетей. Рассматриваются наиболее частые преобразования с сохранением меток, которые будут полезны в большинстве практических задач. Ввиду ограничений существующих систем для аугментации «на лету», среди которых добавление новых преобразований и увеличение времени обучения, была разработана собственная система аугментации. Проведены эксперименты на датасете MNIST с разработанной системой аугментации «на лету», которые продемонстрировали эффективность ее работы – на архитектуре SimpleNet(310K) удалось превзойти актуальный лучший результат, уменьшив ошибку распознавания с 0.28 до 0.25%. Ключевые слова: машинное обучение, искусственные нейронные сети, «онлайн» аугментация, аугментация «на лету». Стр. 150-157. DOI: 10.14357/20790279180517 Полная версия статьи в формате pdf. Литература 1. Полевой Д.В. Актуальные задачи создания систем массового ввода с использованием оптического распознавания для преобразования сложно структурированных бумажных документов в гибридных информационных системах // Системный анализ и информационные технологии. Тр. четвертой междунар. конф. (Абзаково, Россия, 17-23 августа 2011 г.): в 2 т. Т.2. Челябинск: Изд-во Челяб. гос. ун-та, 2011. С. 192-195. 2. Bulatov K. Smart IDReader: Document Recognition in Video Stream / K. Bulatov, V. V. Arlazarov, T. Chernov, O. Slavin and D. Nikolaev // 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR), Kyoto, 2017, pp. 39-44. doi: 10.1109/ICDAR.2017.347. 3. The mnist database of handwritten digits [Электронный ресурс]. URL: http://yann.lecun.com/exdb/mnist (дата обращения 15.06.2018). 4. The CIFAR-10 dataset [Электронный ресурс]. URL: https://www.cs.toronto.edu/~kriz/cifar.html (дата обращения 15.06.2018). 5. Russakovsky O. ImageNet large scale visual recognition challenge / O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang, A. Karpathy, A. Khosla, M. Bernstein, A. Berg, L. Fei-Fei // International Journal of Computer Vision. – 2015. – Vol. 115, Issue 3. – P. 211-252. 6. Ronneberger O. U-Net: Convolutional Networks for Biomedical Image Segmentation / Ronneberger O., Fischer P., Brox T. // In: Navab N., Hornegger J., Wells W., Frangi A. (eds) Medical Image Computing and Computer-Assisted Intervention – MICCAI 2015. MICCAI 2015. Lecture Notes in Computer Science, vol 9351. Springer, Cham. 7. Weiss G. The Effect of Class Distribution on Classifier Learning: An Empirical Study / Weiss G., Provost F. // Technical Report ML-TR-44, Department of Computer Science, Rutgers University. August 2, 2001. 8. Krizhevsky A. Learning multiple layers of features from tiny images. Master’s thesis. Department of Computer Science. University of Toronto. 2009. 60 p. 9. Zhang H. Mixup: Beyond Empirical Risk Minimization / Zhang H., Ciss M., Dauphin Y., Lopez D. // ArXiv e-prints [Электронный ресурс] – ArXiv:1710.09412 – 2017 – URL: https://arxiv.org/abs/1710.09412 (дата обращения 15.06.2018). 10. Zagoruyko S. Learning to Compare Image Patches via Convolutional Neural Networks / Zagoruyko S., Komodakis N. // The IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2015. 11. Fawzi A. Adaptive data augmentation for image classification / Fawzi A., Samulowitz H., Turaga D., Frossard P. // Image Processing (ICIP), 2016 IEEE International Conference on. 2016. С. 3688-3692. 12. Емельянов С.О. Методы аугментации обучающих выборок в задачах классификации изображений / Емельянов С.О., Иванова А.А., Швец Е.А., Николаев Д.П. // Сенсорные системы. 2018. Т. 32. № 3 (в печати). 13. Арлазаров В.В. Анализ особенностей использования стационарных и мобильных малоразмерных цифровых видео камер для распознавания документов / Арлазаров В.В., Жуковский А.Е., Кривцов В.Е., Николаев Д.П., Полевой Д.В. // Информационные технологии и вычислительные системы, №3. 2014. С. 71-81. 14. Chernyshova Y. Generation method of synthetic training data for mobile OCR system / Chernyshova Y. Gayer A. Sheshkus A. // Proc. SPIE 10696, Tenth International Conference on Machine Vision (ICMV 2017), 106962G (13 April 2018); doi: 10.1117/12.2310119 15. Goodfellow I. Generative adversarial nets / I. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu, D. Warde-Farley, S. Ozair, A. Courville, Y. Bengio // Proceedings of the 27th International Conference on Neural Information Processing Systems. – 2014. – Vol. 2. – P. 2672-2680. 16. Perez L. The Effectiveness of Data Augmentation in Image Classification using Deep Learning / Perez L., Wang J. // ArXiv e-prints [Электронный ресурс] – ArXiv:1712.04621 – 2017 – URL: https://arxiv.org/abs/1712.04621 (дата обращения 01.06.2018). 17. Announcing NVIDIA DALI and NVIDIA nvJPEG [Электронный ресурс]. URL: https:// news.developer.nvidia.com/ announcing-nvidiadali-and-nvidia-nvjpeg/ (дата обращения 19.06.2018). 18. Bloice D. Augmentor: An Image Augmentation Library for Machine Learning / Bloice D., Stocker C., Holzinger A. // ArXiv e-prints [Электронный ресурс] – ArXiv:1712.04621 – 2017 – URL: https://arxiv.org/abs/1712.04621 (дата обращения 15.06.2018). 19. Hasanpour S.H. Let’s keep it simple, Using simple architectures to outperform deeper and more complex architectures / Hasanpour S. H., Rouhani M., Mohsen F., Sabokrou M. // ArXiv e-prints [Электронный ресурс] – ArXiv:1608.06037 – 2016 – URL: https://arxiv.org/abs/1608.06037 (дата обращения 25.05.2018).

2025-75-1

2024-74-4

2024-74-3

2024-74-2

Аннотация.

Ключевые слова: