COMPUTING SYSTEMS
MATHEMATICAL MODELING
PATTERN RECOGNITION
Д.П. Николаев, Д.В. Полевой, Н.А. Тарасова "Синтез обучающей выборки в задаче распознавания текста в трехмерном пространстве"
APPLIED ASPECTS OF COMPUTER SCIENCE
REVIEWS
Д.П. Николаев, Д.В. Полевой, Н.А. Тарасова "Синтез обучающей выборки в задаче распознавания текста в трехмерном пространстве"

Аннотация.

В статье рассматривается проблема создания обучающей выборки для статистических методов обучения в контексте задачи распознавания моношрифтового текста. Исходные данные представляют собой изображения документов, содержащих машиносчитываемую зону, предъявленных видеокамере в произвольной ориентации. Геометрия сцены, освещение и источники изображений варьируются в широких пределах.

Ключевые слова:

распознавание моношрифтового текста, синтез обучающей выборки, нейронные сети.

Стр. 82-88. 

D.P. Nikolaev, D.V. Polevoy, N.A. Tarasova

"Training data synthesis in text recognition problem solved in three-dimensional space"

This paper is considered training data formation for machine learning methods in the context of text recognition problem. Initial data is a set of images containing documents with Machine Readable Zone (MRZ) shown a camera in some orientation. Relative positions of the camera and the document, light and camera models may vary within wide limits.

Keywords: mono-font text recognition, synthesis of training data, neural networks. 

Полная версия статьи в формате pdf.

1.   Arlazarov V. L., Yemelyanov N. Ye. Dokumentooborot kak informatsionnaya baza nakopleniya znaniy // Trudy ISA RAN «Informatsionno-analiticheskie aspekty v zadachakh  upravleniya».  M.:  URSS,  2007.  T.  29  (ISBN 978–5–382–00486–0).
2.   Haykin S. Neural Networks - A Comprehensive Foundation. - Prentice Hall, 1999, 842 p.
3.   LeCun, Y., Jackel, L.D., Bottou, L., Cortes, C., Denker, J.S., Drucker, H., Guyon, I., Muller, U.A., Sackinger, E.,Simard, P. and Vapnik, V. Learning Algorithms for Classification: A Comparison on Handwritten Digit Recognition - Neural Networks: The Statistical Mechanics Perspective, Oh, J. H., Kwon, C. and Cho, S. (Ed.), World Scientific, (1995), pp. 261-276.
4.  Soldatova O.P Garshin A.A. Primenenie svertochnoy neyronnoy seti dlya raspoznavaniya rukopisnykh tsifr // Kompyuternaya optika , t. 34, 2010
5.  Simard P.Y., Steinkraus D., Plat J.C. Best Practices for Convolutional Neural Networks Applied to Visual Document Analysis, Microsoft Research, One Microsoft Way, Redmond WA 98052
6.   Li Y., Lopresti D., Nagy G., Tomkins A.- Validation of Image Defect Models for Optical Character Recognition - IEEE Transactions on Pattern Analysis and Machine Intelligence, February 1996, v. 18, pp. 99-108
7.   Zhukovskiy A.E., Usilin S.A., Tarasova N.A., Nikolaev D.P. Sintez obuchayushchey vyborki na osnove realnykh dannykh v zadachakh raspoznavaniya izobrazheniy // Konferentsiya ITIS-2012, str. 377-382.
8.  Welcome to the ICAO Machine Readable Travel Documents Programme. URL: www.icao.int/Security/mrtd/
9.   L.G. Shapiro and G. C. Stockman, Computer Vision, Prentice Hall, 2001.
10. V. A. Soyfer, Metody kompyuternoy obrabotki izobrazheniy, FIZMATLIT, 2003.
 

2024 / 03
2024 / 02
2024 / 01
2023 / 04

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".