Журнал «Труды Института системного анализа Российской академии наук» - В.А. Малых, В.А. Лялин "К вопросу о классификации зашумленных текстов"

Просматривается номер 2018-S1

Интеллектуальный анализ данных и распознавание образов

Н.С. Скорюкина, А.Н. Миловзоров, Д.В. Полевой, В.В. Арлазаров "Метод распознавания объектов живописи в неконтролируемых условиях с обучением по одному примеру"

А.Е. Жуковский "Методы межкадровой интеграции результатов обнаружения документов в видеопотоке мобильного устройства"

И.А. Кунина, Е.И. Панфилова, М.А. Поволоцкий "Детектирование пешеходных переходов на изображениях дороги на основе метода динамического выравнивания временных рядов"

О.А. Славин, В.Л. Арлазаров "Метод классификации распознанных страниц деловых документов на основе текстовых ключевых точек"

О.О. Петрова, К.Б. Булатов "Методы пост-обработки результатов распознавания машиночитаемой зоны документов"

А.Е. Марченко, Е.И. Ершов, Д.А. Шепелев, Д.С. Сидорчук, В.П. Божкова, Д.П. Николаев "Разработка языка описания наблюдаемых свойств распознаваемых объектов в отсутствие примеров"

Интеллектуальные системы и технологии

Е.Е. Лимонова, Н.Л. Рженев, А.В. Усков, М.И. Нейман-заде "Быстрая реализация расстояния Хэминга на VLIW-архитектурах на примере платформы Эльбрус"

В.В. Арлазаров, К.Б. Булатов, А.В. Усков "Модель системы распознавания объектов в видеопотоке мобильного устройства"

А.А. Иванова, С.А. Гладилин, А.Е. Жуковский, Е.Л. Плискин "База данных для административного учета научных публикаций"

А.С. Ингачева, А.В. Шешкус, Т.С. Чернов, Е.Е. Лимонова, В.В. Арлазаров "Рентгеновский компьютерный томограф – новый инструмент в распознавании"

Н.О. Бесшапошников, А.Г. Кушниренко, А.А. Левин "Метод автокалибровки параметров управления учебным роботом с помощью библиотеки машинного зрения OpenCV"

Обработка и анализ изображений и сигналов

А.Е. Жуковский, Е.Е. Лимонова, Д.П. Николаев "Реализация классических алгоритмов анализа изображений через полносверточные нейронные сети"

В.Е. Прун "Уменьшение влияния сильнопоглощающих включений на восстановление алгебраическим методом в задаче компьютерной томографии"

Б.И. Савельев, И.Б. Мамай, Д.П. Николаев, В.Л. Арлазаров, К.Б. Булатов, Н.С. Скорюкина "Метод согласования графа проективных преобразований для задачи панорамирования плоских объектов"

Д.В. Тропин, Д.П. Николаев, Д.Г. Слугин "Метод совмещения изображений на основе максимизации резкости"

Ю.А. Шемякина, А.Е. Жуковский, И.А. Коноваленко, Д.П. Николаев "Алгоритм автоматического кадрирования цифровых изображений при проективном преобразовании"

Машинное обучение

А.В. Гайер, А.В. Шешкус, Ю.С. Чернышова "Аугментация обучающей выборки «на лету» для обучения нейронных сетей"

В.В. Арлазаров, Д.П. Маталов, С.А. Усилин "Локализация образа печати на документе, удостоверяющем личность, методом машинного обучения"

A.Е. Лынченко, А.В. Шешкус, В.Л. Арлазаров "Алгоритм классификации документов, удостоверяющих личность, на проективно-искаженных изображениях на основе обучаемой метрики подобия"

В.А. Малых, В.А. Лялин "К вопросу о классификации зашумленных текстов"

Ю.С. Чернышова, М.А. Алиев, А.В. Шешкус "Оптическое распознавание шрифтов на изображениях, полученных со смартфонов, и его использование для определения подлинности документов, удостоверяющих личность"

Д.А. Ильин "Быстрая локализация текстовых полей на изображения документов низкого качества"

Д.Е. Иванов, Д.В. Полевой, Д.Л. Шоломов "Отбор информативных элементов для обучения легкого сверточного нейросетевого классификатора в условиях сильного дисбаланса обучающей выборки"


	В.А. Малых, В.А. Лялин "К вопросу о классификации зашумленных текстов"
Аннотация. Классическая задача классификации текстов была освещена во множестве работ, но существующие подходы в основном сосредоточены на улучшении качества классификации для так называемых чистых коллекций, не содержащих опечаток. В этой работе авторы приводят результаты исследования современных популярных моделей текстовой классфикации на предмет устойчивости к опечаткам для корпусов на русском и английском языках. Ключевые слова: нейронные сети; классификация текстов; устойчивость к шуму. Стр. 174-182. DOI: 10.14357/20790279180520 Полная версия статьи в формате pdf. Литература 1. Joulin Armand, Grave Edouard, Bojanowski Piotr and Mikolov Tomas. 2016. Bag of Tricks for Efficient Text Classification. arXiv preprint arXiv:1607.01759. 2. Malykh Valentin. 2018. Robust Word Vectors: Embeddings for Noisy Texts. 3. Kim Yoon, Jernite Yacine, Sontag David and Rush Alexander M. 2016. Character-Aware Neural Language Models. In AAAI, pages 2741-2749. 4. Andrew L. Maas, Raymond E. Daly, Peter T. Pham, Dan Huang, Andrew Y. Ng, and Christopher Potts. 2011. Learning Word Vectors for Sentiment Analysis In Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, pages 142-150. 5. Rubtsova Yuliya. 2014. Automatic Term Extraction for Sentiment Classification of Dynamically Updated Text Collections into Three Classes In Knowledge Engineering and the Semantic Web, pp140-149, Springer 6. Bochkarev V.V., Shevlyakova A.V., and Solovyev V.D. 2015. The average word length dynamics as an indicator of cultural changes in society. Social Evolution & History, 14(2), 153-175. 7. Cucerzan S. and Brill E. 2004. Spelling correction as an iterative process that exploits the collective knowledge of web users. In Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing. 8. Joulin A., Grave E., Bojanowski P. and Mikolov T. 2016. Bag of tricks for efficient text classification. arXiv preprint arXiv:1607.01759. 9. Howard J. and Ruder S. 2018. Fine-tuned Language Models for Text Classification. arXiv preprint arXiv:1801.06146. 10. Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A.N., Kaiser L. and Polosukhin I. 2017. Attention is all you need. In Advances in Neural Information Processing Systems (pp. 6000-6010). 11. Xiang Zhang, Junbo Jake Zhao and Yann LeCun. 2017. Character-level Convolutional Networks for Text Classification. arXiv preprint arXiv:1509.01626 12. Yoon Kim. 2014. Convolutional Neural Networks for Sentence Classification. arXiv preprint arXiv:1408.5882 13. KyungHyun Cho, Bart van Merrienboer, Dzmitry Bahdanau and Yoshua Bengio. 2014. On the Properties of Neural Machine Translation: Encoder- Decoder Approaches arXiv preprint arXiv:1409.1259 14. Dzmitry Bahdanau, Kyunghyun Cho and Yoshua Bengio. 2014. Neural Machine Translation by Jointly Learning to Align and Translate arXiv preprint arXiv:1409.0473 15. Bengio Y., Simard P. and Frasconi P. 1994. Learning long-term dependencies with gradient descent is difficult. IEEE transactions on neural networks, 5(2), pp.157-166. 16. Tutubalina Elena, and Nikolenko Sergey. 2015. Inferring sentiment- based priors in topic models. In Mexican International Conference on Artificial Intelligence, pp. 92-104. 17. Niu J., Yang Y., Zhang S., Sun Z. and Zhang W. 2018. Multi-task Character-Level Attentional Networks for Medical Concept Normalization. Neural Processing Letters, pp.1-18. 18. Vinciarelli A. Noisy text categorization, 2005. IEEE Transactions on Pattern Analysis and Machine Intelligence. Dec;27(12):1882-95. 19. Srivastava N., Hinton G., Krizhevsky A., Sutskever I. and Salakhutdinov R. 2014. Dropout: a simple way to prevent neural networks from overfitting. The Journal of Machine Learning Research, 15(1), pp.1929-1958. 20. Pineda F.J. 1987. Generalization of backpropagation to recurrent neural networks. Physical review letters, 59(19), p.2229. 21. Glorot X. and Bengio Y. 2010, March. Understanding the difficulty of training deep feedforward neural networks. In Proceedings of the thirteenth international conference on artificial intelligence and statistics (pp. 249256).

2025-75-2

2025-75-1

2024-74-4

2024-74-3

Аннотация.

Ключевые слова: