|
М.И. Ананьева, Д.А. Девяткин, М.А. Каменская, М.В. Кобозева, И.В. Смирнов "Автоматическое извлечение финансово-экономической информации из текстов на русском языке" |
|
Аннотация. В статье рассматриваются проблемы создания методов и программных средств автоматического извлечения из текстов информации о финансово-экономических событиях и фактах, связанных с заданной географической областью (на примере Арктической зоны), с целью поддержки принятия решений на основе анализа информационного пространства. Предложен метод извлечения информации об инвестировании средств из текстов на русском языке, который позволяет выявлять сам факт вложения средств, сумму инвестирования, организацию - инвестора и географическую локацию (регион), в которой расположен объект финансирования. Представлен экспериментальный корпус из материалов СМИ, статей в профильных изданиях, посвященных Арктической зоне. Работоспособность предложенного метода была подтверждена экспериментально на представленном корпусе. Ключевые слова:информационно-поисковая система, извлечение финансово-экономической информации, поддержка принятия решений. Стр. 23-30 Полная версия статьи в формате pdf. Литература1. Maes J. et al. Mapping ecosystem services for policy support and decision making in the European Union // Ecosystem Services. 2012. Vol. 1. №. 1 pp. 31-39. 2. Starostin A.S., Smurnov I.M., Stepanova M.E. A production system for information extraction based on complete syntactic-semantic analysis // Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference "Dialogue". 2014. URL: http://www. dialog-21.ru/digests/dialog2014/materials/pdf/StarostinAS.full.pdf 3. Харабет Я.К. Автоматическое выделение количественных конструкций в русскоязычных научно-популярных текстах // Сборник трудов XVIII Всероссийской объединененной конференции IMS-2015. C. 100-102. 4. Хайрова Н., Шаронова Н., Гаутам А.П.С. Логико-лингвистическая модель генерации фактов из текстовых потоков информационной корпоративной системы // Information Theories and Applications. 2015. № 2. T. 22. C. 142-152. 5. Гершензон Л.М., Ножов И.М., Панкратов Д.В. Система извлечения и поиска структурированной информации из больших текстовых массивов СМИ. Архитектурные и лингвистические особенности // Сборник “Компьютерная лингвистика и интеллектуальные технологии”. 2005. URL: http://www.dialog-21.ru/Archive/2005/Gershenzon%20Nozhov%20Pankratov/Gershenzon_Nozhov_Pankratov.pdf 6. Кормалев Д.А., Куршев Е.П., Сулейманова Е.А., Трофимов И.В. Извлечение информации из текста в системе ИСИДА-Т // Труды 11-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL’2009. Петрозаводск, Россия. 2009. URL: http://resources.krc.karelia.ru/math/doc/rcdl2009/247_253_Section07-2.pdf 7. Власова Н.А. Извлечение информации о ситуациях отставок-назначений в новостных текстах. Опыт разметки коллекции. Результаты тестирования // Труды 15-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL-2013. Ярославль, Россия. 2013. URL: http://ceur-ws.org/Vol-1108/paper6.pdf 8. Zharikov A., Kristalovsky K., Pivovarov V. Information Retrieval System for News Articles in Russian // Proceedings of the Fifth Russian Young Scientists Conference in Information Retrieval. St. Petersburg. 2011. P. 5-14. URL: http://elar.urfu.ru/bitstream/10995/3707/3/RuSSIR_2011_01.pdf 9. O'Connor B., Stewart B., Smith N. A. Learning to extract international relations from political context. 2013. 10. Hogenboom A., Hogenboom F., Frasincar F., Schouten K., O. van der Meer. Semanticsbased information extraction for detecting economic events. URL: http://link.springer.com/article/10.1007/s11042-012-1122-0/fulltext.html 11. Nastase V., Strube M. Transforming Wikipedia into a large scale multilingual concept network // Artificial Intelligence. 2013. Vol. 194. P. 62-85. 12. Al-Rfou R., Kulkarni V., Perozzi B., Skiena S. Polyglot-NER: Massive multilingual named entity recognition //Proceedings of the 2015 SIAM International Conference on Data Mining. – Society for Industrial and Applied Mathematics, 2015. P. 586-594. 13. Дмитриев А.С., Соловьев И.С., Заболеева-Зотова А.В. Извлечение взаимосвязей между объектами и терминами в текстах на экономическую тематику //Известия Волгоградского государственного технического университета. 2015. №. 13. С. 55-60. 14. Сокирко А.В. Морфологические модули на сайте www. aot.ru // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции «Диалог’2004». 2004. 15. Padró L., Stanilovsky E. Freeling 3.0: Towards wider multilinguality // LREC2012. 2012. 16. Суворов Р.Е., Соченков И.В. Определение связанности научно-технических документов на основе характеристики тематической значимости //Искусственный интеллект и принятие решений. 2013. №. 1. С. 33-40. 17. Смирнов И.В., Шелманов А.О., Кузнецова Е.С., Храмоин И.В. Семантико-синтаксический анализ естественных языков //Искусственный интеллект и принятие решений. 2013.№.1.С.43. 18. Flach P. Machine learning: the art and science of algorithms that make sense of data // Cambridge University Press. 2012.
|