Математическое моделирование
Наукометрия и управление наукой
Моделирование характеристик деятельности отраслевых и региональных подсистем
Компьютерный анализ текстов
М.И. Ананьева, Д.А. Девяткин, М.В. Кобозева, И.В. Смирнов, Ф.Н Соловьев, А.М. Чеповский "Исследование характеристик текстов противоправного содержания"
М.И. Ананьева, Д.А. Девяткин, М.В. Кобозева, И.В. Смирнов, Ф.Н Соловьев, А.М. Чеповский "Исследование характеристик текстов противоправного содержания"

Аннотация.

В работе описаны корпуса текстов для обучения и тестирования методов обнаружения текстов экстремистской направленности. Выполнено исследование характеристик текстов русскоязычного корпуса. Сформирован набор признаков, характерных для материалов противоправного содержания. Эмпирически показана применимость выявленных признаков для решения задачи обнаружения сообщений экстремистского содержания.

Ключевые слова:

противоправные тексты, психолингвистические признаки, дифференцирующие признаки, классификация текстов.

Стр. 86-97.

Полная версия статьи в формате pdf. 

Литература

1. Cohen K., Johansson F., Kaati L. and Mork J.C. Detecting linguistic markers for radical violence in social media // Terrorism and Political Violence 2014. Vol. 26, No 1. pp. 256–256.
2. Finlayson M. A., Halverson J. R., Corman S. R. The N2 corpus: A semantically annotated collection of Islamist extremist stories //LREC. – 2014. – p. 896-
902.
3. Осипов Г.С. Методы искусственного интеллекта. – М.: ФИЗМАТЛИТ. – 2011. – 296 с.
4. Чеповский А. М. Информационные модели в задачах обработки текстов на естественных языках. Второе издание, переработанное. М.: Национальный открытый университет «ИНТУИТ», 2015. – 276 с.
5. Поляков И.В., Соколова Т.В., Чеповский А.А., Чеповский А.М. Проблема классификации текстов и дифференцирующие признаки // Вестник Новосибирского государственного университета. Серия: Информационные технологии. – 2015. – Т. 13. – № 2. – С. 55 – 63.
6. Ceran B. et al. A semantic triplet based story classifier //Proceedings of the 2012 International Conference on Advances in Social Networks Analysis and Mining (ASONAM 2012). – IEEE Computer Society, 2012. – p. 573-580.
7. Correa D., Sureka A. Solutions to detect and analyze online radicalization: a survey //arXiv preprint arXiv:1301.4916. – 2013.
8. Ананьева М.И, Кобозева М.В., Соловьев Ф.Н., Поляков И.В., Чеповский А.М. О проблеме выявления экстремистской направленности в текстах.
// Вестник НГУ. – 2016. – Т. 14. – №. 4. – С. 5-13.
9. Жданова С. Ю. и др. Особенности репрезентации этнической агрессии в корпусе сообщений пермского сегмента социальной сети «В контакте»(Vk. com) //Вектор науки Тольяттинского государственного университета. Серия: Педагогика, психология. – 2012. – №. 4 (11).
10. Chen H. Exploring extremism and terrorism on the web: the dark web project //Pacific-Asia Workshop on Intelligence and Security Informatics. – Springer Berlin Heidelberg, 2007. – С. 1-20.
11. Prentice S. et al. Analyzing the semantic content and persuasive composition of extremist media: A case study of texts produced during the Gaza conflict //Information Systems Frontiers. – 2011. – Vol. 13(1). – pp. 61-73
12. Agarwal S., Sureka A. Using KNN and SVM based one-class classifier for detecting online radicalization on twitter //International Conference on Distributed Computing and Internet Technology. – Springer International Publishing, 2015. – pp. 431-442.
13. Ashcroft M. et al. Detecting jihadist messages on twitter //Intelligence and Security Informatics Conference (EISIC), 2015 European. – IEEE,
2015. – pp. 161-164.
14. Scanlon J. R., Gerber M. S. Automatic detection of cyber-recruitment by violent extremists // Security Informatics. – 2014. – Vol. 3 (1). – p. 1.
15. Huang J., Ling C. X. Using AUC and accuracy in evaluating learning algorithms //IEEE Transactions on knowledge and Data Engineering. – 2005. – Vol. 17(3). – pp. 299-310
16. Bodine-Baron E. et al. Examining ISIS Support and Opposition Networks on Twitter //RAND Corporation. – 2016. – pp. 29-30.
17. Wadhwa P., Bhatia M. P. S. Classification of radical messages in Twitter using security associations // Case studies in secure computing: Achievements
and trends. – 2014. – pp. 273-294.
18. Михайлов А.С., Соколова Т.В., Чеповский А.А., Чеповский А.М. Выявление тематической направленности текстов на естественных языках // Искусственный интеллект и принятие решений. 2016. – № 1. – С. 9 – 17.
19. Zurini M. Stylometry Metrics Selection for Creating a Model for Evaluating the Writing Style of Authors According to Their Cultural Orientation //Informatica Economica. – 2015. – Vol. 19 (3). – pp. 107.
20. Bhargava M., Mehndiratta P., Asawa K. Stylometric analysis for authorship attribution on twitter //International Conference on Big Data Analytics. – Springer International Publishing, 2013. – pp. 37-47.
21. Brocardo M. L., Traore I., Woungang I. Toward a framework for continuous authentication using stylometry //Advanced Information Networking and Applications (AINA), 2014 IEEE 28th International Conference on. – IEEE, 2014. – С. 106-115.
22. Nirkhi S. M., Dharaskar R. V., Thakare V. M. Authorship Attribution of online messages using Stylometry: An Exploratory Study //International Conference on Advances in Engineering and Technology (ICAET’2014). – 2014.
23. Osipov G. et al. Relational-situational method for intelligent search and analysis of scientific publications //Proceedings of the Integrating IR Technologies for Professional Search Workshop. – 2013. – pp. 57-64.
24. Vybornova O. et al. Social tension detection and intention recognition using natural language semantic analysis: On the material of Russianspeaking social networks and Web forums // Intelligence and Security Informatics Conference (EISIC), 2011 European. – IEEE, 2011. – pp. 277- 281.
25. Драль А. А., Соченков И. В., Мбайкоджи Э. Метод автоматической классификации коротких текстовых сообщений //Информационные технологии и вычислительные системы. – 2012. – С. 93-102.
26. Kira K., Rendell L.A. The feature selection problem: Traditional methods and a new algorithm // AAAI. – 1992. – Т. 2. – С. 129 – 134.
27. Pedregosa F. et al. Scikit-learn: Machine learning in Python //Journal of Machine Learning Research. – 2011. – Vol. 12. – No. Oct. – pp. 2825-2830

 

2024-74-1
2023-73-4
2023-73-3
2023-73-2

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".