Д.А. Девяткин – гл. специалист, ФИЦ «Информатика и управление» РАН (Москва)
E-mail: devyatkin@isa.ru
А.О. Шелманов – к.т.н., науч. сотрудник, ФИЦ «Информатика и управление» РАН (Москва) E-mail: shelmanov@isa.ru
Д.С. Ларионов – студент, РУДН (Москва)
E-mail: dslarionov@protonmail.com
Исследовано создание прототипа системы для решения задач мониторинга чрезвычайных ситуаций (ЧС) в заданной географической области на основе анализа данных из социальных сетей. Рассмотрена архитектура системы, ее основные компоненты, а также лежащие в их основе методы сбора и анализа текстовой информации. Описаны методы сфокусированного сбора сообщений о ЧС из разнородных источников, извлечения информации из текстов, включая названия географических объектов и наименования морских и речных судов, классификации сообщений, а также методы обнаружения новых ЧС в потоке сообщений и их визуализации на географической карте.
- Sixto J., Pena O., Klein B., López-de Ipina D. Enable tweet-geolocation and don’t drive ERTs crazy! Improving situational awareness using Twitter // Proc. of SMERST. 2013. P. 27−31.
- Девяткин Д.А., Шелманов А.О. Анализ неструктурированных текстовых данных для поддержки поисково-спасательных работ // Системы высокой доступности. 2015. № 4. С. 45−60.
- Devyatkin D. and Shelmanov A. Text processing framework for emergency event detection in the Arctic zone // Communications in Computer and Information Science. 2017. № 706. P. 74−88.
- Devyatkin D., Shelmanov A. and Larionov D. Discovering Novel Emergency Events in Text Streams // Proc. of the XX International Conference «Data Analytics and Management in Data Intensive Domains» (DAMDID/RCDL’2018). Moscow, Russia. October 9−12, 2018. [В печати].
- Ashktorab Z. et al. Tweedr: Mining twitter to inform disaster response // ISCRAM. 2014.
- Carreras X. et al. FreeLing: An Open-Source Suite of Language Analyzers // LREC. 2004. С. 239−242.
- Nivre J., Hall J., Nilsson J. Maltparser: A data-driven parser-generator for dependency parsing // Proc. of LREC. 2006. Т. 6. С. 2216−2219.
- Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg S Corrado and Jeff Dean Distributed representations of words and phrases and their compositionality // Advances in neural information processing systems. 2013. P. 3111−3119.
- Alexandra Olteanu, Carlos Castillo, Fernando Diaz and Sarah Vieweg CrisisLex: A lexicon for collecting and filtering microblogged communications in crises // Proc. of ICWSM. 2014.
- Al-Rfou R. et al. Polyglot-NER: Massive multilingual named entity recognition // Proc. of the 2015 SIAM International Conference on Data Mining. Society for Industrial and Applied Mathematics. 2015. С. 586−594.
- Osipov G., Smirnov I., Tikhomirov I., Sochenkov I. and Shelmanov A. Exactus expert search and analytical engine for research and development support // Novel Applications of Intelligent Systems. Springer. 2016. P. 269−285.
- Ianina A., Golitsyn L. and Vorontsov K. Multi-objective topic modeling for exploratory search in tech news // Conference on Artificial Intelligence and Natural Language. Springer. 2017. P. 181−193.