Ю.Ю. Петрунин − д.фил.н., профессор, зав. кафедрой математических методов и информационных технологий в управлении, факультет государственного управления, МГУ им. М.В. Ломоносова; руководитель Центра анализа больших данных в общественных науках
E-mail: Petrunin@spa.msu.ru
Ю.А. Силуянова − аспирант, факультет государственного управления, МГУ им. М.В. Ломоносова
E-mail: zernovaju@gmail.com
М.Г. Мягков − д.ф.-м.н., профессор, факультет политологии, Университет штата Орегон (США); вед. науч. сотрудник, кафедра математических методов и информационных технологий в управлении, факультет государственного управления, МГУ им. М.В. Ломоносова
E-mail: myagkov@uoregon.edu
И.В. Козицин − аспирант, Московский физико-технический институт
E-mail: kozitsin.ivan@mail.ru
С.Д. Осипов − студент, Московский физико-технический институт
E-mail: Petrunin@spa.msu.ru
Постановка проблемы. Перспективы использования больших данных из социальных сетей (Big Data) для прогнозирования электорального поведения затруднены ограниченностью/недостаточностью, зашумленностью и искаженностью доступных в аккаунтах данных о демографических, политических и иных существенных характеристиках пользователей, что усложняет построение каузальных прогностических моделей. Совместное использование для обработки данных соцсетей статистических и нейросетевых методов позволяет решить данную задачу и получить более надежные и достоверные результаты.
Цель. При помощи технологий Big Data, методов статистического анализа, нейросетевых алгоритмов снизить размерность и объем социально-демографических данных, доступных в аккаунтах в социальной сети «ВКонтакте», и выявить закономерности электорального поведения разных групп избирателей.
Результаты. Исследование проводилось на выборке чуть более 25 тыс. человек. Были выделены основные причины искажения информации (аккаунты-клоны, сетевые тролли, «партизаны» и др.) и предложены статистические и нейросетевые методы преодоления/уменьшения искажений. Выявлено влияние гендерных, возрастных и политических характеристик пользователей соцсети на формирование кластеров и выбор фаворита на президентских выборах в России 2018 года.
Практическая значимость. Предложенные методы и алгоритмы могут быть использованы для прогнозирования электорального поведения, а также для описания политических настроений электората, его структуры и связи с социальнодемографическими характеристиками.
- Петрунин Ю.Ю., Зернова Ю.А. Статистические и нейросетевые методы исследования политической ситуации во Франции на примере региональных выборов 1998 и 2004 годов // Государственное управление. Электронный вестник. 2008. № 14.
- Петрунин Ю.Ю., Зернова Ю.А. Статистические и нейросетевые методы прогнозирования электорального поведения на примере президентских выборов во Франции 2007 г. // Нейрокомпьютеры: разработка, применение. 2011. № 1. С. 11−24.
- Петрунин Ю.Ю. Исследование электорального поведения: самоорганизующиеся карты Кохонена versus статистического анализа // Вестник Московского университета. Серия 21: Управление (государство и общество). 2009. № 3. С. 45−55.
- Петрунин Ю.Ю. Нейрокомпьютинг: между наукой и лженаукой // Нейрокомпьютеры: разработка, применение. 2015. № 8. С. 52−64.
- Петрунин Ю.Ю. Нейрокомпьютерная парадигма и общество. М.: Издательство МГУ. 2012. 288 с.
- Савельев А.В. Расширение понятия нейрокомпьютера и нейрокомпьютинга // Нейрокомпьютеры: разработка, применение. 2013. № 7. С. 58-68.
- Савельев А.В. Нейросоциометодология проблемы диалога между нейробиологией и нейромоделированием // Нейрокомпьютеры: разработка, применение. 2011. № 1. С. 47-63.
- Петрунин Ю.Ю. Искусственный интеллект и методологические вопросы управления знаниями // Философские науки. 2016. № 8. С. 67−74.
- Петрунин Ю.Ю. Информационные технологии анализа данных: Учеб. пособие. М.: Издательство МГУ. 2008. 292 с.
- Кохонен Т. Самоорганизующиеся карты. М.: БИНОМ. 2008. 655 с.