350 руб
Журнал «Нелинейный мир» №4 за 2023 г.
Статья в номере:
Анализ тональности текста в социальных сетях
Тип статьи: научная статья
DOI: https://doi.org/10.18127/j20700970-202304-07
УДК: 518
Авторы:

А.А. Журина1, С.В. Прокопчина2, П.Е. Рябов3, Е.Ю. Щетинин4

1-4 Финансовый университет при Правительстве Российской Федерации (Москва, Россия)

1 alena21081998@yandex.ru, 2 svprokopchina@fa.ru, 3 peryabov@fa.ru, 4 eyshchetinin@fa.ru

Аннотация:

Постановка проблемы. Анализ тональности текста в документах и социальных сетях предоставляет возможность оперативного и адекватного реагирования, в том числе в маркетинговых целях.

Цель. Исследовать методы анализа тональности текстов, выявить их сильные и слабые стороны.

Результаты. Рассмотрены известные методы анализа тональности текстов. Проведена апробация на данных, выгруженных из социальной сети. Приведен пример программной реализации анализа тональности текста.

Практическая значимость. Проведенный анализ показал, что на основе подробного описания возможностей алгоритмов возможна разработка гибридных моделей или ансамблей для повышения точности прогноза.

Страницы: 55-68
Для цитирования

Журина А.А., Прокопчина С.В., Рябов П.Е., Щетинин Е.Ю. Анализ тональности текста в социальных сетях // Нелинейный мир. 2023. Т. 21. №4. С. 55-68. DOI: https://doi.org/10.18127/j20700970-202304-07

Список источников
  1. Павлов А.С., Добров Б.В. Метод обнаружения массово порожденных неестественных текстов на основе анализа тематической структуры // Вычислительные методы и программирование: новые вычислительные технологии. 2011. Т. 12. С. 58–72.
  2. Янина А.О., Воронцов К.В. Мультимодальные тематические модели для разведочного поиска в коллективном блоге // Машинное обучение и анализ данных. 2016. Т. 2. № 2. С. 173–186.
  3. Адаскина Ю.В., Паничева П.В., Попов А.М. Сентиментный анализ твитов на основе синтаксических связей // Компьютерная лингвистика и интеллектуальные технологии: материалы ежегодной Междунар. конф. «Диалог». М.: Изд-во РГГУ. 2015. С. 25–35.
  4. Айсина Р.М. Обзор средств визуализации тематических моделей коллекций текстовых документов // Машинное обучение и анализ данных (http://jmlda.org). 2015. Т. 1. № 11. С. 1584–1618.
  5. Котельников Е.В., Клековкина М.В. Автоматический анализ тональности текстов на основе методов машинного обучения // Компьютерная лингвистика и интеллектуальные технологии: труды XVIII Междунар. конф. «Диалог 2012». В 2-х томах (Бекасово, 30 мая – 3 2012 г.). М.: Изд-во РГГУ. 2012. Вып. 11 (18). Т. 2. С. 27–36.
  6. Tang X., Yang C., Wong Y., Wei C. Understanding Online Consumer Review Opinions with Sentiment Analysis using Machine Learning // Pacific Asia Journal of the Association for Information Systems. 2010. № 3(2). P. 73–89.
  7. Feng Y., Lapata M. Topic models for image annotation and text illustration // Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics. Association for Computational Linguistics, 2010. P. 831–839.
  8. Chuang J., Gupta S., Manning C., Heer J. Topic model diagnostics: Assessing domain relevance via topical alignment // Proceedings of the 30th International Conference on Machine Learning (ICML-13) / Ed. by S. Dasgupta, D. Mcallester. JMLR Workshop and Conference Proceedings. 2013. V. 28. P. 612–620.
  9. Батура Т.В. Методы автоматической классификации текстов // Программные продукты и системы. 2017. Т. 30. № 1. С. 85–99.
  10. Гаршина В.В., Калабухов К.С., Степанцов В.А., Смотров С.В. Разработка системы анализа тональности текстовой информации // Вестник ВГУ. Сер. Системный анализ и информационные технологии. 2017. № 3. С. 185-194. [Электронный ресурс] URL: http://www.vestnik.vsu.ru/pdf/analiz/2017/03/2017-03-21.pdf (дата обращения: 19.12.2023).
  11. Котельников Е.В., Клековкина М.В. Определение весов оценочных слов на основе генетического алгоритма в задаче анализа тональности 28 текстов // Программные продукты и системы, 2013. Вып. 4. С. 296–301.
  12. Рубцова Ю.В. Построение корпуса текстов для настройки тонового классификатора // Программные продукты и системы. Новосибирск: Научно-исследовательский институт «Центрпрограммсистем». 2015 № 109. С. 72–78.
  13. Клековкина М.В., Котельников Е.В. Метод автоматической классификации текстов по тональности, основанный на словаре эмоциональной лексики // Труды XIV Всеросс. науч. конф. «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL). Переславль-Залесский: Изд-во «Университет города Переславль». 2012. С. 118–123.
  14. Frei O., Apishev M. Parallel non-blocking deterministic algorithm for online topic modeling // AIST’2016, Analysis of Images, Social networks and Texts. Springer International Publishing Switzerland, Communications in Computer and Information Science (CCIS). 2016. V. 661. P. 132–144.
  15. Основы Natural Language Processing для текста // [Электронный ресурс] URL: https://habr.com/ru/company/Voxim-plant/blog/446738/ (дата обращения: 19.12.2023).
  16. Обучаем компьютер чувствам (sentiment analysis по-русски) [Электронный ресурс] URL: https://habr.com/ru /post/149605/  (дата обращения: 19.12.2023).
  17. Автоматическое определение тональности текста (Sentiment Analysis) // [Электронный ресурс] URL: https://habr.com/ru/post/263171/ (дата обращения: 19.12.2023).
  18. Математические методы анализа текстов. Семинар 3. Классификация текстов. Анализ тональности // [Электронный ресурс] UR: http://www.machinelearning.ru/wiki/images/6/64/Mel_lain_msu_nlp_sem_3.pdf (дата обращения: 19.12.2023).
  19. Математические методы анализа текстов. Векторные представления слов [Электронный ресурс] URL: word2vechttp://www.machinelearning.ru/wiki/images/b/b3/Word2Vec.pdf (дата обращения: 19.12.2023).
  20. Воронцов К.В., Потапенко А.А. Модификации EM-алгоритма для вероятностного тематического моделирования // Машинное обучение и анализ данных. 2013. Т. 1. № 6. С. 657–686.
  21. Воронцов К.В., Потапенко А.А. Регуляризация вероятностных тематических моделей для повышения интерпретируемости и определения числа тем // Компьютерная лингвистика и интеллектуальные технологии: материалы ежегодной Междунар. конф. «Диалог» (Бекасово, 4–8 июня 2014 г.). Вып. 13 (20). М: Изд-во РГГУ. 2014. С. 676–687.
  22. SVM. Объяснение с нуля и реализация на python. Подробный разбор метода опорных векторов // [Электронный ресурс] URL: https://habr.com/ru/company/ods/blog/484148/ (дата обращения: 19.12.2023).
  23. Краткий обзор алгоритма машинного обучения Метод Опорных Векторов (SVM) // [Электронный ресурс] URL: https://habr.com/ru/post/428503/ (дата обращения: 19.12.2023).
  24. Bodrunova S., Koltsov S., Koltsova O., Nikolenko S. I., Shimorina A. Interval semisupervised LDA: Classifying needles in a haystack // MICAI (1) / Ed. by F.C. Espinoza, A.F. Gelbukh, M. Gonzalez-Mendoza. V. 8265 of Lecture Notes in Computer Science. Springer. 2013. P. 265–274.
  25. Kataria S., Mitra P., Caragea C., Giles C.L. Context sensitive topic models for author influence in document networks // Proceedings of the Twenty-Second international joint conference on Artificial Intelligence. IJCAI’11. AAAI Press, 2011.
    V. 3. P. 2274–2280.
  26. Liu J., Shang J., Wang C., Ren X., Han J. Mining quality phrases from massive text corpora // Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data. SIGMOD ’15. New York, NY, USA: ACM. 2015.
    P. 1729–1744.
  27. Shang J., Liu J., Jiang M., Ren X., Voss C.R., Han J. Automated phrase mining from massive text corpora // CoRR. 2017. V. abs/1702.04457.
  28. Fuller C.M., Biros D.P. and Delen D. An investigation of data and text mining methods for real world deception detection. Expert Systems with Applications. 2011. № 38. P. 8392–8398.
  29. Grant C.E., George C.P., Kanjilal V., Nirkhiwale S., Wilson J.N., Wang D.Z. A topic-based search, visualization, and exploration system // FLAIRS Conference. AAAI Press. 2015. P. 43–48.
Дата поступления: 09.11.2023
Одобрена после рецензирования: 17.11.2023
Принята к публикации: 20.11.2023