350 руб
Журнал «Динамика сложных систем - XXI век» №4 за 2021 г.
Статья в номере:
Двухэтапная процедура нейросетевого анализа тональности текстов на русском языке
Тип статьи: научная статья
DOI: 10.18127/j19997493-202104-01
УДК: 519.6
Авторы:

А.С. Волков1, М.В. Черненький2, Е.Ю. Силантьева3

1–3 МГТУ им. Н.Э. Баумана (Москва, Россия)

Аннотация:

Постановка проблемы. Задача анализа тональности заключается в выявлении эмоционального отношения автора текста к обсуждаемому предмету или теме. Актуальность задачи связана во многом с развитием социальных сетей, онлайновых рекомендательных систем и других сервисов, содержащих большое количество мнений людей по разным темам, в частности, о товарах, услугах, предложениях, событий и пр. Мнения людей важно знать маркетологам, социологам, администраторам, политикам, управленцам. В статье предлагается решение задачи анализа тональности путем декомпозиции процедуры распознавания на два этапа с помощью нескольких нейронных сетей и разбиением анализируемых текстов на однородные подмножества.

Цель. Создание более достоверной процедуры определения мнения людей по их реакции на различные сообщения из интернета.

Результаты. Разработана и практически реализована декомпозиционная методика организации двухэтапного процесса анализа тональности текстов на русском языке путем обучения отдельных нейросетей для каждого подмножества данных. Эта методика объединяет два уровня обработки информации: первый уровень нейросети-классификатора и второй уровень, включающий несколько нейросетей-анализаторов.

Практическая значимость. Предложенная двухэтапная процедура анализа тональности текста позволяет обеспечить масштабируемость приложений, независимость управления настройками нейронных сетей и повысить достоверность оценок.

Страницы: 5-13
Для цитирования

Волков А.С., Черненький М.В, Силантьева Е.Ю. Двухэтапная процедура нейросетевого анализа тональности текстов на русском языке // Динамика сложных систем. 2021. T. 15. № 4. С. 5−13. DOI: 10.18127/j19997493-202104-01

Список источников
  1. Носков Д.В. Классификация текстов при помощи алгоритмов машинного обучения // Вестник науки и образования. 2018. №4 (40).
  2. Пархоменко П.А., Григорьев А.А., Астраханцев Н.А. Обзор и экспериментальное сравнение методов кластеризации текстов // Труды ИСП РАН. 2017. № 2. 
  3. Козлов П.Ю. Способы представления текстовой информации при автоматизированном рубрицировании коротких текстовых документов // Программные продукты и системы. 2017. № 4.
  4. Абрамов П.С. Извлечение ключевой информации из текста // Новые информационные технологии в автоматизированных системах. 2018. № 21.
  5. Куликова Н.Р. Автоматическая генерация текста (на примере новости фигурного катания) // Цифровая наука. 2020. № 6.
  6. Семина Т.А. Анализ тональности текста: современные подходы и существующие проблемы // Социальные и гуманитарные науки. Отечественная и зарубежная литература. Сер. 6, Языкознание: Реферативный журнал. 2020. № 4.
  7. Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. Автоматическая обработка текстов на естественном языке и анализ данных: учеб. пособие. М.: Изд-во НИУ ВШЭ. 2017. 269 с.
  8. Roh Y., Heo G., Whang S.E. A Survey on Data Collection for Machine Learning: A Big Data – AI Integration Perspective / IEEE Transactions on Knowledge and Data Engineering. 2021. V. 33. № 4. P. 1328–1347. 
  9. Di Nunzio G. M., Vezzani F. A Linguistic Failure Analysis of Classification of Medical Publications: A Study on Stemming vs Lemmatization. In Cabrio E., Mazzei A., Tamburini F. (Eds.), Proceedings of the Fifth Italian Conference on Computational Linguistics CLiC-it 2018: 10–12 December 2018, Torino. Torino: Academia University Press. 2018. 
  10. Amjad M., Gelbukh A. Voronkov I. Saenko A. Comparison of Text Classification Methods using Deep Learning Neural Networks. Proceedings of the 20th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing). 2019.
  11. Dang N.C., Moreno-García M.N., De la Prieta F. Sentiment Analysis Based on Deep Learning: A Comparative Study. Electronics. 2020. V. 9(3). P. 483.
  12. Gonzalez-Garcia A., Modolo D., Ferrari V. Do Semantic Parts Emerge in Convolutional Neural Networks? International Journal of Computer Vision. 2018. V. 126. 
  13. Alzubaidi L., Zhang J., Humaidi A.J. et al. Review of deep learning: concepts, CNN architectures, challenges, applications, future directions. Journal of Big Data Proceedings 8, 53 (2021).
  14. Rogers A., Romanov A., Rumshisky A., Volkova S., Gronas M., Gribov A. RuSentiment: An Enriched Sentiment Analysis Dataset for Social Media in Russian. In Proceedings of the 27th International Conference on Computational Linguistics (P. 755–763). Association for Computational Linguistics. 2018.
Дата поступления: 06.09.2021
Одобрена после рецензирования: 22.09.2021
Принята к публикации: 10.11.2021