Е.В. Котельников – к.т.н., доцент, кафедра прикладной математики и информатики, Вятский государственный университет
E-mail: kotelnikov.ev@gmail.com
В.Р. Милов – д.т.н., профессор, зав. кафедрой «Электроника и сети ЭВМ», Нижегородский государственный технический университет им. Р.Е. Алексеева
E-mail: vladimir.milov@gmail.com
Постановка проблемы. Автоматический анализ мнений в текстах связан с исследованием мнений, эмоций, оценок людей по отношению к различным продуктам, услугам, организациям, персонам, событиям, темам, а также к их атрибутам. Основной задачей при этом является определение тональности мнения, то есть степени эмоциональности выражаемого отношения.
Цель работы. Разработать методологию интеллектуального анализа мнений в текстах TextJSM, основанную на концепции ДСМ-рассуждений и включающую методы правдоподобного вывода – индуктивного вывода, вывода по аналогии и абдуктивного вывода, а также метод предварительной обработки текстов.
Результаты. В методе индуктивного вывода на основе обучающего набора данных порождаются гипотезы – возможные причины наличия или отсутствия тональности у текстов обучающей выборки. В методе вывода по аналогии порожденные гипотезы применяются для предсказания тональности новых текстов. Метод абдуктивного вывода необходим для проверки того, в какой степени порожденные гипотезы объясняют исходные данные, и принятия гипотез в случае успешного объяснения. На основе метода предварительной обработки формируется внутреннее представление текстов, подходящее для дальнейшего применения методов правдоподобного вывода, в частности, осуществляется сегментация текста на предложения и слова, морфологический анализ с выделением нормальных форм и частей речи слов, а также постморфологический анализ, включающий удаление редких и стоп-слов. Для применения методологии TextJSM необходимо наличие лингвистических ресурсов – коллекции обучающих текстов и словаря оценочной лексики. Рассмотрен пример применения методологии TextJSM для анализа мнений в отзыве о фильме.
Практическая значимость. Методология TextJSM может успешно применяться при анализе социальных медиа, в маркетинговых, социологических и политологических исследованиях, при разработке рекомендательных и поисковых систем, обеспечивая высокую точность, полную прозрачность процесса решения и объяснение исходных данных на основе порожденных гипотез.
- Liu B. Sentiment Analysis and Opinion Mining // Synthesis Lectures on Human Language Technologies. Morgan & Claypool Publishers. 2012. V. 5(1).
- Yue L., Chen W., Li X., Zuo W., Yin M. A survey of sentiment analysis in social media // Knowledge and Information Systems. 2019. V. 60(2). P. 617–663.
- Котельников Е.В., Милов В.Р. Исследование сообщений пользователей социальных медиа на основе анализа реляционных понятий // Нейрокомпьютеры: разработка, применение. 2017. № 7. С. 58–65.
- Sun S., Luo C., Chen J. A review of natural language processing techniques for opinion mining systems // Information Fusion. 2017. V. 36. P. 10–25.
- Goyal A., Gupta V., Kumar M. Recent Named Entity Recognition and Classification techniques: A systematic review // Computer Science Review. 2018. V. 29. P. 21–43.
- Schouten K., Frasincar F. Survey on Aspect-Level Sentiment Analysis // IEEE Transactions on Knowledge and Data Engineering. 2016. V. 28. P. 813–830.
- Финн В.К. Эпистемологические основания ДСМ-метода. Ч. I // НТИ. Сер. 2. Информационные процессы и системы. 2013. № 9. С. 1–29.
- Котельников Е.В. Повышение быстродействия ДСМ-метода в задачах обработки текстовой информации // Труды Четырнадцатой национальной конференции по искусственному интеллекту с международным участием КИИ-2014. 2014. Т. 2. С. 274–282.
- Котельников Е.В. Метод анализа тональности текстов TextJSM // Научно-техническая информация. Сер. 2. 2018. №2. С. 8–20.
- Kotelnikov E.V., Peskisheva T.A., Kotelnikova A.V., Razova E.V. A comparative study of publicly available Russian sentiment lexicons // Artificial Intelligence and Natural Language. AINL 2018. Communications in Computer and Information Science. 2018. V. 930. P. 139–151.
- Andrews S. Making use of empty intersections to improve the performance of CbO-type algorithms // Proceedings of the 14th International Conference on Formal Concept Analysis. Springer. 2017. P. 56–71.
- Котельников Е.В. Функция оценки информативности гипотез для анализа тональности текстов на основе ДСМметода // Фундаментальные исследования. 2014. № 11(10). С. 2150–2154.