350 руб
Журнал «Нейрокомпьютеры: разработка, применение» №5 за 2019 г.
Статья в номере:
Способ анализа мнений в текстах на основе правдоподобного вывода
Тип статьи: научная статья
DOI: 10.18127/j19998554-201905-04
УДК: 004.89
Авторы:

Е.В. Котельников – к.т.н., доцент,  кафедра прикладной математики и информатики, Вятский государственный университет

E-mail: kotelnikov.ev@gmail.com

В.Р. Милов – д.т.н., профессор, зав. кафедрой «Электроника и сети ЭВМ», Нижегородский государственный технический университет им. Р.Е. Алексеева

E-mail: vladimir.milov@gmail.com

Аннотация:

Постановка проблемы. Автоматический анализ мнений в текстах связан с исследованием мнений, эмоций, оценок людей по отношению к различным продуктам, услугам, организациям, персонам, событиям, темам, а также к их атрибутам. Основной задачей при этом является определение тональности мнения, то есть степени эмоциональности выражаемого отношения.

Цель работы. Разработать методологию интеллектуального анализа мнений в текстах TextJSM, основанную на концепции ДСМ-рассуждений и включающую методы правдоподобного вывода – индуктивного вывода, вывода по аналогии и абдуктивного вывода, а также метод предварительной обработки текстов.

Результаты. В методе индуктивного вывода на основе обучающего набора данных порождаются гипотезы – возможные причины наличия или отсутствия тональности у текстов обучающей выборки. В методе вывода по аналогии порожденные гипотезы применяются для предсказания тональности новых текстов. Метод абдуктивного вывода необходим для проверки того, в какой степени порожденные гипотезы объясняют исходные данные, и принятия гипотез в случае успешного объяснения. На основе метода предварительной обработки формируется внутреннее представление текстов, подходящее для дальнейшего применения методов правдоподобного вывода, в частности, осуществляется сегментация текста на предложения и слова, морфологический анализ с выделением нормальных форм и частей речи слов, а также постморфологический анализ, включающий удаление редких и стоп-слов. Для применения методологии TextJSM необходимо наличие лингвистических ресурсов – коллекции обучающих текстов и словаря оценочной лексики. Рассмотрен пример применения методологии TextJSM для анализа мнений в отзыве о фильме.

Практическая значимость. Методология TextJSM может успешно применяться при анализе социальных медиа, в маркетинговых, социологических и политологических исследованиях, при разработке рекомендательных и поисковых систем, обеспечивая высокую точность, полную прозрачность процесса решения и объяснение исходных данных на основе порожденных гипотез.

Страницы: 38-46
Список источников
  1. Liu B. Sentiment Analysis and Opinion Mining // Synthesis Lectures on Human Language Technologies. Morgan & Claypool Publishers. 2012. V. 5(1).
  2. Yue L., Chen W., Li X., Zuo W., Yin M. A survey of sentiment analysis in social media // Knowledge and Information Systems. 2019. V. 60(2). P. 617–663.
  3. Котельников Е.В., Милов В.Р. Исследование сообщений пользователей социальных медиа на основе анализа реляционных понятий // Нейрокомпьютеры: разработка, применение. 2017. № 7. С. 58–65.
  4. Sun S., Luo C., Chen J. A review of natural language processing techniques for opinion mining systems // Information Fusion. 2017. V. 36. P. 10–25.
  5. Goyal A., Gupta V., Kumar M. Recent Named Entity Recognition and Classification techniques: A systematic review // Computer Science Review. 2018. V. 29. P. 21–43.
  6. Schouten K., Frasincar F. Survey on Aspect-Level Sentiment Analysis // IEEE Transactions on Knowledge and Data Engineering. 2016. V. 28. P. 813–830.
  7. Финн В.К. Эпистемологические основания ДСМ-метода. Ч. I // НТИ. Сер. 2. Информационные процессы и системы. 2013. № 9. С. 1–29.
  8. Котельников Е.В. Повышение быстродействия ДСМ-метода в задачах обработки текстовой информации // Труды Четырнадцатой национальной конференции по искусственному интеллекту с международным участием КИИ-2014. 2014. Т. 2. С. 274–282.
  9. Котельников Е.В. Метод анализа тональности текстов TextJSM // Научно-техническая информация. Сер. 2. 2018. №2. С. 8–20.
  10. Kotelnikov E.V., Peskisheva T.A., Kotelnikova A.V., Razova E.V. A comparative study of publicly available Russian sentiment lexicons // Artificial Intelligence and Natural Language. AINL 2018. Communications in Computer and Information Science. 2018. V. 930. P. 139–151.
  11. Andrews S. Making use of empty intersections to improve the performance of CbO-type algorithms // Proceedings of the 14th International Conference on Formal Concept Analysis. Springer. 2017. P. 56–71.
  12. Котельников Е.В. Функция оценки информативности гипотез для анализа тональности текстов на основе ДСМметода // Фундаментальные исследования. 2014. № 11(10). С. 2150–2154.
Дата поступления: 4 марта 2019 г.