А. И. Канев – аспирант, МГТУ им. Н.Э. Баумана (Москва, Россия)
E-mail: kanevai@student.bmstu.ru
Постановка проблемы. При использовании традиционного информационного поиска пользователь часто сталкивается с необходимостью формулировать несколько запросов от более общих к частным и анализировать промежуточные данные. Эту проблему можно решить с помощью семантического поиска. Одной из основных задач семантического поиска является интеллектуальный анализ текста, который также используется в большом количестве других задач. Для этого применяются различные подходы на основе машинного обучения или обработки текста с помощью правил, каждый из которых обладает своими достоинствами и недостатками. В данной работе рассматривается проблема представления знаний и правил при интеллектуальном анализе текста. Необходимость комбинации методов мягких вычислений с обработкой правил предложено решить с помощью метаграфов в гибридной интеллектуальной системе. А для вычисления весовых коэффициентов в метаграфовой базе знаний предлагается использовать машинное обучение.
Цель. Разработать методику интеллектуального анализа текста для извлечения знаний и наполнения метаграфовой базы знаний.
Результаты. Описаны основные структуры данных и алгоритмы их обработки для предложенной методики интеллектуального анализа текста с помощью метаграфовой базы знаний. Приведены результаты исследования времени выполнения машинного обучения базы знаний, количества извлеченных понятий и отношений из текстов, полученные на наборе текстов Open Corpora.
Практическая значимость. Предложенная методика интеллектуального анализа используется в системе семантического поиска. Также данная методика может быть использована для других задач интеллектуального анализа текста: классификации текстов, машинного перевода и т.д.
Канев А.И. Обучение метаграфовой базы знаний на результатах интеллектуального анализа текста // Нейрокомпьютеры: разработка, применение. 2020. Т. 22. № 5. С. 5–13. DOI: 10.18127/j19998554-202005-01.
- Zhang Y., Chen M., Liu L. A review on text mining // 2015 6th IEEE International Conference on Software Engineering and Service Science. September 2015. P. 681–685. DOI: 10.1109/ICSESS.2015.7339149.
- Sukanya M., Biruntha S. Techniques on text mining // 2012 IEEE International Conference on Advanced Communication Control and Computing Technologies. August 2012. P. 269–271. DOI: 10.1109/ICACCCT.2012.6320784.
- Mousavi H., Kerr D., Iseli M., Zaniolo C. Mining semantic structures from syntactic structures in free text documents // Semantic Computing International Conference. June 2014. P. 84–91. DOI: 10.1109/ICSC.2014.31.
- Verma V., Ranjan M., Mishra P. Text mining and information professionals: Role, issues and challenges // 2015 4th International Symposium on Emerging Trends and Technologies in Libraries and Information Services. 2015. P. 133–137. DOI: 10.1109/ETTLIS.2015.7048186.
- Akilan A., Phil M. Text mining: Challenges and future directions // 2015 2nd International Conference on Electronics and Communication Systems. 2015. P. 1679–1684. DOI: 10.1109/ECS.2015.7124872.
- Wang K.Q., Wu Q.K., Mao H.Y., Zhou M.B., Jiang K., Zhu X.P., Yang L., Wang T., Wang H.Q. Intelligent text mining based financial risk early warning system // 2015 2nd International Conference on Information Science and Control Engineering. April 2015. P. 279–281. DOI: 10.1109/ICISCE.2015.68.
- Pinho I.C., Epstein D., Berni E., Corrêa R., Corrêa Y. The use of text mining to build a pedagogical agent capable of mediating synchronous online discussions in the context of foreign language learning // 2013 IEEE Frontiers in Education Conference. 2013. P. 393–399.
- Champion H., Pizzi N., Krishnamoorthy R. Tactical clinical text mining for improved patient characterization // 2014 IEEE International Congress on Big Data. 2014. P. 683–690.
- Черненький В.М., Гапанюк Ю.Е., Ревунков Г.И., Терехов В.И., Каганов Ю.Т. Метаграфовый подход для описания гибридных интеллектуальных информационных систем // Прикладная информатика. 2017. Т. 12. № 3 (69). С. 57–79.
- Ревунков Г.И., Гапанюк Ю.Е., Федоренко Ю.С. Описание нейронной сети с использованием метаграфового подхода // Естественные и технические науки. 2016. № 12. С. 278–281.
- Kanev A., Cunningham S., Terekhov V. Application of formal grammar in text mining and construction of an ontology // Proceedings of the 7th International Conference of Internet Technologies and Applications. September 2017. P. 53–57. DOI: 10.1109/ITECHA.2017.8101910.