350 руб
Журнал «Динамика сложных систем - XXI век» №3 за 2020 г.
Статья в номере:
Метаграфовый подход для интеллектуального анализа текста, как перспективное направление семантического поиска
DOI: 10.18127/j19997493-202003-04
УДК: 004.912
Авторы:

А.И. Канев − аспирант,

МГТУ им. Н.Э. Баумана (Москва, Россия)

SPIN-код: не представлен

E-mail: kanevai@student.bmstu.ru

Аннотация:

Постановка проблемы. При использовании традиционного информационного поиска пользователь сталкивается с необходимостью повторных запросов и анализа промежуточных данных, если не может точно сформулировать первоначальный запрос. Поэтому в последнее время активно развиваются способы повышения возможностей информационного поиска: карточки запросов, визуальное представление тематики документов, применение нейронных сетей. Еще одним направлением является семантический поиск. Предлагается использовать интеллектуальный анализ текста для более точной интерпретации запросов пользователя и повышения качества поиска. Метаграфовый подход позволяет сочетать методы мягких вычислений и обработки знаний, поэтому он выбран для реализации представления знаний, полученных в процессе интеллектуального анализа текста.

Цель. Описать требования для системы семантического поиска с использованием интеллектуального анализа текста и метаграфовой базы знаний.

Результаты. Приведены формулы для ранжирования результатов запросов с помощью знаний, полученных при анализе запроса и текстовых документов. Они требуются для объединения результатов семантического индекса для различных понятий и отношений из базы знаний.

Практическая значимость. Предложенная методика информационного поиска может быть использована для повышения точности и полноты поисковых систем в первую очередь на небольших объемах данных, которых недостаточно для существующих способов. Свойство эмерджентности метаграфа позволяет хранить и обрабатывать данные из небольшого количества информации, постепенно детализируя их. Использование единой базы знаний для всех языков дает возможность индексировать документы и обрабатывать запросы одновременно на разных языках.

Страницы: 44-56
Список источников
  1. Ryen W. White and Resa A. Roth. Exploratory Search: Beyond the Query-Response Paradigm, Synthesis Lectures on Information Concepts, Retrieval, and Services // Morgan and Claypool Publishers. 2009. V. 1. 98 p.
  2. Manicheva E., Petrova M., Kozlova E., Popova T. Compreno Semantic Model as an Integral Framework for a Multilingual Lexical Database // 24th International Conference on Computational Linguistics, Proceedings of the 3rd Workshop on Cognitive Aspects of the Lexicon (CogALex-III). 2012. P. 215−230.
  3. Keith van Rijsbergen. Information retrieval. Second edition. London: Butterworths. 1979. URL: http://www.dcs.gla.ac.uk/Keith/Preface.html.
  4. Mooers C. Information retrieval viewed as temporal signaling // Proceedings of the International Congress of Mathematicians. 1950. V. 1. P. 572–573.
  5. Guha R., McCoolR., Miller E. Semantic Search // WWW '03: Proceedings of the 12th international conference on World Wide Web. 2003.
  6. Zhang Y., Chen M., Liu L. Review on Text Mining // 2015 6th IEEE International Conference on Software Engineering and Service Science (ICSESS). 2015.
  7. Sukanya M., Biruntha S. Techniques on Text Mining // 2012 IEEE International Conference on Advanced Communication Control and Computing Technologies (ICACCCT). 2012.
  8. Sanchez D., Martın-Bautista M.J., Blanco I. Text Knowledge Mining: An Alternative to Text Data Mining // 2008 IEEE International Conference on Data Mining Workshops. 2008.
  9. Yin S., Qiu Y., Ge J .Research and Realization of Text Mining Algorithm on Web // 2007 International Conference on Computational Intelligence and Security Workshops (CISW 2007). 2008.
  10. Witten I.H., Frank E., Hall M. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann. 2016.  P. 654.
  11. Amarasiri R., Ceddia J., Alahakoon D. Exploratory Data Mining Lead by Text Mining Using a Novel High Dimensional Clustering Algorithm // Fourth International Conference on Machine Learning and Applications (ICMLA'05). 2005.
  12. Verma V.K. Text Mining and Information Professionals // 2015 4th International Symposium on Emerging Trends and Technologies in Libraries and Information Services. 2015.
  13. Qi Y. Text Mining for Bioinformatics: State of the Art Review // 2009 2nd IEEE International Conference on Computer Science and Information Technology. 2009.
  14. Pizzi N., Krishnamoorthy R. Clinical Text Mining for Improved Patient Characterization // 2014 IEEE International Congress on Big Data. 2014.
  15. Gong T., Tan C.L., Leong T.Y. Text Mining in Radiology Reports // 2008 Eighth IEEE International Conference on Data Mining. 2008.
  16. Hu Z.Z., Cohen K.B., Hirschman L., Valencia A., Liu H., Giglio M.G., Wu C.H. iProLINK: A Framework for Linking Text Mining with Ontology and Systems Biology // 2008 IEEE International Conference on Bioinformatics and Biomedicine. 2008.
  17. Pinho I.C., Epstein D., Berni E., Corrêa R.,Corrêa Y. The Use of Text Mining to Build a Pedagogical Agent Capable of Mediating Synchronous Online Discussions in the Context of Foreign Language Learning // 2013 IEEE Frontiers in Education Conference (FIE). 2013.
  18. Wang K.Q., Wu Q.K., Mao H.Y., Zhou M.B., Jiang K., Zhu X.P., Yang L., Wang T., Wang H.Q. Intelligent Text Mining Based Financial Risk Early Warning System // 2015 2nd International Conference on Information Science and Control Engineering. 2015.
  19. Huosong X., Zhaoyan F., Liuyan P. Chinese Web Text Outlier Mining Based on Domain Knowledge // 2010 Second WRI Global Congress on Intelligent Systems. 2010.
  20. Mikolov T., Le Q.V., Sutskever I. Exploiting Similarities among Languages for Machine Translation. 2013. URL: https://arxiv.org/pdf/1309.4168.pdf.
  21. Анисимович К.В., Дружкин К.Ю., Зуев К.А., Минлос Ф.Р., Петрова М.А., Селегей В.П. Синтаксический и семантический партер, основанный на лингвистических технологиях ABBYY Compreno // XVIII Международная конференция «Диалог 2012». 2012. С. 91−103.
  22. Sutskever I., Vinyals O., Le Q.V. Sequence to Sequence Learning with Neural Networks // Advances in neural information processing systems. 2014.
  23. Cho K., van Merrienboer B.,Gulcehre C., Bahdanau D., Bougares F., Schwenk H., Bengio Y. Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). 2014. P. 1724−1734.
  24. Radford A., Narasimhan K., Salimans T., Sutskever I. Improving Language Understanding by Generative Pre-Training. 2018. URL: https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf.
  25. Sussna M. Word sense disambiguation for free-text indexing Using a Massive Semantic Network // Proceedings of the second international conference on Information and knowledge management. 1993. P. 67−74.
  26. Shapiro S. Encyclopedia of Artificial Intelligence. Second edition. Wiley. 1992.
  27. Черненький В.М., Гапанюк Ю.Е., Ревунков Г.И., Терехов В.И., Каганов Ю.Т. Метаграфовый подход для описания Гибридных Интеллектуальных Информационных Систем // Прикладная информатика. 2017. Т. 12. № 3(69). С. 57−79.
  28. Nakagochi R., Kawamoto K., Sunayama W. Acquissition of Text-Mining Skills for Beginners Using TETDM // 13th International Conference on Data Mining Workshops. 2013.
  29. Otsuka N., Matsushita M. Constructing Knowledge Using Exploratory Text Mining // Joint 7th International Conference on Soft Computing and Intelligent Systems (SCIS) and 15th International Symposium on Advanced Intelligent Systems (ISIS). 2014.
  30. Sunayama W. Knowledge Emergence using Total Environment for Text Data Mining //Joint 7th International Conference on Soft Computing and Intelligent Systems (SCIS) and 15th International Symposium on Advanced Intelligent Systems (ISIS). 2014.
  31. Ревунков Г.И., Гапанюк Ю.Е., Федоренко Ю.С. Описание нейронной сети с использованием метаграфового подхода // Естественные и технические науки. 2016. № 12. С. 278−281. 
Дата поступления: 28.07.2020