А.И. Канев − аспирант,
МГТУ им. Н.Э. Баумана (Москва, Россия)
SPIN-код: не представлен
E-mail: kanevai@student.bmstu.ru
Постановка проблемы. При использовании традиционного информационного поиска пользователь сталкивается с необходимостью повторных запросов и анализа промежуточных данных, если не может точно сформулировать первоначальный запрос. Поэтому в последнее время активно развиваются способы повышения возможностей информационного поиска: карточки запросов, визуальное представление тематики документов, применение нейронных сетей. Еще одним направлением является семантический поиск. Предлагается использовать интеллектуальный анализ текста для более точной интерпретации запросов пользователя и повышения качества поиска. Метаграфовый подход позволяет сочетать методы мягких вычислений и обработки знаний, поэтому он выбран для реализации представления знаний, полученных в процессе интеллектуального анализа текста.
Цель. Описать требования для системы семантического поиска с использованием интеллектуального анализа текста и метаграфовой базы знаний.
Результаты. Приведены формулы для ранжирования результатов запросов с помощью знаний, полученных при анализе запроса и текстовых документов. Они требуются для объединения результатов семантического индекса для различных понятий и отношений из базы знаний.
Практическая значимость. Предложенная методика информационного поиска может быть использована для повышения точности и полноты поисковых систем в первую очередь на небольших объемах данных, которых недостаточно для существующих способов. Свойство эмерджентности метаграфа позволяет хранить и обрабатывать данные из небольшого количества информации, постепенно детализируя их. Использование единой базы знаний для всех языков дает возможность индексировать документы и обрабатывать запросы одновременно на разных языках.
- Ryen W. White and Resa A. Roth. Exploratory Search: Beyond the Query-Response Paradigm, Synthesis Lectures on Information Concepts, Retrieval, and Services // Morgan and Claypool Publishers. 2009. V. 1. 98 p.
- Manicheva E., Petrova M., Kozlova E., Popova T. Compreno Semantic Model as an Integral Framework for a Multilingual Lexical Database // 24th International Conference on Computational Linguistics, Proceedings of the 3rd Workshop on Cognitive Aspects of the Lexicon (CogALex-III). 2012. P. 215−230.
- Keith van Rijsbergen. Information retrieval. Second edition. London: Butterworths. 1979. URL: http://www.dcs.gla.ac.uk/Keith/Preface.html.
- Mooers C. Information retrieval viewed as temporal signaling // Proceedings of the International Congress of Mathematicians. 1950. V. 1. P. 572–573.
- Guha R., McCoolR., Miller E. Semantic Search // WWW '03: Proceedings of the 12th international conference on World Wide Web. 2003.
- Zhang Y., Chen M., Liu L. Review on Text Mining // 2015 6th IEEE International Conference on Software Engineering and Service Science (ICSESS). 2015.
- Sukanya M., Biruntha S. Techniques on Text Mining // 2012 IEEE International Conference on Advanced Communication Control and Computing Technologies (ICACCCT). 2012.
- Sanchez D., Martın-Bautista M.J., Blanco I. Text Knowledge Mining: An Alternative to Text Data Mining // 2008 IEEE International Conference on Data Mining Workshops. 2008.
- Yin S., Qiu Y., Ge J .Research and Realization of Text Mining Algorithm on Web // 2007 International Conference on Computational Intelligence and Security Workshops (CISW 2007). 2008.
- Witten I.H., Frank E., Hall M. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann. 2016. P. 654.
- Amarasiri R., Ceddia J., Alahakoon D. Exploratory Data Mining Lead by Text Mining Using a Novel High Dimensional Clustering Algorithm // Fourth International Conference on Machine Learning and Applications (ICMLA'05). 2005.
- Verma V.K. Text Mining and Information Professionals // 2015 4th International Symposium on Emerging Trends and Technologies in Libraries and Information Services. 2015.
- Qi Y. Text Mining for Bioinformatics: State of the Art Review // 2009 2nd IEEE International Conference on Computer Science and Information Technology. 2009.
- Pizzi N., Krishnamoorthy R. Clinical Text Mining for Improved Patient Characterization // 2014 IEEE International Congress on Big Data. 2014.
- Gong T., Tan C.L., Leong T.Y. Text Mining in Radiology Reports // 2008 Eighth IEEE International Conference on Data Mining. 2008.
- Hu Z.Z., Cohen K.B., Hirschman L., Valencia A., Liu H., Giglio M.G., Wu C.H. iProLINK: A Framework for Linking Text Mining with Ontology and Systems Biology // 2008 IEEE International Conference on Bioinformatics and Biomedicine. 2008.
- Pinho I.C., Epstein D., Berni E., Corrêa R.,Corrêa Y. The Use of Text Mining to Build a Pedagogical Agent Capable of Mediating Synchronous Online Discussions in the Context of Foreign Language Learning // 2013 IEEE Frontiers in Education Conference (FIE). 2013.
- Wang K.Q., Wu Q.K., Mao H.Y., Zhou M.B., Jiang K., Zhu X.P., Yang L., Wang T., Wang H.Q. Intelligent Text Mining Based Financial Risk Early Warning System // 2015 2nd International Conference on Information Science and Control Engineering. 2015.
- Huosong X., Zhaoyan F., Liuyan P. Chinese Web Text Outlier Mining Based on Domain Knowledge // 2010 Second WRI Global Congress on Intelligent Systems. 2010.
- Mikolov T., Le Q.V., Sutskever I. Exploiting Similarities among Languages for Machine Translation. 2013. URL: https://arxiv.org/pdf/1309.4168.pdf.
- Анисимович К.В., Дружкин К.Ю., Зуев К.А., Минлос Ф.Р., Петрова М.А., Селегей В.П. Синтаксический и семантический партер, основанный на лингвистических технологиях ABBYY Compreno // XVIII Международная конференция «Диалог 2012». 2012. С. 91−103.
- Sutskever I., Vinyals O., Le Q.V. Sequence to Sequence Learning with Neural Networks // Advances in neural information processing systems. 2014.
- Cho K., van Merrienboer B.,Gulcehre C., Bahdanau D., Bougares F., Schwenk H., Bengio Y. Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). 2014. P. 1724−1734.
- Radford A., Narasimhan K., Salimans T., Sutskever I. Improving Language Understanding by Generative Pre-Training. 2018. URL: https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf.
- Sussna M. Word sense disambiguation for free-text indexing Using a Massive Semantic Network // Proceedings of the second international conference on Information and knowledge management. 1993. P. 67−74.
- Shapiro S. Encyclopedia of Artificial Intelligence. Second edition. Wiley. 1992.
- Черненький В.М., Гапанюк Ю.Е., Ревунков Г.И., Терехов В.И., Каганов Ю.Т. Метаграфовый подход для описания Гибридных Интеллектуальных Информационных Систем // Прикладная информатика. 2017. Т. 12. № 3(69). С. 57−79.
- Nakagochi R., Kawamoto K., Sunayama W. Acquissition of Text-Mining Skills for Beginners Using TETDM // 13th International Conference on Data Mining Workshops. 2013.
- Otsuka N., Matsushita M. Constructing Knowledge Using Exploratory Text Mining // Joint 7th International Conference on Soft Computing and Intelligent Systems (SCIS) and 15th International Symposium on Advanced Intelligent Systems (ISIS). 2014.
- Sunayama W. Knowledge Emergence using Total Environment for Text Data Mining //Joint 7th International Conference on Soft Computing and Intelligent Systems (SCIS) and 15th International Symposium on Advanced Intelligent Systems (ISIS). 2014.
- Ревунков Г.И., Гапанюк Ю.Е., Федоренко Ю.С. Описание нейронной сети с использованием метаграфового подхода // Естественные и технические науки. 2016. № 12. С. 278−281.