350 rub
Journal Science Intensive Technologies №12 for 2009 г.
Article in number:
THE CONCEPTUAL STRUCTURE OF THE UNIFIED APPROACH TO THE AUTOMATED PROCESSING OF MULTILANGUAGE TEXTS
Authors:
A. Yu. Novikov, M. G. Stolyarov
Abstract:
Issues of initial and detailed semantic analysis of multilanguage texts, based on the Link Grammar formalism in the first case and Discourse analysis of the unified text in the second case for the purpose to get common superstructure of the text, formed as graph of concept referencing are presented in this article. In the first part of article the technique of training (customization) of probability model of semantics of the sentence by creation of the semantic dictionary in which probabilities of correspondence of combinations of syntactic links are specified to semantic relations is considered. The second part of article is devoted the description of the concept of further (detailed) processing of all text as a whole, based on the following sequence of steps: selection and formalizing clauses in the uniform graph within the limits of paragraphs, association clauses of the paragraphs in the common graph of superstructure (all text as a whole).
Pages: 50-56
References
  1. Сокирко А. В. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ) // Диссертация ... канд. техн. наук. М. 2001.
  2. Богунов И. Н., Столяров М. Г., Новиков А. Ю. Аспекты использования логико-лингвистического подхода для создания системы формализации текстовых документов // статья на депонирование в центральном справочно-информационном фонде МО РФ 20.07.2006 г.
  3. Ермаков А. Е. Автоматическое извлечение фактов из текстов досье: опыт установления анафорических связей // Компьютерная лингвистика и интеллектуальные технологии: тр. Международной конференции Диалог-2007. М.: Наука. 2007.
  4. Нечипоренко А. В. Система автоматизированного извлечения знаний из текстов на естественном языке // Тр. Междунар. научн.-техн. конфер. «Информационные системы и технологии - 2003»: Доклад от компании НооЛаб. Новосибирск: НГТУ. 2003.
  5. Lafferty, J., Sleator, D., and Temperley, D., Grammatical Trigrams: A Probabilistic Model of Link Grammar // Proceedings of the AAAI Conference on Probabilistic Approaches to Natural Language, 1992.
  6. Протасов С. В. Обучение с нуля грамматики связей русского языка //Десятая национальная конференция по искусственному интеллекту с международным участием КИИ-2006.
  7. Протасов С. В. Вывод и оценка параметров дальнодействующей триграммной модели языка // Мат. конфер. «Диалог-2008».
  8. Ван Дейк Т. А. Язык, познание, коммуникация. М., 1989.
  9. Новиков А. Ю. Семантика и возможность ее формализации в технических системах // Наукоёмкие технологии. 2009. Т.10. №1.