350 rub
Journal Science Intensive Technologies №9 for 2012 г.
Article in number:
Method of thematic clustering of text documents in the base of there infological processing
Authors:
S.N. Mikhailov
Abstract:
Proposed method of thematic clustering of text documents based on infological processing of anthology of cluster and new document with purpose to determine correspondence of the terms and calculation of correspondence coefficient. Determination of correspondence of the terms and there promptness requires structural decomposition of text, considering the operations of normalization and identification of the hierarchy of his concepts, comparison of hierarchy of concepts of text with hierarchy of concepts of anthology of cluster and calculation of correspondence coefficient. The decision on the compliance of semantic content of new document and clusters made by evaluating of quantitative values of that coefficient. In turn threshold level of correspondence coefficient determined by experimental paths for different types of text documents.
Pages: 48-51
References
  1. Александров В.В., Андреева Н.А., Кулешов С.В. Методы построения информационно-логистических систем. СПб.: Изд-во Политех. ун-та. 2006.
  2. Кириченко К.М., Герасимов М.Б. Обзор методов кластеризации текстовой информации // Материалы междунар. конф. «Диалог - 2001». М.: Изд-во РГГУ. 2001.
  3. Карпов Ю.М., Батурин А.В. Метод структурных исследований проблемных областей науки средствами кластерного анализа сетей библиографических данных // Проблемы информационных систем (МЦТНИ). 1993. № 3.
  4. Михайлов С.Н., Севрюков А.Е. Обобщенная архитектура инфокоммуникационной среды информационно-аналитического обеспечения научных исследований вуза // Информационно-измерительные и управляющие системы. 2010. № 11. Т. 8. С. 40-42.