350 rub
Journal Information-measuring and Control Systems №10 for 2008 г.
Article in number:
Authors:
Кокорин П. П.
Abstract:
Показан семиологический подход для понятийной кластеризации для каталогизации текстов. Семиология в отличие от лингвистики при анализе семантики не опирается на грамматику и прагматику, в большей степени оперируя связями между понятиями. Показаны основные проблемы создания систем понятийной кластеризации текстов. В качестве решения предложен метод выделения терминологии предметной области из текста и подход в построении глоссария. Для решения задачи классификации предложен улучшенный метод LSA/LSI. Дана сравнительная оценка эффективности предложенного подхода.