Радиотехника
Издательство РАДИОТЕХНИКА

"Издательство Радиотехника":
научно-техническая литература.
Книги, журналы издательств ИПРЖР, РС-ПРЕСС, САЙНС-ПРЕСС


Тел.: +7 (495) 625-9241

::Журналы
::Книги
 

Эффективная обработка фразовых запросов с помощью комбинированных индексов

Ключевые слова:

И.А. Баранкова – программист, ООО «ИЦ Ай-Теко» (Москва)
E-mail: iree-mars@yandex.ru
М.В. Виноградова – к.т.н., доцент, кафедра «Системы обработки информации и управления», МГТУ им. Н.Э. Баумана
E-mail: vinogradova.m@bmstu.ru
М.В. Черненький – доцент, кафедра «Системы обработки информации и управления», МГТУ им. Н.Э. Баумана
E-mail: chernen@bmstu.ru


Рассмотрен способ эффективной поддержки поиска фразовых запросов в структуре индекса с минимальными дополнительными затратами памяти. Для этой цели использован комбинированный индекс: часть фразовых запросов обрабатывается с помощью стандартного инвертированного индекса, наиболее часто встречающиеся фразы – с помощью фразового индекса, наиболее часто встречающиеся слова – с помощью индекса следующих слов. Показано, что при использовании комбинированной схемы время обработки фразовых запросов значительно сокращается.

Список литературы:
  1. Хохлова М.В. Экспериментальная проверка методов выделения коллокаций. Slavica Helsingiensia 34. Инструментарий русистики: корпусные подходы. Хельсинки. 2008. С. 343−357.
  2. Paynter G.W., Witten I.H., Cunningham S.J., Buchanan G. Scalable browsing for large collections: A case study // Proc. ACM Digital Libraries. ACM Press. New York. San Antonio. California. 2000. P. 215−223.
  3. Bahle D. Efficient phrase querying. Ph.D. thesis. School of Computer Science and Information Technology. RMIT. 2003.
  4. Saraiva P.C., Moura E.S., Ziviani N., Fonseca R., Meira W., Murta C., Ribeiro-Neto B. Rank-preserving two-level caching for scalable search engines // Proc. ACM-SIGIR Int. Conf. on Research and Development in Information Retrieval. Eds: Croft W.B., Harper D.J., Kraft D.H., Zobel J. ACM Press. New Orleans, Louisiana. 2001. P. 51−58.
  5. Heinz S., Zobel J. Practical data structures for managing small sets of strings // Proc. Australasian computer science conf., Melbourne, Australia. 2002. P. 75−84.
  6. Scholer F., Williams H.E., Yiannis J., Zobel J. Compression of inverted indexes for fast query evaluation // Proc. ACM-SIGIR Int. conf. on research and development in information retrieval. Tampere (Finland). August 2002. P. 222−229
  7. Büttcher S.Cormack, Charles L.A. Clarke, Gordon V. Information Retrieval: Implementing and Evaluating Search Engines. MIT Press. 2010. 606 c.
  8. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск: Пер. с англ. М.: Вильямс. 2011. 528 с.
  9. Леонтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы. М.: Академия. 2006. 304 с.
  10. Ландэ Д.В., Снарский А.А., Безсуднов И.В. Интернетика. Навигация в сложных сетях. Модели и алгоритмы. М.: Либроком. 2009. 264 с.
  11. Трифанов А.А. Алгоритмы построения инвертированного индекса для коллекции текстовых данных // Известия ВУЗОВ. Поволжский район. Технические науки. 2013. № 3(27). С. 52−61.

© Издательство «РАДИОТЕХНИКА», 2004-2017            Тел.: (495) 625-9241                   Designed by [SWAP]Studio