Статья

Название статьи ОБРАБОТКА ТЕКСТА В ПОИСКОВЫХ СИСТЕМАХ
Автор И.С. Злыгостев
Рубрика .
Месяц, год 02, 2008
Индекс УДК 681.3.07
DOI
Аннотация В статье освещена проблема предварительной обработки текстов на естественном языке поисковыми системами с целью осуществления по ним быстрого поиска. Приведены существующие подходы, используемые при индексировании текстов, основные структуры, используемые в инвертированных индексах коллекции документов.

Скачать в PDF

Ключевые слова Поисковые системы, поисковый образ документа, инвертированный индекс коллекции документов, структура индекса, нормализация термов документа, стоп-слова, закон Зипфа, интервал значимых слов.
Библиографический список

Comments are closed.