Статья

Название статьи МЕТОДЫ АНАЛИЗА ГИПЕРССЫЛОК ПРИ ИНФОРМАЦИОННОМ ПОИСКЕ В ГЛОБАЛЬНОЙ СЕТИ
Автор Э.М. Котов
Рубрика РАЗДЕЛ VII. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ
Месяц, год 04, 2012
Индекс УДК 519.14
DOI
Аннотация Проведены исследования методов анализа гиперссылок, выделены два основных класса ранжирования на основе связей: методы глобального анализа – ранжирование, независящие от запроса, и методы локального анализа – ранжирование, зависящие от запроса. Дано описание и характеристика алгоритма PageRank в основу которого заложена модель случайного блуждания по веб-графу, которая используется для вычисления веса страницы (коэффициент PageRank) как вероятности ее достижимости и алгоритма HITS-поиска документов по заданной теме на базе гиперссылок, в основе которого лежит идентификация двух наборов страниц, которые могут быть важными: страницы-«авторитеты» и страницы-«концентраторы». Выявлены различия данных двух подходов к анализу гиперссылок.

Скачать в PDF

Ключевые слова Информационный поиск; ранжирование результатов поиска; анализ гиперссылок.
Библиографический список 1. Manning C.D., Raghavan P., Schьtze H. Introduction to information retrieval // Cambridge University Press. – 2008. – 544 p.
2. Brin S., Page L. The Anatomy of a Large-Scale Hypertextual Web Search Engine, Proc. Seventh World Wide Web Conf., Elsevier Science. – New York, 1998.
3. Page L. et al. The PageRank Citation Ranking: Bringing Order to the Web, Stanford Digital Library Technologies, Working Paper 1999-0120, Stanford Univ., Palo Alto, Calif., 1998.
4. Kleinberg J.M. Authoritative Sources in a Hyperlinked Environment. Journal of the ACM 46, 5, 1999. – P. 604-632.
5. Bhart K., Henzinger M. Improved Algorithms for Topic Distillation in a Hyperlinked Environment. In Proceedings of ACM SIGIR’98 (Melbourne, Australia), 1998.

Comments are closed.