Перейти к основному контенту Перейти к главному меню навигации Перейти к нижнему колонтитулу сайта
##common.pageHeaderLogo.altText##
Известия ЮФУ
Технические науки
  • Текущий выпуск
  • Предыдущие выпуски
    • Архив
    • Выпуски 1995 – 2019
  • Редакционный совет
  • О журнале
    • Официально
    • Основные задачи
    • Основные рубрики
    • Специальности ВАК РФ
    • Главный редактор
English
ISSN 1999-9429 print
ISSN 2311-3103 online
  • Вход
  1. Главная /
  2. Найти

Найти

Расширенные фильтры
Опубликовано после
Опубликовано до

Результаты поиска

Найден один результат.
  • ОСНОВНЫЕ ПОДХОДЫ К ИЗВЛЕЧЕНИЮ ТЕКСТОВОЙ ИНФОРМАЦИИ (ОБЗОР)

    В.В. Курейчик , П. С. Герасименко
    2024-10-08
    Аннотация ▼

    Данная статья посвящена обзору известных и современных подходов, методов и алгорит-
    мов полнотекстового поиска. Описана краткая история решения задачи поиска в неструктуриро-
    ванных текстовых данных, её развитие и актуальность. Сформулирована основная задача поиска
    в текстовых данных. Приведено определение индекса базы данных. В общем виде определена целе-
    вая функция поисковой информационной системы и описаны возможные компромиссные вариации
    её параметров при решения различных прикладных задач. Приведена обобщённая архитектура
    современной поисковой информационной системы с разделением задачи поиска на две фазы: пер-
    вичное извлечение релевантных записей и их последующее ранжирование для формирования окон-
    чательных результатов поиска. Даны базовые описания основных алгоритмов и методов полно-
    текстового поиска, таких как: поиск по термам (логический поиск), поиск с помощью деревьев и
    их разновидностей (B-деревья, UB-деревья, tries), поиск на основе n-грамм (в том числе поиск на
    основе частотного представления), использование векторной модели пространства (VSM), поиск
    на основе инвертированного (обратного) индекса, поиск с использованием аппарата нечёткой
    логики и биоинспирированных методов. Приведены основные достоинства и недостатки этих
    методов, описана их применимость в различных условиях, а также рассмотрены возможные ме-
    тоды оптимизации поиска текстовых данных для улучшения точности, скорости поиска и эф-
    фективности использования ресурсов. Представлены возможные перспективные направления в
    области решения задачи первичного извлечения информации. Приведены некоторые способы опре-
    деления сходства текстовых записей для решения задачи ранжирования на основе аппарата не-
    чёткой логики. Затронуты вопросы повышения релевантности первичного извлечения с помощью
    методов искусственного интеллекта, нейронных сетей, аппарата нечёткой логики и биоинспири-
    рованных методов, в частности методы расширения поискового запроса и/или расширения обра-
    батываемых текстовых записей. Описано влияние граничных условий построения поисковой сис-
    темы на повышение её эффективности. В заключение статьи подводятся итоги обзора и обсуж-
    даются перспективы дальнейшего развития различных методов полнотекстового поиска.

1 - 1 из 1 результатов

links

Для авторов
  • Подать статью
  • Требования к рукописи
  • Редакционная политика
  • Рецензирование
  • Этика научных публикаций
  • Политика открытого доступа
  • Сопроводительные документы
Язык
  • English
  • Русский

journal

* не является рекламой

index

Индексация журнала
* не является рекламой
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Адрес редакции: 347900, г. Таганрог, ул. Чехова, д. 22, А-211 Телефон: +7 (8634) 37-19-80 Электронная почта: iborodyanskiy@sfedu.ru
Публикация в журнале бесплатна
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.
logo Сайт разработан командой ЦИИР