Найти
Результаты поиска
-
МЕТОД ПОИСКА ПОСЛЕДОВАТЕЛЬНЫХ ПАТТЕРНОВ ПОВЕДЕНИЯ ПОЛЬЗОВАТЕЛЕЙ В ИНТЕРНЕТ-ПРОСТРАНСТВЕ
В.В. Курейчик, В.В. Бова, Ю.А. Кравченко2020-11-22Аннотация ▼Одной из важных задач интеллектуального анализа данных является выделение зако-
номерностей и обнаружение связанных событий в последовательных данных на основе
анализа последовательных паттернов. В статье исследуются возможность применения
последовательных паттернов для анализа событий поисково-познавательной деятельно-
сти пользователей при взаимодействии с Интернет-ресурсами открытой информационно-
образовательной среды. Поиск последовательных паттернов является сложной вычисли-
тельной задачей, цель которой состоит в извлечении всех частых последовательностей,
отражающих потенциальные связи внутри элементов из транзакционной базы данных
последовательностей событий поисковой активности при заданной минимальной под-
держке. Для ее решения в статье предлагается метод поиска закономерностей в последо-
вательностях событий для обнаружения скрытых закономерностей, указывающих с воз-
можные уровни уязвимости при выполнении задач информационного поиска в Интернет-
пространстве. Описана математическая модель поведения пользователей в поисковой
сессии, основанная на теории последовательных паттернов. Для повышения вычислитель-
ной эффективности метода разработан модифицированный алгоритм генерации последо-
вательных паттернов, на первом этапе которого выполняется AprioriAll, формирующий
частые последовательности-кандидаты всевозможных длин, а на втором - генетический
алгоритм оптимизации входных параметров признакового пространства сгенерированного
множества для поиска максимальных паттернов. Проведены серии вычислительных экс-
периментов на тестовых данных корпуса MSNBC, библиотеки интеллектуального анализа
данных с открытым исходным кодом SPMF. Сравнительной анализ проводился с алгорит-
мами VMSP и GSP. Результаты исследований подтвердили эффективность поиска макси-
мальных последовательных паттернов предложенным алгоритмом с точки зрения времени
выполнения и количества извлеченных паттернов. Результаты проведенных эксперимен-
тальных исследований метода показали, что для увеличения стабильности и точности
работы размер выборки, полученной в результате работы ГА, позволит сократить необ-
ходимое число сканирований базы данных паттернов, обеспечивая приемлемые вычисли-
тельные затраты, сопоставимые с алгоритмом VMSP и превосходящий по времени поиска
последовательных паттернов алгоритм GSP в среднем более чем на 150%. -
РАЗРАБОТКА АЛГОРИТМОВ ИНТЕЛЛЕКТУАЛЬНОГО СЕРВИСА ПОИСКА И МОНИТОРИНГА ИНФОРМАЦИИ
М. С. Анферова, А.М. Белевцев2021-08-11Аннотация ▼Описана проблема стратегического анализа и выбора направлений развития инноваци-
онного предприятия в условиях перехода к 6 технологическому укладу и индустрии 4.0. В дан-
ных условиях поисково-аналитическая обработка информации не может быть полноценно
выполнена без применения автоматизированных информационно-аналитических систем, в
том числе и на базе искусственного интеллекта. В ходе анализа были определены основные
приоритетные функции, которые должны обеспечивать разрабатываемые сервисы. Обо-
значены основные трудности при разработке данных сервисов, такие как: предварительная
обработка данных и автоматизированная проверка актуальности баз данных. Для эффек-
тивного решения поставленных задач сервис интеллектуального мониторинга и поиска ин-
формации должен использовать комплексный подход с учетом эффективности применения
методов для отдельных подзадач, обеспечивать высокую эффективность реализации всех
этапов процедуры интеллектуального мониторинга. В связи с этим в данной работе описы-
вается не только разработка общего интеллектуального поискового алгоритма, но и от-
дельные блок-алгоритмы, необходимые для обеспечения приоритетных функций разрабаты-
ваемого сервиса. В работе представлены следующие алгоритмы: алгоритм информационного
поиска, необходимый для решения задачи полнотекстового поиска документов в пределах
базы информационных ресурсов информационно-аналитического комплекса; алгоритм про-
цедуры внесения новых документов; алгоритм предварительной обработки данных, выклю-
чающий в себя стемминг и удаление знаков препинания для последующего анализа текста;
алгоритм оценки ранжирования и релевантности информации, включающий в себя вектори-
зацию документов; алгоритм кластеризации результатов поиска информации на основе ней-
ронной сети Кохонена; алгоритм проверки актуальности информации -проверка соответст-
вия локальной копии документа актуальной версии на веб-ресурсе источника. Предложен и
обоснован язык программирования Python для реализации представленного алгоритма. Сис-
тема обеспечивает автоматизированный непрерывный мониторинг с высокой периодично-
стью отправки запроса без участия оператора, что повысит качество и эффективность
информационного поиска в условиях большого объёма неструктурированной информации -
АНАЛИЗ ТРЕБОВАНИЙ И РАЗРАБОТКА АЛГОРИТМОВ ИНТЕЛЛЕКТУАЛЬНЫХ СЕРВИСОВ МОНИТОРИНГА
М.С. Анферова , А.М. Белевцев2022-08-09Аннотация ▼Рассмотрены проблемы стратегического анализа и выбора направлений развития инно-
вационных предприятий в условиях перехода к 6 технологическому укладу и индустрии 4.0. Оп-
ределены основные уровни анализа. Обозначены цели стратегического анализа исходя из мас-
штаба проводимого исследования. Выделены задачи анализа, решение которых позволит дос-
тичь поставленных целей. Показана сложность решения задач глобального мониторинга, ко-
торые обусловлены большим объемом разнородной и неструктурированной информации.
В этих условиях тематический поиск и аналитическая обработка информации не могут быть
выполнены без применения автоматизированных информационно-аналитических систем и соз-
дания поисковых сервисов на базе искусственного интеллекта. Предложена общая процедура
мониторинга. Определены основные этапы мониторинга технологических трендов, показаны
задачи, решаемые в рамках конкретного этапа и планируемый результат. На основе общей
процедуры мониторинга определены основные приоритетные функции, которыми должны
обладать разрабатываемые сервисы. А также проблемы их разработки и структуризация
полученной информации в виде информационных объектов и кластеризация документов. В от-
личие от известных систем глобального мониторинга, в которых поиск основан на индикато-
рах: рост использования ключевых слов, увеличение численности новых авторов, цитирование
работ из смежных областей. Предложены алгоритмы, обеспечивающие определение опорных
тем, оценку ранжирования и релевантности информации. Дано описание работы алгоритмов
на примере создания сводной информационной таблицы, с помощью которой происходит фор-
мирование взаимосвязей документов научно-технологического развития по заданному направ-
лению мониторинга и поиск конкретных документов в базе данных. Построение поисковых
сервисов на основе представленных алгоритмов обеспечит выделение опорных тем докумен-
тов, предоставит более достоверные результаты кластеризации неструктурированной ин-
формации и формирования научно-технологических трендов, в информационно-аналитических
комплексах. Для реализации алгоритма предлагается использовать язык программирования
Python. Внедрение данных алгоритмов повысит качество и эффективность информационного
поиска в условиях большого объёма неструктурированной информации. -
ЭВОЛЮЦИОННЫЙ ПОПУЛЯЦИОННЫЙ МЕТОД РЕШЕНИЯ ТРАНСПОРТНОЙ ЗАДАЧИ
Б.К. Лебедев , О.Б. Лебедев , Е.О. Лебедева2022-11-01Аннотация ▼Рассматривается эволюционный популяционный метод решения транспортной за-
дачи на основе метаэвристики кристаллизации россыпи альтернатив. Исследуется за-
крытая (или сбалансированная) модель транспортной задачи: сумма груза у поставщиков
равно общей сумме потребностей в пунктах назначения. Цель оптимизации – минимизация
стоимости (достижение минимума затрат на перевозку) или расстояний и критерий вре-
мени (затрачивается минимум времени на перевозку). В основу метаэвристики кристалли-
зации россыпи альтернатив положена стратегия, основанная на запоминании и повторе-
нии прошлых успехов. Стратегия делает упор на «коллективную память», под которой
подразумевается любой вид информации, которая отражает прошлую историю развития
и хранится независимо от индивидуумов. В качестве кода решения транспортной задачи
рассматривается упорядоченная последовательность Dk маршрутов. Объектами являют-
ся маршруты, альтернативами – множество позиций P в списке, где np – число позиций в
списке Dк. Множество объектов Dк соответствует множеству всех маршрутов. Множе-
ство альтернативных состояний P объекта соответствует множеству альтернативных
вариантов размещения объекта списке Dк. Работа популяционного эволюционного алго-
ритма кристаллизации россыпи альтернатив опирается на коллективную эволюционную
память, называемую россыпью альтернатив. Под россыпью альтернатив решения в рабо-
те называется структура данных, используемая в качестве коллективной эволюционной
памяти, несущая информацию о решении, включающую сведения о реализованных альтер-
нативах агентов в данном решении и о полезности решения. Разработан конструктивный
алгоритм формирования опорного плана путем декодирования списка Dк. На каждом шаге
t решается задача выбора очередного в последовательности Dк маршрута и определения
количества груза, перевозимого из пункта отправления Ai в пункт назначения Bj по этому
маршруту. Разработанный алгоритм является популяционным, реализующим стратегию
случайного направленного поиска. Каждый агент является кодом некоторого решения
транспортной задачи. На первом этапе каждой итерации l конструктивным алгоритмом
на базе интегральной россыпи альтернатив формируется nk кодов решений
Dk.Формирование каждого кода решения Dk выполняется последовательно по шагам путем
последовательного выбора объекта и позиции. Для построенного кода решения Dk рассчи-
тывается оценка решения ξk и оценка полезности δk. Формируется индивидуальная рос-
сыпь альтернатив Rk и переход к построению следующего кода решения.
На втором этапе итерации производится суммирования интегральной россыпи альтерна-
тив, сформированной на предыдущих итерациях от l до (l-1), cо всеми индивидуальными
россыпями альтернатив, сформированных на итерации l. На третьем этапе итерации l
производится снижение всех интегральных оценок полезности r*αβ интегральной россыпи
альтернатив R*(l) на величину δ*. Алгоритм решения транспортной задачи был реализован
на языке С++ в среде Windows. Сравнение значений критерия, на тестовых примерах, сизвестным оптимумом показало, что у 90% примеров полученное решение было оптималь-
ным, у 2% примеров решения были на 5% хуже, а у 8% примеров решения отличались ме-
нее, чем на 2%. Временная сложность алгоритма, полученная экспериментальным путем,
лежит в пределах О(n2).








