Найти
Результаты поиска
-
ИНТЕЛЛЕКТУАЛЬНЫЕ МЕТОДЫ ПАРАМЕТРИЧЕСКОГО ПРОГНОЗИРОВАНИЯ И ОПТИМИЗАЦИИ ТРАЕКТОРИИ ДВИЖЕНИЯ БАС
В.И. Данильченко , В.В. Бова263-2762025-12-30Аннотация ▼Рассматривается задача интеллектуального параметрического прогнозирования и оптимизации траектории движения беспилотной авиационной системы (БАС) с применением эволюционных алгоритмов и методов машинного обучения. Актуальность исследования обусловлена многокритериальностью и высокой сложностью процессов формирования траектории движения БАС, а также необходимостью точной и своевременной оценки её полётных параметров. Это особенно важно для обеспечения надёжности, безопасности и эффективного выполнения полётных задач в условиях эксплуатации БАС, включая сценарии, связанные с функционированием критически значимых объектов инфраструктуры. Цель исследования заключается в повышении точности диагностики траекторных параметров и надёжности параметрического прогнозирования траекторий движения БАС в условиях неопределённости и многокритериальности рассматриваемой задачи. В работе предлагается гибридный подход, включающий генетический алгоритм (ГA), алгоритм роя частиц (PSO) с моделью машинного обучения XGBoost, обеспечивающей адаптивную оценку качества формируемых решений. Реализован вычислительный программный комплекс, включающий механизмы селекции, рекомбинации, мутации и элитного наследования, а также модуль машинного обучения для валидации траектории маршрута и связанных параметров. Проведён вычислительный эксперимент, в рамках которого выполнен сравнительный анализ эффективности GA и PSO при различных сценариях их работы. Тестирование выполнялось на отраслевых наборах данных при различном количестве итераций. В ходе вычислительного эксперимента выявлено преимущество генетического алгоритма, а именно повышение качества проектных решений на 14–17%. Результаты исследования демонстрируют высокую адаптивность и практическую применимость в задачах моделирования, параметрического прогнозирования и маршрутизации, а также указывают на потенциал интеграции с интеллектуальными системами навигации и мониторинга БАС. Материалы статьи представляют практический интерес для специалистов в области разработки и эксплуатации БАС, а также для исследователей, занимающихся задачами многокритериального планирования маршрутов, параметрического прогнозирования и повышения надёжности функционирования БАС.
-
ОЦЕНКА ЭФФЕКТИВНОСТИ МЕТОДА ПОИСКА АССОЦИАТИВНЫХ ПРАВИЛ ДЛЯ ЗАДАЧ ОБРАБОТКИ БОЛЬШИХ ДАННЫХ
В.В. Бова, Э.В. Кулиев, С. Н. Щеглов2020-07-20Аннотация ▼Объемы современных баз данных имеют значительные объемы и содержат большие
массивы информации. Одним из популярных методов обнаружения знаний для задач обработки
и анализа больших данных стали алгоритмы поиска ассоциативных правил. В статье решается
задача построения баз ассоциативных правил для анализа представленной большими массива-
ми неструктурированных данных на основе поиска в них различных закономерностей с учетом
значимости их признаков. Предложен метод синтеза баз ассоциативных правил, в котором
выполняется построение транзакционной базы данных на основе вычисления пороговых значе-
ний поддержки и применением критериев оценивания косвенных ассоциаций, что позволяет
извлекать как частые, так и неявные наборы ассоциативных правил. С целью повышения вы-
числительной эффективности извлечения ассоциативных правил, применяется генетический
алгоритм оптимизации входных параметров признакового пространства поиска. Метод позво-
ляет улучшить время извлечения правил, сократить число сгенерированных обобщенных правил,
избежать затратной процедуры предобработки синтезированной базы правил. Разработан
программно-алгоритмический модуль, с помощью которого проведены экспериментальные
исследования метода синтеза ассоциативных правил на основе фильтрации входных парамет-
ров модели поиска для решения задач обработки неструктурированных данных. Проведенные
серии экспериментов на тестовых транзакционных базах данных позволили уточнить теоре-
тические оценки временной сложности метода, в котором для вычисления взвешенной под-
держки наборов правил с учетом оценки априорной информативности признаков, входящих в
данный набор применяется генетический алгоритм. Временная сложность разработанного
метода составляет О(I2). Сравнительной анализ проводился на тестовых данных корпуса
Retail Data с алгоритмами Apriori и Frequent Pattern-Growth. Результаты исследований под-
твердили эффективность метода поиска на больших наборах транзакций, позволяющего более
чем на 40 % уменьшить мощность неизбыточного множества извлеченных ассоциативных
правил по сравнению с известными алгоритмами и показали перспективность его применения
для задачи обнаружения знаний при обработке данных большого объема. -
ИДЕНТИФИКАЦИЯ НЕЯВНЫХ УГРОЗ НА ОСНОВЕ АНАЛИЗА АКТИВНОСТИ ПОЛЬЗОВАТЕЛЯ В ИНТЕРНЕТ-ПРОСТРАНСТВЕ
В. В. Бова , Д.Ю. Запорожец , Ю.А. Кравченко , Э. В. Кулиев , В.В. Курейчик , Н. А. Лызь2020-10-11Аннотация ▼Статья посвящена проблеме идентификации неявных информационных угроз п о-
исковой деятельности пользователя в Интернет-пространстве на основе анализа его
активности в процессе данного взаимодействия. Применение знаний, хранящихся в
интернет-пространстве, для реализации преступных намерений несет в себе угрозу
для всего общества. Выявление злого умысла в действиях пользователей глобаль ной
информационной сети не всегда является тривиальной задачей. Отработанные техн о-
логии анализа контекста интересов пользователя дают сбой в случае осторожных
грамотных действий злоумышленников, которые в явном виде не демонстрируют пр е-
следуемой ими цели. В работе проведен анализ угроз, связанных с определенными сц е-
нариями реализации поисковых процедур, проявляющихся в поисковой деятельности.
Описаны критерии оценки неэффективных и эффективного сценариев поиска. Среди
признаков, указывающих на возможность наличия угрозы, выделены следующие основ-
ные: уход от решения задачи в бесцельную навигацию или к привлекательным ресурсам,
поверхностный поиск, отсутствие смыслового погружения в решение поисковой зад а-
чи, хаотичные действия при поиске. Для определения налич ия неблагоприятных при-
знаков построена система показателей. Сформулированы признаки эффективного
сценария организации поиска в Интернет-пространстве, описаны варианты наличия
неявных угроз для подобной ситуации. Представлен подход идентификации описанных
угроз с учетом заданных критериев оценки различных сценариев поведения пользоват е-
ля в глобальном информационном пространстве. Разработан алгоритм машинного
обучения для идентификации проблемных сценариев путем сравнения с ключевыми
паттернами поведения. Создана программная реализация подсистемы идентификации
информационных угроз, проведены экспериментальные исследования для подтвержд ения эффективности подсистемы. Экспериментальные исследования проводились на основе обработки открытых данных из социальных сетей, а также с применением
анализа поисковой деятельности пользователей в университетской корпоративной
информационной среде. -
МЕТОДЫ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
В. В. Курейчик , С. И. Родзин , В.В. Бова2022-05-26Аннотация ▼Представлен анализ подходов, основанных на глубоком обучении (DL), к задачам об-
работки естественного языка (NLP). Исследование охватывает различные задачи NLP,
реализованные с помощью искусственных нейронных сетей (ANNs), сверточных нейронных
сетей (CNNs) и рекуррентных нейронных сетей (RNNs). Эти архитектуры позволяют ре-
шать широкий спектр задач обработки естественного языка, ранее не поддававшихся
эффективному решению: моделирование предложений, маркировка семантической роли,
распознавание именованных сущностей, ответы на вопросы, категоризация текста, ма-
шинный перевод. Наряду с преимуществами использования CNN для решения задач NLP
имеются проблемы, связанные с большим числом варьируемых параметров сети и выбором
ее архитектуры. Мы предлагаем для оптимизации архитектур сверточных нейронных
сетей эволюционный алгоритм. Алгоритм инициализирует случайную популяцию из малого
числа агентов (не более 5) и с помощью фитнесс функции получает оценки каждого агента
в популяции. Затем проводится турнирная селекция между всеми агентами и применяется
оператор кроссинговера между выбранными агентами. Алгоритм обладает таким пре-
имуществом как малый размер популяции сетей, он использует несколько типов слоев
CNN: сверточный слой, максимальный слой пулинга (субдискретизации), средний слой пу-
линга и полносвязный слой. Алгоритм тестировался на локальном компьютере с графиче-
ским процессором ASUS Cerberus GeForce ® GTX 1050 Ti OC Edition 4 ГБ GDDR5, 8 ГБ
оперативной памяти и процессором Intel(R) Core(TM) i5-4670. Результаты экспериментов
показали, что предлагаемый нейроэволюционный подход способен достаточно быстро
найти оптимизированную архитектуру CNN для заданного набора данных с приемлемым
значением точности. Для завершения выполнения алгоритма потребовалось около 1 часа.
Для создания и обучения CNN был использован популярный фреймворк TensorFlow.
Для оценки алгоритма использовались общедоступные наборы данных: MNIST и MNIST-RB.
Наборы содержали черно-белые изображения рукописных букв и цифр с 50000 обучающими
образцами и 10000 тестовыми образцами. -
МЕТОДЫ И АЛГОРИТМЫ КЛАСТЕРИЗАЦИИ ТЕКСТОВЫХ ДАННЫХ (ОБЗОР)
В.В. Бова , Ю.А. Кравченко , С.И. Родзин2022-11-01Аннотация ▼Рассматривается одна из важных задач искусственного интеллекта – машинная об-
работка естественного языка. Решение данной задачи на основе кластерного анализа по-
зволяет выявлять, формализовывать и интегрировать большие объемы лингвистической
экспертной информации в условиях информационной неопределенности и слабой структу-
рированности исходных текстовых ресурсов, полученных из различных предметных облас-
тей. Кластерный анализ является мощным средством разведочного анализа текстовых
данных, позволяющий провести объективную классификацию любых объектов, которые
охарактеризованы рядом признаков и имеют скрытые закономерности. Проведен обзор и
анализ современных модифицированных алгоритмов агломеративной кластеризации CURE,
ROCK, CHAMELEON, неиерархической кластеризации PAM, CLARA и алгоритма аффинно-
го преобразования, используемых на различных этапах кластеризации текстовых данных,
эффективность которых проверяется экспериментальными исследованиями. В работе
обоснованы требования к выбору наиболее эффективного метода кластеризации для ре-
шения задачи повышения эффективности интеллектуальной обработки лингвистической
экспертной информации. Также в работе рассмотрены способы визуализации результатов
кластеризации для интерпретации кластерной структуры и зависимостей на множестве
элементов текстовых данных и графические средства их представления в виде дендо-
грамм, диаграмм рассеивания, диаграмм сходства VOS и карт интенсивности. Для сравне-
ния качества работы алгоритмов использовались внутренние и внешние метрики эффек-
тивности: «V-мера», «Adjusted Rand index», «Силуэт». На основании проведенных экспери-
ментов выявлено, что необходимо использовать гибридный подход, в котором для перво-
начального выбора числа кластеров и распределения их центров использовать иерархиче-
ский подход, основанный на последовательном объединении и максимизации близости дан-
ных ограниченной выборки, когда нет возможности выдвинуть гипотезу о начальном ко-
личестве кластеров. Далее подключать алгоритмы итерационной кластеризации, обеспе-
чивающие высокую устойчивость по отношению к шумовым признакам и наличию выбро-
сов. За счет гибридизации повышается эффективность работы алгоритмов кластериза-
ции. Результаты исследований показали, что для повышения вычислительной эффективно-
сти и преодоления чувствительности при инициализации параметров алгоритмов класте-
ризации для оптимизации параметров модели обучения и поиска глобального оптимального
решения необходимо использовать метаэвристические подходы. -
ОБЗОР И АНАЛИЗ МЕТОДОВ ТРЕХМЕРНОЙ УПАКОВКИ ПРИ МОРСКИХ ГРУЗОПЕРЕВОЗКАХ
В.В. Курейчик , Ю. В. Балясова , В. В. Бова2025-02-16Аннотация ▼Описана проблема трёхмерной упаковки товаров в различные типы контейнеров при
осуществлении морских грузоперевозок. Морские грузоперевозки играют значительную роль в
международной торговле, реализуются в специфичных и нестандартных условиях, характ е-
ризуются усиленной влажностью, контактом с морской солью, вибрацией, интерференцией
температур и осуществляются посредством судов контейнеровозов, транспортирующих
различные категории товаров в контейнерах, подбираемых с учётом специфики перевозимого
груза, что обеспечивает надёжность и безопасность. Особую важность приобретает пр и-
сутствие защиты товара от многообразных негативных и техногенных факторов окр у-
жающей среды, что подтверждает немаловажность правильно разработанной морской уп а-
ковки груза, обеспечивающей сохранение товара, оборудования, сырья, либо материалов на
всём времени транспортировки по морю, а также надёжного крепления на палубе, либо
внутри грузовых отсеков, исключая возможности повреждений груза, посредством воздейс т-
вия вибрационных и статических нагрузок. В статье описана задача трёхмерной упаковки в
контейнеры при морских грузоперевозках. Рассмотрены критерии и ограничения, построена
модифицированная комбинированная многокритериальная целевая функция. Ее значение
должно стремится к 1, что соответствует 100% заполнению пустот. Также, в работе про-
ведён краткий обзор и анализ методов и алгоритмов поиска решения задачи трёхмерной уп а-
ковки, выявлены их особенности, достоинства и недостатки. С учётом проведённого анализа
отмечено, что метаэвристические методы и алгоритмы поиска эффективны для решения
NP-сложной задачи трёхмерной упаковки так, как позволяют получать наборы квазиопти-
мальных решений за полиноминальное время. -
МНОГОУРОВНЕВЫЙ ПОДХОД ДЛЯ РЕШЕНИЯ ЗАДАЧИ ДВУМЕРНОЙ УПАКОВКИ ГЕОМЕТРИЧЕСКИХ ФИГУР СЛОЖНЫХ ФОРМ
В.В. Курейчик , В.В. Бова , А.Ю. Халенков2023-12-11Аннотация ▼Рассмотрена одна из важных комбинаторных задач оптимизации – задача двумер-
ной упаковки геометрических фигур сложных форм. Она относится к классу NP- сложных
и трудных оптимизационных задач. В работе приведена и описана постановка задачи дву-
мерной упаковки, введена комбинированная целевая функция, учитывающая все ограниче-
ния. В связи со сложностью данной задачи предлагается многоуровневый подход, заклю-
чающийся в разделение задачи двумерной упаковки на 4 подзадачb и решения каждой под-
задачи последовательно в строгом порядке. При этом для каждой из подзадач определен
уникальный набор объектов, не повторяющихся в остальных подзадачах. Для реализации
многоуровневого подхода авторами разработан комбинированный биоинспирированный
алгоритм, основанный методах генетического поиска и биоинспирированной оптимизации.
Такой подход позволяет значительно сократить время получения результата, частично
решить проблему предварительной сходимости алгоритмов и получить наборы квазиоти-
мальных решений за полиномиальное время. Разработан программный комплекс и реализо-
ваны на ЭВМ алгоритмы автоматизированной двухмерной упаковки на основе комбиниро-
ванного биоинспирированного алгоритма. Проведен вычислительный эксперимент на тес-
товых примерах (бенчмарках). Качество упаковки, полученное, на основе разработанного
комбинированного биоинспирированного алгоритма, в среднем на 2 % превосходит резуль-
таты упаковки, полученные с использованием известных алгоритмов при сопоставимом
времени решения, что говорит об эффективности предложенного подхода. Проведенные
серии тестов и экспериментов позволили уточнить теоретические оценки временной
сложности алгоритмов упаковки. В лучшем случае временная сложность алгоритмов
O(n2), в худшем случае - O(n3). -
МЕТОД ПОИСКА ПОСЛЕДОВАТЕЛЬНЫХ ПАТТЕРНОВ ПОВЕДЕНИЯ ПОЛЬЗОВАТЕЛЕЙ В ИНТЕРНЕТ-ПРОСТРАНСТВЕ
В.В. Курейчик, В.В. Бова, Ю.А. Кравченко2020-11-22Аннотация ▼Одной из важных задач интеллектуального анализа данных является выделение зако-
номерностей и обнаружение связанных событий в последовательных данных на основе
анализа последовательных паттернов. В статье исследуются возможность применения
последовательных паттернов для анализа событий поисково-познавательной деятельно-
сти пользователей при взаимодействии с Интернет-ресурсами открытой информационно-
образовательной среды. Поиск последовательных паттернов является сложной вычисли-
тельной задачей, цель которой состоит в извлечении всех частых последовательностей,
отражающих потенциальные связи внутри элементов из транзакционной базы данных
последовательностей событий поисковой активности при заданной минимальной под-
держке. Для ее решения в статье предлагается метод поиска закономерностей в последо-
вательностях событий для обнаружения скрытых закономерностей, указывающих с воз-
можные уровни уязвимости при выполнении задач информационного поиска в Интернет-
пространстве. Описана математическая модель поведения пользователей в поисковой
сессии, основанная на теории последовательных паттернов. Для повышения вычислитель-
ной эффективности метода разработан модифицированный алгоритм генерации последо-
вательных паттернов, на первом этапе которого выполняется AprioriAll, формирующий
частые последовательности-кандидаты всевозможных длин, а на втором - генетический
алгоритм оптимизации входных параметров признакового пространства сгенерированного
множества для поиска максимальных паттернов. Проведены серии вычислительных экс-
периментов на тестовых данных корпуса MSNBC, библиотеки интеллектуального анализа
данных с открытым исходным кодом SPMF. Сравнительной анализ проводился с алгорит-
мами VMSP и GSP. Результаты исследований подтвердили эффективность поиска макси-
мальных последовательных паттернов предложенным алгоритмом с точки зрения времени
выполнения и количества извлеченных паттернов. Результаты проведенных эксперимен-
тальных исследований метода показали, что для увеличения стабильности и точности
работы размер выборки, полученной в результате работы ГА, позволит сократить необ-
ходимое число сканирований базы данных паттернов, обеспечивая приемлемые вычисли-
тельные затраты, сопоставимые с алгоритмом VMSP и превосходящий по времени поиска
последовательных паттернов алгоритм GSP в среднем более чем на 150%.








