Найти
Результаты поиска
-
ЦЕНТРАЛЬНО-КОЛЬЦЕВОЙ ПОЛИНОМИАЛЬНЫЙ АЛГОРИТМ РАСПРЕДЕЛЕНИЯ ВЫЧИСЛИТЕЛЬНО-ВРЕМЕННЫХ РЕСУРСОВ В ГРИД-СИСТЕМАХ
Д.Ю. Кравченко , Ю.А. Кравченко , Э. В. Кулиев , А.Э. Саак2022-08-09Аннотация ▼Статья посвящена решению задачи распределения вычислительно-временных ресурсов в
грид-системах на основе адаптации используемых полиномиальных алгоритмов к квадратич-
ным типам заявок пользователей. Актуальность задачи обоснована значительным ростом
востребованности парадигмы распределенных вычислений в условиях информационного пере-
полнения и неопределенности. В статье рассмотрены проблемы диспетчирования гетероген-
ных вычислительных ресурсов при решении сложных профессиональных и научных задач, по-
ступающих в различные моменты времени, на основе классификации по значимым признакам
соответствия и готовности ресурса. Проведен сравнительный обзор существующих аналогов.
Сформулирована постановка решаемой задачи в контексте выбранной тематики исследова-
ния. Обоснована проблема диспетчирования грид-систем с централизованной архитектурой,
которая использует технологию мульти-сайтного выполнения задач. Применение данной архи-
тектуры требует разработки эвристических алгоритмов распределения вычислительных ре-
сурсов с функцией учета свойств массивов заявок пользователей и оценки соответствия распи-
сания. Исключение возникновения ошибок диспетчирования требует разработки формального
аппарата, который будет выявлять закономерности множества заявок, введет их типизацию
и построит эвристические алгоритмы с оценкой качества, адаптированные под соответст-
вующие типы. Разработка такого формального аппарата несомненно является актуальной
задачей. Не менее важной задачей в рамках создания данного аппарата является построение
модели паритетности ресурсов и моделей взаимодействия пользователей и вычислительнойсистемы. Авторами предложено решать задачу диспетчирования вычислительных ресурсов на
основе разработки и исследования полиномиальных алгоритмов диспетчирования массивами
заявок гиперболического типа. Основной теоретической значимостью данного исследования
является создание формального аппарата среды диспетчирования, включающего определение
ресурсного прямоугольника, как модели заявки пользователя, на основе выполнения операций в
среде диспетчирования над этими ресурсными прямоугольниками. Научная новизна исследова-
ния заключается в разработке центрально-кольцевого полиномиального алгоритма распределе-
ния вычислительно-временных ресурсов в грид-системах, который отличается от существую-
щих алгоритмов диспетчирования вычислительных систем адаптацией к квадратичным типам
заявок пользователей и позволяет повысить эффективность распределения вычислительно-
временных ресурсов. Для оценки эффективности предложенного алгоритма разработано про-
граммное приложение и проведен вычислительный эксперимент с разным количеством сфор-
мированных классов вычислительных ресурсов. Полученные сравнительные результаты прове-
денных экспериментальных исследований подтверждает эффективность предложенного ал-
горитма распределения вычислительно-временных ресурсов. Описанные исследования имеют
высокий уровень теоретической и практической значимости и напрямую связаны с решением
классических задач искусственного интеллекта. -
ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ ПО ПРЕДУПРЕЖДЕНИЮ И ЛИКВИДАЦИИ ПОСЛЕДСТВИЙ ЧРЕЗВЫЧАЙНЫХ СИТУАЦИЙ НА ОСНОВЕ НЕЧЕТКОГО МЕТОДА СТРУКТУРИРОВАНИЯ ИНФОРМАЦИИ
Е.М. Герасименко , Д. Ю. Кравченко, Ю.А. Кравченко , Э.В. Кулиев2023-06-07Аннотация ▼Статья посвящена решению научной проблемы поддержки принятия решений по
предупреждению и ликвидации последствий чрезвычайных ситуаций (ЧС) на основе реше-
ния задачи структурирования информации. Актуальность данной задачи обусловлена не-
обходимостью развития теоретических основ оптимизации риска возникновения неблаго-
приятных воздействий на здоровье человека и окружающую природную среду в связи с
чрезвычайными ситуациями (ЧС). Авторами даны определения основным терминам иссле-
дуемой предметной области. Представлена формализованная постановка решаемой зада-
чи. Приведена развернутая классификация чрезвычайных ситуаций с описанием особенно-
стей представленных классов. Система правил для поддержки принятия решений при
чрезвычайных ситуациях должна иметь многоуровневую иерархию, что позволяет обеспе-
чить построение различных траекторий принятия решений по принципу сверху-вниз. Наи-
более подходящей моделью для построения такого информационного пространства явля-
ется онтологическая структура, которая обеспечивает создание необходимой многоуров-
невой иерархии с учетом всех параметров и критериев, влияющих на развитие ситуации.
Основными элементами данной онтологической модели являются сущности и связи между
ними, наличие которых на верхнем уровне декомпозиции будет указывать на риск возник-
новения чрезвычайной ситуации, а на каждом более низком уровне – будет разворачивать
таксономию детального описания возможных ситуаций развития ЧС и необходимых дей-
ствий для их предотвращения или ликвидации последствий. Обработка построенной онто-
логической модели правил реализуется в работе на основе применения предложенного ав-
торами нечеткого метода структурирования информации при ЧС, который отличается
от известных аналогов применением нового обобщенного критерия оптимизации выбора
альтернатив поддержки принятия решений. Оригинальность оптимизационной постанов-
ки задачи структурирования заключается в оценке контекстной привязки элементов ин-
формации к определенному классу чрезвычайных ситуаций, междисциплинарности с уче-
том наличия множества связей между предметными областями, а также учета сниже-
ния уровня оперативности информации о протекании ЧС с течением времени -
БИОИНСПИРИРОВАННЫЙ МЕТОД КЛАССИФИКАЦИИ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ РЕСУРСОВ ДЛЯ ДИСПЕТЧИРОВАНИЯ В ГРИД-СИСТЕМАХ
Д.Ю. Кравченко , Ю.А. Кравченко, В. В. Марков , А.Э. Саак2021-11-14Аннотация ▼Статья посвящена решению задачи диспетчирования распределенных вычислитель-
ных ресурсов на основе их классификации методом биоинспирированного поиска для повы-
шения эффективности функционирования грид-систем. Актуальность задачи обоснована
значительным ростом востребованности парадигмы распределенных вычислений в услови-
ях информационного переполнения и неопределенности. В статье рассмотрены проблемы
диспетчирования гетерогенных вычислительных ресурсов при решении сложных профес-
сиональных и научных задач, поступающих в различные моменты времени, на основе клас-
сификации по значимым признакам соответствия и готовности ресурса. Проведен срав-
нительный обзор существующих аналогов. Сформулирована постановка решаемой задачи вконтексте выбранной тематики исследования. Обоснована стратегия выбора биоинспи-
рированного моделирования для решения поставленной задачи. Проанализированы аспекты
эффективности применения различных децентрализованных биоинспирированных мето-
дов. Предложено решать задачу диспетчирования вычислительных ресурсов на основе
определения соответствия ресурса необходимому классу. Классификация проводиться на
основе применения биоинспирированного метода оптимизации, построенного на основе
алгоритма поиска косяком рыб. Использование популяционного биоинспирированного ме-
тода позволяет обеспечить беспрецедентный параллелизм получения альтернативных
решений и оптимизировать распределение имеющихся вычислительных ресурсов в зависи-
мости от наборов значимых признаков. Объектом исследования являются процессы клас-
сификации данных, включающие в себя упорядоченные последовательности действий, на-
правленных на распределение вычислительных ресурсов по классам решаемых задач. Предме-
том исследования являются биоинспирированные методы решения задачи классификации
данных в грид-системах. Для оценки эффективности предложенного метода разработано
программное приложение и проведен вычислительный эксперимент с разным количеством
сформированных классов вычислительных ресурсов. Каждый вычислительный ресурс имеет
определенный набор атрибутов, являющийся вектором его признаков. Косинусная мера сход-
ства вектора признаков ресурса и вектора признаков определенного класса является крите-
рием классификации. Для повышения качества процесса диспетчирования задача классифи-
кации вычислительных ресурсов решена для множества вариантов организации потоков
сложных решаемых задач в грид-системах. Полученные количественные оценки демонстри-
руют экономию времени при решении задач диспетчирования распределенных вычислитель-
ных ресурсов на основе их классификации методом биоинспирированного поиска не менее
7 %. Временная сложность в рассмотренных примерах составила . Описанные ис-
следования имеют высокий уровень теоретической и практической значимости и напря-
мую связаны с решением классических задач искусственного интеллекта. -
БИОИНСПИРИРОВАННЫЙ МЕТОД ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ ДЛЯ ДИСПЕТЧЕРИЗАЦИИ ПОТОКОВ ПАРАЛЛЕЛЬНЫХ ЗАЯВОК В GRID- СИСТЕМАХ
Д. Ю. Кравченко, Ю. А. Кравченко, В. В. Курейчик, А.Э. Саак2020-07-20Аннотация ▼Статья посвящена решению задачи диспетчеризации потоков параллельных заявок в
пространственно-распределённых вычислительных системах. Актуальность задачи обос-
нована значительным ростом востребованности парадигмы распределенных вычислений в
условиях информационного переполнения и неопределенности. В статье рассмотрены про-
блемы диспетчирования заявок пользователей, требующих для своего обслуживания не-
сколько процессоров одновременно, что выходит за рамки классической теории расписа-
ний. Проанализированы аспекты эффективности применения эвристических алгоритмов
диспетчирования планарными ресурсами. Определены причины их недостаточности как по
результативности, так и по эмпиричности подходов. Предложено решать задачу диспет-
черизации параллельных заявок на основе комплексного применения коалиции интеллекту-
альных агентов и событийной имитационной модели. Классификацию поступающих на
вход заявок предлагается проводить на основе применения модифицированного биоинспи-
рированного метода оптимизации поиском кукушки. Совместное использование коалиции
интеллектуальных агентов и биоинспирированного метода позволит обеспечить беспреце-
дентный параллелизм вычислений, а последующее определение путей обработки классифи-
цированных заявок на основе имитационной модели сформирует наборы альтернативных
решений, позволяющих ускорить решение задач и оптимизировать распределение имею-
щихся вычислительных ресурсов в зависимости от наборов поступающих заявок. Для оцен-
ки эффективности предложенного подхода разработан программный продукт и проведе-
ны эксперименты с разным количеством поступающих на вход заявок. Каждая поступаю-
щая на вход заявка имеет определенный набор атрибутов, являющийся вектором призна-
ков заявки. Степень сходства вектора признаков заявки и эталонного вектора признаков
вершины в распределяющей имитационной модели является критерием классификации
заявки. Для повышения качества процесса диспетчеризации введены новые процедуры дуб-
лирования неклассифицированных заявок, позволяющие интенсифицировать поиск совпаде-
ний в векторах признаков. Также предусмотрены резервные траектории диспетчеризации
необходимые для обработки прецедентов появления на входах заявок с абсолютным при-
оритетом. Полученные количественные оценки демонстрируют экономию времени при
решении задач относительно большой размерности (от 500000 вершин) не менее 10 %.
Временная сложность в рассмотренных примерах составила . Описанные исследова-
ния имеют высокий уровень теоретической и практической значимости и напрямую связа-
ны с решением классических задач искусственного интеллекта, направленных на поиск
скрытых зависимостей и закономерностей на множестве больших данных. -
ГИБРИДНЫЙ БИОИНСПИРИРОВАННЫЙ АЛГОРИТМ ОТОБРАЖЕНИЯ ОНТОЛОГИЙ В ЗАДАЧАХ ИЗВЛЕЧЕНИЯ И УПРАВЛЕНИЯ ЗНАНИЯМИ
Д. Ю. Кравченко, Ю. А. Кравченко, В. В. Марков2020-07-20Аннотация ▼Статья посвящена решению задачи отображения онтологических моделей в процес-
сах извлечения и управления знаниями. Актуальность и значимость данной задачи обуслов-
лены необходимостью сохранения достоверности и исключения избыточности знаний при
интеграции (объединении) структурированных информационных источников различного
происхождения. Близость и непротиворечивость понятийной семантики объединенного
ресурса при проводимом отображении является основным критерием эффективности
предложенных решений. В статье рассмотрены проблемы выбора соответствующих за-
даче подходов решения, сохраняющих семантику при отображении концептов. Обоснована
стратегия выбора биоинспирированного моделирования. Проанализированы аспекты эф-
фективности применения различных децентрализованных биоинспирированных методов.
Определены причины необходимости проведения гибридизации. Предложено решать зада-
чу отображения онтологических моделей с применением биоинспирированного алгоритма,
построенного на основе гибридизации оптимизационных механизмов алгоритмов бактери-
ального и кукушкиного поиска. Проведенная гибридизация данных алгоритмов позволила
объединить их основные преимущества: последовательный бактериальный поиск, обеспечивающий детальное исследование локальных областей, и значительное число глобальных
перемещений агента-кукушки при реализации полетов Леви. Для оценки эффективности
предложенного гибридного биоинспирированного алгоритма разработан программный
продукт и проведены эксперименты по отображению онтологий разного размера. Каж-
дый концепт любой онтологии имеет определенный набор атрибутов, являющийся семан-
тическим вектором признаков. Степень сходства семантических векторов сравниваемых
концептов отображаемых онтологий является критерием их интеграции. Для повышения
качества процесса отображения введена новая кодировка решений. Полученные количест-
венные оценки демонстрируют экономию времени при решении задач относительно боль-
шой размерности (от 500000 вершин онтографа) не менее 13 %. Временная сложность
разработанного гибридного алгоритма составляет Описанные исследования имеют
высокий уровень теоретической и практической значимости и напрямую связаны с реше-
нием классических задач искусственного интеллекта, направленных на поиск скрытых за-
висимостей и закономерностей на множестве элементов знаний. -
ИДЕНТИФИКАЦИЯ НЕЯВНЫХ УГРОЗ НА ОСНОВЕ АНАЛИЗА АКТИВНОСТИ ПОЛЬЗОВАТЕЛЯ В ИНТЕРНЕТ-ПРОСТРАНСТВЕ
В. В. Бова , Д.Ю. Запорожец , Ю.А. Кравченко , Э. В. Кулиев , В.В. Курейчик , Н. А. Лызь2020-10-11Аннотация ▼Статья посвящена проблеме идентификации неявных информационных угроз п о-
исковой деятельности пользователя в Интернет-пространстве на основе анализа его
активности в процессе данного взаимодействия. Применение знаний, хранящихся в
интернет-пространстве, для реализации преступных намерений несет в себе угрозу
для всего общества. Выявление злого умысла в действиях пользователей глобаль ной
информационной сети не всегда является тривиальной задачей. Отработанные техн о-
логии анализа контекста интересов пользователя дают сбой в случае осторожных
грамотных действий злоумышленников, которые в явном виде не демонстрируют пр е-
следуемой ими цели. В работе проведен анализ угроз, связанных с определенными сц е-
нариями реализации поисковых процедур, проявляющихся в поисковой деятельности.
Описаны критерии оценки неэффективных и эффективного сценариев поиска. Среди
признаков, указывающих на возможность наличия угрозы, выделены следующие основ-
ные: уход от решения задачи в бесцельную навигацию или к привлекательным ресурсам,
поверхностный поиск, отсутствие смыслового погружения в решение поисковой зад а-
чи, хаотичные действия при поиске. Для определения налич ия неблагоприятных при-
знаков построена система показателей. Сформулированы признаки эффективного
сценария организации поиска в Интернет-пространстве, описаны варианты наличия
неявных угроз для подобной ситуации. Представлен подход идентификации описанных
угроз с учетом заданных критериев оценки различных сценариев поведения пользоват е-
ля в глобальном информационном пространстве. Разработан алгоритм машинного
обучения для идентификации проблемных сценариев путем сравнения с ключевыми
паттернами поведения. Создана программная реализация подсистемы идентификации
информационных угроз, проведены экспериментальные исследования для подтвержд ения эффективности подсистемы. Экспериментальные исследования проводились на основе обработки открытых данных из социальных сетей, а также с применением
анализа поисковой деятельности пользователей в университетской корпоративной
информационной среде. -
ДВУХЭТАПНЫЙ БУСТИНГ БИНАРНОЙ КЛАССИФИКАЦИИ НА ОСНОВЕ ПРИМЕНЕНИЯ БИОИНСПИРИРОВАННЫХ АЛГОРИТМОВ
Д. В. Балабанов , А. В. Ковтун , Ю. А. Кравченко2020-10-11Аннотация ▼В процессе решения широкого круга прикладных задач возникает необходимость де-
композиции объектов. Как следствие, проблема классификации является актуальной про-
блемой в современных системах интеллектуального анализа данных. Бинарная классифи-
кация является одной из важнейших задач, и имеет целый ряд нерешенных проблем. Одной
из таких проблем является эффективность автоматизированной классификации. В зада-
чах автоматизированной классификации, актуально применение алгоритмического аппа-
рата эволюционных вычислений. Таким образом целесообразно применение генетических и
биоинспирированных алгоритмов, в задаче поиска оптимальных значений параметров
классификатора. Для решения данной задачи предлагается применить алгоритм роя час-
тиц(PSO). Данный алгоритм в контексте задачи поиска субоптимальных значений пара-
метров классификатора способен обеспечить высокое качество классификации. Модифи-
кацией алгоритма является динамическое изменение значений координат, которые отве-
чают за тип функции ядра. Данная доработка позволяет значительно снизить затрачи-
ваемое время разработки классификатора. Для повышения эффективности классификации
целесообразно применять ансамбли алгоритмов. В работе приведена структура двухуров-
невого классификатора. На первом уровне данного классификатора, формируется ан-
самбль простых классификаторов которые формируют учебную выборку, которая, в даль-
нейшем используется алгоритмом роя частиц на втором этапе. Такой подход позволяет
значительно уменьшить временные затраты, а также повысить качество получаемых
решений. Алгоритм роя частиц(PSO), в контексте задачи поиска субоптимальных значе-
ний параметров классификатора способен обеспечить высокое качество классификации.
Предложенный двухуровневый алгоритм был экспериментально протестирован. Произве-
дено сравнение с аналогами, приведены сравнительные диаграммы. Описанные исследова-
ния показывают, что работа имеет высокую теоретическую значимость, а проведенные
экспериментальные исследования доказывают высокую практическую значимость. -
МЕТОД ПОИСКА ПОСЛЕДОВАТЕЛЬНЫХ ПАТТЕРНОВ ПОВЕДЕНИЯ ПОЛЬЗОВАТЕЛЕЙ В ИНТЕРНЕТ-ПРОСТРАНСТВЕ
В.В. Курейчик, В.В. Бова, Ю.А. Кравченко2020-11-22Аннотация ▼Одной из важных задач интеллектуального анализа данных является выделение зако-
номерностей и обнаружение связанных событий в последовательных данных на основе
анализа последовательных паттернов. В статье исследуются возможность применения
последовательных паттернов для анализа событий поисково-познавательной деятельно-
сти пользователей при взаимодействии с Интернет-ресурсами открытой информационно-
образовательной среды. Поиск последовательных паттернов является сложной вычисли-
тельной задачей, цель которой состоит в извлечении всех частых последовательностей,
отражающих потенциальные связи внутри элементов из транзакционной базы данных
последовательностей событий поисковой активности при заданной минимальной под-
держке. Для ее решения в статье предлагается метод поиска закономерностей в последо-
вательностях событий для обнаружения скрытых закономерностей, указывающих с воз-
можные уровни уязвимости при выполнении задач информационного поиска в Интернет-
пространстве. Описана математическая модель поведения пользователей в поисковой
сессии, основанная на теории последовательных паттернов. Для повышения вычислитель-
ной эффективности метода разработан модифицированный алгоритм генерации последо-
вательных паттернов, на первом этапе которого выполняется AprioriAll, формирующий
частые последовательности-кандидаты всевозможных длин, а на втором - генетический
алгоритм оптимизации входных параметров признакового пространства сгенерированного
множества для поиска максимальных паттернов. Проведены серии вычислительных экс-
периментов на тестовых данных корпуса MSNBC, библиотеки интеллектуального анализа
данных с открытым исходным кодом SPMF. Сравнительной анализ проводился с алгорит-
мами VMSP и GSP. Результаты исследований подтвердили эффективность поиска макси-
мальных последовательных паттернов предложенным алгоритмом с точки зрения времени
выполнения и количества извлеченных паттернов. Результаты проведенных эксперимен-
тальных исследований метода показали, что для увеличения стабильности и точности
работы размер выборки, полученной в результате работы ГА, позволит сократить необ-
ходимое число сканирований базы данных паттернов, обеспечивая приемлемые вычисли-
тельные затраты, сопоставимые с алгоритмом VMSP и превосходящий по времени поиска
последовательных паттернов алгоритм GSP в среднем более чем на 150%. -
ВЕКТОРИЗАЦИЯ ТЕКСТА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ
Али Махмуд Мансур , Жуман Хуссайн Мохаммад , Ю. А. Кравченко2021-07-18Аннотация ▼В задачах интеллектуального анализа текста текстовое представление должно
быть не только эффективным, но и интерпретируемым, поскольку это позволяет понять
операционную логику, лежащую в основе моделей интеллектуального анализа данных. Тра-
диционные методы векторизации текста, такие как TF-IDF и Bag-of-words, эффективны
и имеют интуитивно понятную интерпретируемость, но страдают от «проклятия раз-
мерности» и не могут понимать смысл слов. С другой стороны, современные распределен-
ные методы эффективно определяют скрытую семантику, но требуют больших вычисли-
тельных ресурсов и времени, а также им не хватает интерпретируемости. В этой ста-
тье предлагается новый метод векторизации текстов под названием Bag of weighted Concepts
BoWC, который представляет документ в соответствии с содержащейся в нем ин-
формацией о концептах. Предлагаемый метод создает концепты посредством кластери-
зации векторов слов (т.е. встраивания слов), и использует частоты этих кластеров концептов для представления векторов документов. Чтобы обогатить итоговое представле-
ние документа, предлагается модифицированная весовая функция для взвешивания кон-
цептов на основе статистики, извлеченной из информации вложений слов. Векторы, сге-
нерированные с помощью предложенного метода, характеризуются интерпретируемо-
стью, низкой размерностью, высокой точностью, а также низкими вычислительными
затратами при использовании в задачах классификации и кластеризации. Предлагаемый
метод протестирован на пяти различных наборах эталонных данных для кластеризации и
классификации текстовых документов и сравнивается с несколькими базовыми методами,
включая Bag-of-words, TF-IDF, Averaged GloVe, Bag-of-Concepts и VLAC. Результаты пока-
зывают, что BoWC превосходит большинство базовых методов и дает в среднем на 7 %
лучшую точность. -
МОДИФИЦИРОВАННЫЙ МЕТОД УСТРАНЕНИЯ НЕОДНОЗНАЧНОСТИ СМЫСЛА СЛОВ, ОСНОВАННЫЙ НА МЕТОДАХ РАСПРЕДЕЛЕННОГО ПРЕДСТАВЛЕНИЯ
Ю.А. Кравченко , Мансур Али Махмуд, Мохаммад Жуман Хуссайн2021-08-11Аннотация ▼В задачах интеллектуального анализа текста текстовое представление должно
быть не только эффективным, но и интерпретируемым, поскольку это позволяет понять
операционную логику, лежащую в основе моделей интеллектуального анализа данных. В
этой статье предлагается модифицированный метод устранения неоднозначности слов
(WSD), который, по сути, имитирует хорошо известный вариант подхода Леска WSD. Для
выбранного слова и его контекста алгоритм Леска проводит свои вычисления на основе
проверки совпадений контекста слова и каждого определения его смыслов (глосс), для того
чтобы выбрать правильное значение. Основным преимуществом данного метода является
применение концепции сходства между определением и контекстом вместо «перекры-
тия», для каждого смысла целевого слова в дополнение к расширению определения приме-
рами предоставленными WordNet. Предлагаемый метод также характеризуется исполь-
зованием функций измерения схожести текстов, определенных в распределенном семан-
тическом пространстве. Предлагаемый метод протестирован на пяти различных наборах
эталонных данных для задачи устранения неоднозначности смысла слов и сравнивался с
несколькими базовыми методами, включая Lesk, расширенный Lesk, WordNet 1st sense,
Babelfy и UKB. Результаты показывают, что предлагаемый метод превосходит большин-
ство известных аналогов, за исключением методов Babelfy и WN 1st sense. -
МЕТОД ПРИНЯТИЯ РЕШЕНИЙ ПРИ ФОРМИРОВАНИИ МОДЕЛЕЙ ТИПОВЫХ ПРОЦЕССОВ ДЛЯ ИНФОРМАЦИОННЫХ СИСТЕМ НА БАЗЕ ОБЛАЧНЫХ ТЕХНОЛОГИЙ
А. А. Левченко , В.В. Таратухин , Ю. А. Кравченко2021-11-14Аннотация ▼Статья посвящена решению задачи создания метода принятия решений при фор-
мировании типовых процессов предприятия для внедрения и использования информац и-
онных систем на базе облачных технологий, так же известных, как систем, работа ю-
щих по модели SaaS (Software as a Service, Программное обеспечение как Услуга). Акту-
альность исследования обусловлена новизной технологии облачных вычислений и нево з-
можностью применения методов, разработанных для систем класса on-Premise. Целью
исследования является повышение эффективности использования типов ых моделей
предприятия при внедрении и использовании SaaS систем. Повышение эффективности
обеспечивает сокращение сроков и бюджета проекта при внедрении SaaS-систем, а
также эксплуатационных затрат после. Достижение цели исследования обеспечивается
выполнением следующих задач: аналитический обзор области исследования на предмет
имеющихся методов, формализация и постановки задачи исследования, описание эл е-
ментов проектной документации, как единой системы и определение связей между
структурными элементами, разработка метода принятия решений о формировании
моделей типовых процессов, проверка метода через определение критерия эффективн о-
сти и сравнения результатов работы метода с аналогами. Задача исследования форм а-
лизована, как каноническая задача оптимизации с целевой функцией, направленной на
максимизацию критерия эффективности. Критерий эффективности задан в виде фо р-
мулы, описывающей степень покрытия типовыми моделями функциональных требований
к целевым процессам предприятия. В статье описаны методы и алгоритм ы, используе-
мые для решения аналогичных задачи, а также приведены их недостатки и ограничения.
Предложенный метод базируется на теории нечетких множеств и использует алг о-
ритм нечеткого вывода Мамдани для связи множества функциональных требований и
множества системных реализаций. На базе метода разработано программное прило-
жение и проведен вычислительный эксперимент. Выборка для проверки метода и его
сравнение с существующими аналогами формировалась на базе функциональных треб о-
ваний к организационным процессам управления закупками крупных предприятий и реали-
зации данных требований в SaaS-системах на платформе SAP. Подтвержден рост зна-
чения критерия эффективности в случае применения предложенного метода, что д е-
монстрирует его преимущество перед имеющимися альтернативными решениями после
второй итерации использования. В качестве примера представлено описание типового
процесса создания заявки на закупку до и после применения предложенного метода. -
РЕШЕНИЕ ЗАДАЧИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ НА ОСНОВЕ БИОИНСПИРИРОВАННОГО АЛГОРИТМА
Э.В. Кулиев , Д. Ю. Запорожец, Ю.А. Кравченко , М.М. Семенова2022-01-31Аннотация ▼Рассматривается биоинспирированный алгоритм для решения задач интеллектуаль-
ного анализа. Интеграция биоинспирированных алгоритмов для решения задач интеллек-
туального анализа данных является перспективным направлением исследований. В качест-
ве биоинспирированного алгоритма, рассмотрен алгоритм, основанный на адаптивном
поведении муравьиной колонии. Алгоритм муравьиной колонии позволяет производить ка-
чественный поиск перспективных решений для получения оптимальных и квазиоптималь-
ных решений. Алгоритм обладает способностью выполнять поиск подходящей логических
условий. Алгоритм муравьиной колонии основан на примере поведения живых муравьев в
природе. Муравьи способны находить кратчайшее решение адаптируясь к изменениям
окружающей среды. Авторами предложен модифицированный алгоритм муравьиной коло-
нии для решения задачи интеллектуального анализа данных. В качестве задачи интеллек-
туального анализа данных выбрана задача кластеризации. Кластеризация – объединение в
группы схожих объектов – является одной из фундаментальных задач в области анализа
данных и Data Mining. Список прикладных областей, где она применяется, широк: сегмен-
тация изображений, маркетинг, борьба с мошенничеством, прогнозирование, анализ тек-
стов и многие другие. Решение данной задачи приобретает особую актуальность в услови-
ях постоянно растущего объема генерируемых, передаваемых и обрабатываемых данных.
Классические методы кластеризации оптимизированы путем объединения с предложен-
ным алгоритмом биоинспирированной оптимизации – муравьиным алгоритмом. Предло-
женный метод представляет собой модель, в которой муравьи представлены в виде аген-
тов, которые случайным образом перемещаются в пространстве решений с некоторыми
ограничений (например, препятствия на их пути). Для определения эффективности разра-
ботанного модифицированного муравьиного алгоритма (АСО) с алгоритмом кластериза-
ции, авторами была проведена серия вычислительных экспериментов. Для сравнения были
взять генетический алгоритм, алгоритм обезьян и алгоритм волков. Результаты модели-
рования доказывают, что муравьиный алгоритм на основе кластеризации дает лучшие
результаты, чем другие предлагаемые алгоритмы. -
МЕТОДЫ И АЛГОРИТМЫ КЛАСТЕРИЗАЦИИ ТЕКСТОВЫХ ДАННЫХ (ОБЗОР)
В.В. Бова , Ю.А. Кравченко , С.И. Родзин2022-11-01Аннотация ▼Рассматривается одна из важных задач искусственного интеллекта – машинная об-
работка естественного языка. Решение данной задачи на основе кластерного анализа по-
зволяет выявлять, формализовывать и интегрировать большие объемы лингвистической
экспертной информации в условиях информационной неопределенности и слабой структу-
рированности исходных текстовых ресурсов, полученных из различных предметных облас-
тей. Кластерный анализ является мощным средством разведочного анализа текстовых
данных, позволяющий провести объективную классификацию любых объектов, которые
охарактеризованы рядом признаков и имеют скрытые закономерности. Проведен обзор и
анализ современных модифицированных алгоритмов агломеративной кластеризации CURE,
ROCK, CHAMELEON, неиерархической кластеризации PAM, CLARA и алгоритма аффинно-
го преобразования, используемых на различных этапах кластеризации текстовых данных,
эффективность которых проверяется экспериментальными исследованиями. В работе
обоснованы требования к выбору наиболее эффективного метода кластеризации для ре-
шения задачи повышения эффективности интеллектуальной обработки лингвистической
экспертной информации. Также в работе рассмотрены способы визуализации результатов
кластеризации для интерпретации кластерной структуры и зависимостей на множестве
элементов текстовых данных и графические средства их представления в виде дендо-
грамм, диаграмм рассеивания, диаграмм сходства VOS и карт интенсивности. Для сравне-
ния качества работы алгоритмов использовались внутренние и внешние метрики эффек-
тивности: «V-мера», «Adjusted Rand index», «Силуэт». На основании проведенных экспери-
ментов выявлено, что необходимо использовать гибридный подход, в котором для перво-
начального выбора числа кластеров и распределения их центров использовать иерархиче-
ский подход, основанный на последовательном объединении и максимизации близости дан-
ных ограниченной выборки, когда нет возможности выдвинуть гипотезу о начальном ко-
личестве кластеров. Далее подключать алгоритмы итерационной кластеризации, обеспе-
чивающие высокую устойчивость по отношению к шумовым признакам и наличию выбро-
сов. За счет гибридизации повышается эффективность работы алгоритмов кластериза-
ции. Результаты исследований показали, что для повышения вычислительной эффективно-
сти и преодоления чувствительности при инициализации параметров алгоритмов класте-
ризации для оптимизации параметров модели обучения и поиска глобального оптимального
решения необходимо использовать метаэвристические подходы. -
МЕТОДЫ НЕЧЕТКОГО МНОГОКРИТЕРИАЛЬНОГО ГРУППОВОГО ПРИНЯТИЯ РЕШЕНИЙ ДЛЯ ЗАДАЧ ЭВАКУАЦИИ ПРИ ЧРЕЗВЫЧАЙНЫХ СИТУАЦИЯХ
С. И. Родзин , А.В. Боженюк , Ю.А. Кравченко , О.Н. Родзина2023-06-07Аннотация ▼Целями данной статьи является анализ современного состояния исследований в области
нечетких методов многокритериальной оптимизации, а также разработка операторов агре-
гации и алгоритмов, использующих нечеткое многокритериальное групповое принятие решений
с применением интуиционистского отношения лингвистических предпочтений. Представлены
наиболее известные нечеткие методы многокритериальной оптимизации: ELECTRE,
PROMETHEE, VIKOR, TOPSIS, AHP, ANP, MACBETH, DEMATEL, интеграл Шоке и DEA, рас-
смотрены их особенности, области применения и наиболее цитируемые статьи. Большинство
реальных задач оптимизации могут иметь противоречивые цели. Также представлены метод
нечеткого принятия многоцелевых решений FMODM для ситуаций, когда существуют неточ-
ности и неопределенность в некоторых целях и переменных, от которых они зависят; методы
нечеткого многоцелевого линейного программирования FMOLP, нечеткого многопредметного
целевого программирования FMOGP и нечеткие эвристические методы принятия решений.
Рассмотрена проблема нечеткого многокритериального группового принятия решений при
эвакуации с интуитивным отношением лингвистических предпочтений. Отмечено, что мето-
ды нечеткой логики особенно подходят для принятия решений об эвакуации, когда данных мало,
знание причинно-следственных связей неточно, а наблюдения и критерии могут быть выраже-
ны в лингвистических качественных терминах. Представлены основные этапы группового при-
нятия наилучшего решения среди альтернатив в нечеткой среде: объединение оценок экспер-
тов; получение итоговой оценки для каждой альтернативы, представленной лингвистической
переменной; ранжирование альтернатив; групповое принятие наиболее предпочтительногорешения. Предлагается подход к групповому принятию решений с интуитивным отношением
предпочтений на основе процедур агрегирования. Рассматривается групповая модель принятия
решений и концепция нечеткого группового решения и лингвистические переменные, используе-
мые при прогнозировании чрезвычайной ситуации и планировании эвакуации. Отмечается, что
известные операторы упорядоченного взвешенного усреднения OWA, LOWA не учитывают веса
экспертов. Определяется оператор Low, позволяющий учесть весовые значения экспертов, а
также подход к определению нечеткого группового решения aFCS в качестве множества
типа 2. Представлены алгоритмы для определения нечеткого группового многокритериаль-
ного решения на основе aFCS -
АЛГОРИТМ КЛАСТЕРИЗАЦИИ ДАННЫХ ДЛЯ ЗАЩИТЫ КОНФИДЕНЦИАЛЬНОЙ ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ
И. С. Берешполов , Ю.А. Кравченко , А. Г. Слепцов2023-08-14Аннотация ▼Статья посвящена решению научной задачи защиты конфиденциальной информации
в сети Интернет на основе алгоритма кластеризации значительных объемов данных. За-
щита конфиденциальной информации компьютерной сети является актуальной темой для
исследований, особенно в связи с растущим использованием информационных технологий и
увеличением объема данных ценной информации, хранящейся в Интернете. С ростом ин-
формационной ответственности необходимость в эффективных методах информационной безопасности компьютерных сетей стала критически важной. В данной научной ста-
тье авторы предлагают решение задачи защиты конфиденциальной информации компью-
терных сетей на основе алгоритма кластеризации больших данных. Традиционные методы
обнаружения вторжений имеют такие ограничения, как способность работать только с
одно- или двумерными данными, а также имеют сильную зависимость от предваритель-
ных знаний. Авторы для устранения этих ограничений предлагают эвристический алго-
ритм обнаружения вторжений, который использует кластеризацию на основе облачной
модели. Предлагаемый алгоритм использует преимущества как маркированных, так и не-
маркированных образцов для кластеризации данных, тем самым уменьшая зависимость от
априорных знаний. Результаты вычислительного эксперимента, проведенного на предло-
женном алгоритме, сравнивались с несколькими каноническими алгоритмами обнаружения
вторжений. Результаты показали, что предложенный алгоритм улучшил производитель-
ность системы обнаружения вторжений, повысил точность обнаружения, снизил часто-
ту ложных тревог и усилил надежность системы. Метод динамического взвешивания,
используемый в алгоритме, устранил сложность высокоуровневой обработки данных и
позволил алгоритму самообучаться, что привело к формированию относительно стабиль-
ной облачной модели. Несмотря на значительное улучшение производительности предло-
женного алгоритма по сравнению с каноническими алгоритмами кластеризации, резуль-
таты исследования также показали, что у алгоритма есть некоторые ограничения, та-
кие как высокий процент ложных срабатываний и чувствительность к данным с опреде-
ленными видами распределения. Для устранения этих недостатков необходимо дальнейшее
усовершенствование алгоритма. В целом, предложенный эвристический алгоритм обна-
ружения вторжений с кластеризацией на основе облачной модели представляет собой
перспективное решение для защиты конфиденциальной информации компьютерных сетей. -
МОДЕЛЬ ОНТОЛОГИИ ЗНАНИЙ ДЛЯ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ ОБРАБОТКИ И АНАЛИЗА ТЕКСТОВ
Д.Ю. Кравченко2024-05-28Аннотация ▼Статья посвящена решению научной проблемы создания верхнеуровневого описания модели
онтологии знаний для интеллектуальных систем обработки и анализа текстов на естественном
языке, построенной на основе оригинальной компонентной архитектуры, обеспечивающей необ-
ходимый уровень детализации спецификаций анализируемой текстовой информации. Актуаль-
ность данной задачи обусловлена необходимостью развития теоретических основ построения
информационных моделей семантических зависимостей внутри текстов на естественном языке.
Автором даны определения основным терминам исследуемой предметной области. Представлена
формализованная постановка решаемой задачи. Проблема «информационного взрыва», причиной
возникновения которой стал экспоненциальный рост объемов цифровой информации, привела к
ситуации, когда до 95% информационного потока содержит неструктурированные данные.
В подобных условиях, крайне актуальной становится задача создания эффективных интеллекту-
альных систем поиска и приобретения знаний, в том числе, интеллектуальных систем обработки
и анализа текстов на естественном языке. Научным направлением решения этой частной задачи
является Text Mining (TM) – раскопка знаний в текстовой информации. В качестве примера при-
кладной задачи использования приобретенных знаний, в данном исследовании, рассматривается значимая проблема информационной поддержки процессов предупреждения и/или ликвидации по-
следствий чрезвычайных ситуаций. В данной задаче исходными данными являются потоки тек-
стовых сообщений (новостной информации, отчетов о техническом состоянии техногенных объ-
ектов, информации о природных явлениях и т.п.), поступающих в центры принятия решений, а на
выходе формируются прогностические оценки и/или конкретные инструкции относительно оцен-
ки ситуации и предпринимаемых действий определенными специалистами. Одной из причин,
сдерживающих развитие интеллектуальных систем обработки и анализа текста для решения
задач поиска, приобретения и использования знаний, является недостаточно высокий уровень эф-
фективности моделей и алгоритмов, обеспечивающих комплексное решение описанных выше задач
искусственного интеллекта с учетом особенностей семантики и контекста. -
АЛГОРИТМ ПОИСКА И ПРИОБРЕТЕНИЯ ЗНАНИЙ НА ОСНОВЕ ТЕХНОЛОГИЙ ОБРАБОТКИ И АНАЛИЗА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
Е.М. Герасименко , Ю.А. Кравченко , Д.А. Шаненко2024-11-10Аннотация ▼Статья посвящена решению актуальной научной проблемы повышения эффективности об-
работки и анализа текстовой информации при решении задач поиска и приобретения знаний. Ак-
туальность данной задачи связана с необходимостью создания эффективных средств обработки
накапливаемого огромного количества слабо структурированных данных, содержащих важные,
иногда скрытые знания, необходимые для построения эффективных систем управления сложны-
ми объектами различной природы. Предлагаемый автором алгоритм поиска и приобретения зна-
ний при обработке и анализе текстовой информации, отличается применением низкоуровневых
детерминированных правил, позволяющих провести качественное упрощение текста на основе
исключения из текстовой информации слов, инвариантных к смыслу. Алгоритм опирается на до-
менную проработку, позволяющую сформировать списки доменно-специфичных слов, что позволя-
ет обеспечить высокое качество упрощения текста. В данной задаче исходными данными явля-
ются потоки текстовой информации (описание профилей), извлеченных из онлайн платформ для
рекрутинга, выходная информация представляется предложениями, сформированными в виде
тройки «субъект-глагол-объект», отражающих гранулы знаний, полученных в процессе обработ-
ки текста. Использование данного порядка единиц, составляющих предложение, обусловлено тем
фактом, что данный порядок наиболее распространен в русском языке, хотя в самих текстах
возможны иные вариации порядка без потери общего смысла. Основная идея алгоритма заключа-
ется в разбиении большого корпуса текста на предложения с последующей фильтрацией получен-
ных предложений на основании введенных пользователем ключевых слов. В последствии предло-
жения разделяются на компоненты и упрощаются в зависимости от вида поступившей компо-
ненты (глагольная, именная). В качестве примера в данной работе использовалась сфера марке-
тинга, а ключевыми словами выступили «социальные сети». Автором разработан алгоритм поис-
ка и приобретения знаний на основе технологий обработки и анализа текстов на естественном
языке, а также была выполнена программная реализация предложенного алгоритма. В качестве
методов оценки эффективности использовался ряд метрик: индекс Флэша-Кинкейда; индекс Колман-Лиау; автоматический индекс удобочитаемости. Проведенные вычислительные эксперимен-
ты подтвердили эффективность предложенного алгоритма по сравнению с аналогами, исполь-
зующими нейронные сети для решение подобных задач -
РАЗРАБОТКА ЧАТ-БОТА ДЛЯ КЛАССИФИКАЦИИ И АНАЛИЗА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ С ИСПОЛЬЗОВАНИЕМ ЛОКАЛЬНЫХ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ
Али Махмуд Мансур , Жуман Хуссайн Мохаммад , Ю.А. Кравченко159-1712025-07-24Аннотация ▼Исследуются локальные большие языковые модели (Local large language models, Local LLM) и их применение в задачах классификации текста, а также проводится сравнение их производительности с традиционными методами. Статья предоставляет всесторонний обзор ряда ключевых локальных LLM, уделяя особое внимание их архитектурным преимуществам, характеристикам и областям применения. В частности, рассматриваются модели с различным количеством параметров, их способность адаптироваться к специализированным доменам, а также требования к вычислительным ресурсам при их развертывании на локальном оборудовании. Особый акцент делается на компромиссах между производительностью и эффективностью использования ресурсов. В качестве практического вклада разработан чат-бот, использующий локальные LLM (такие как DeepSeek, Gemma и Llama2 через Ollama) для классификации входящих текстов по заранее заданным категориям, демонстрируя работу этих моделей без использования облачных вычислений. Система реализована с модульной архитектурой, позволяющей легко интегрировать новые модели и сравнивать их эффективность. Вычислительный эксперимент включает оценку точности и скорости вывода локальных LLM в сравнении с более простыми методами, такими как Sentence-BERT, TF-IDF и BoWC, выделяя сценарии, в которых локальные модели превосходят традиционные подходы или уступают им. Тестирование проводилось на основе эталонного набора данных BBC. Результаты показывают, что языковые модели (включая модели с 7 миллиардами параметров) демонстрируют сильную и логически обоснованную классификационную производительность при обработке текстов на естественном языке, однако их результаты не являются идеальными для эталонных наборов данных. В частности, обнаружены случаи, когда все тестируемые модели, включая традиционные методы, ошибочно классифицировали документы, что указывает на возможные проблемы в разметке данных. Полученные результаты указывают на необходимость пересмотра эталонных меток в стандартных наборах данных. Это особенно важно для доменов с субъективными категориями, где экспертные оценки могут значительно расходиться. С другой стороны, хотя локальные LLM уступают облачным в скорости, их преимущества в конфиденциальности данных и оффлайн-работе делают их пригодными для специализированных задач.
-
ОПТИМИЗАЦИЯ ПИД-ПАРАМЕТРОВ СЕРВОСИСТЕМ С ИСПОЛЬЗОВАНИЕМ ГЕНЕТИЧЕСКОГО АЛГОРИТМА И НЕЙРОСЕТЕВОГО КЛАССИФИКАТОРА
Ахмад Зулфикар , Ю.А. Кравченко , А.М. Мансур237-2502025-10-01Аннотация ▼Алгоритмы машинного обучения играют жизненно важную роль в повышении производительности промышленных систем, обеспечивая высокую точность и операционную эффективность в режиме реального времени. В системах управления серводвигателями эти алгоритмы способствуют снижению шума и вибраций, что повышает эффективность работы и продлевает срок службы оборудования. В данной статье рассматриваются различные типы возникающих шумов и их негативное воздействие на промышленные процессы. Основной целью исследования является оптимизация параметров ПИД-регулятора (PID) в сервосистемах с использованием комбинированного алгоритма, сочетающего нейронные сети и генетические алгоритмы. В отличие от традиционных методов, таких как генетические алгоритмы (GA) и метод роя частиц (PSO), которые отличаются медленной сходимостью и риском повреждения двигателей, предложенное решение основано на программной платформе управления. Эта платформа обеспечивает безопасное взаимодействие с серводвигателем в режиме реального времени. Разработана система управления на основе CAN Bus, которая позволяет разработчикам: считывать все параметры серводвигателя (скорость, ток, напряжение, положение энкодера); изменять коэффициенты ПИД-регулятора одним нажатием, исключая необходимость ручной настройки, как в MOTO-MASTER. Применение разработанной системы управления позволило использовать обученный нейронный классификатор для ограничения параметров PID в безопасных пределах, что сокращает пространство поиска и ускоряет процесс оптимизации. Экспериментальные результаты на серводвигателях SPH-S показали значительное снижение шума и механических вибраций при работе в реальном времени, с сохранением стабильности в широком диапазоне скоростей (0–1500 об/мин).








