Найти
Результаты поиска
-
МОДЕЛЬ МАШИННОГО ОБУЧЕНИЯ УКЛОНЕНИЯ РОЯ ОТ ВОЗДЕЙСТВИЯ АНТОГОНИСТИЧЕСКОЙ СРЕДЫ
В.К. Абросимов , Г.А. Долгов , Е. С. Михайлова6-192025-04-27Аннотация ▼Одним из приоритетных направлений теории группового управления на близлежащую перспективу является роевое управление группами малых беспилотных летательных аппаратов – микро-, мини- и нано- классов, выполняющих коллективную задачу в условиях воздействия противника. Здесь сталкиваются две антагонистические стратегии-минимизации потерь с точки зрения атакующего
роя и максимизации таких потерь с точки зрения системы обороны. Цель исследования: разработка
подхода к решению практической задачи – проникновения роя беспилотных летательных аппаратов на
охраняемый системой обороны объект. Задачи исследования заключались в анализе характеристик
факторов, влияющих на процессы обнаружения, сопровождения, распознавания намерений роя систе-
мой обороны и разработка модели машинного обучения создания пространственно-временных форма-
ций, минимизирующих число пораженных системой обороны элементов роя. В качестве основных па-
раметров системы обороны выделены дальность обнаружения и продолжительность распознавания
роя, время на принятие решения по действиям роя, размер зоны поражения средств обороны. В каче-
стве метода исследования выбран метод машинного обучения на сверточных нейронных сетях с под-
креплением. Эффект противодействия системе обороны создается за счет динамичности роя; он
может активно маневрировать, создавая в процессе осуществления миссии пространственно-
временные маневры. Для моделирования ситуации «Рой vs Система обороны» вводится агент роя (ней-
ронная сеть с архитектурой трансформер, которая инициирует формации роя) и агент системы обо-
роны, которая распознает рой и атакует его, создавая зону поражения в условном центре масс роя.
Рой руководствуется стохастическим правилом, предлагая системе обороны (среде) отреагировать
на его маневр. Среда отвечает атакой роя, образуя поражающий фактор в той точке, в которой
предположительно окажется рой или основная часть роя. Наградой стратегии роя выступает число
неуничтоженных объектов в условиях выполнения ограничений; для системы обороны эта «награда»
выступает как «наказание». В процессе машинного обучения установлено интересное явление: каждый
элемент роя, оставаясь в рамках заданного пространства и реализуя биологические принципы роевого
управления без Лидера самостоятельно уклоняется от области поражения, что в совокупности созда-
ет случайную для средств обороны пространственно-временную формацию с минимальными потерями
элементов роя. Таким образом, методом машинного обучения с подкреплением создана модель, позво-
ляющая варьировать поведением роя и синтезировать пространственно-временных формации, за-
трудняющие обнаружение, сопровождение, распознавание намерений и принятие решений по воздей-
ствию системы обороны на рой атакующих малых беспилотных летательных аппаратов, а также
существенно снизить их потери -
СРАВНИТЕЛЬНЫЙ АНАЛИЗ ЦЕНТРАЛИЗОВАННОГО И ДЕЦЕНТРАЛИЗОВАННОГО АЛГОРИТМОВ ДВИЖЕНИЯ СТРОЕМ БЛА МУЛЬТИКОПТЕРНОГО ТИПА
М.Ю. Медведев , В. Х. Пшихопов2022-04-21Аннотация ▼Развитие робототехнических комплексов делает актуальным их групповое примене-
ние для решения различных задач. Эффективность выполнения задач обнаружения и опре-
деления координат объектов группой роботов существенно зависит от точности под-
держания заданного строя. В этой связи практический интерес представляет задача оп-
ределения алгоритмов планирования движения, обеспечивающих наибольшую точности
поддержания заданного строя. Данная статья посвящена исследованию точности под-
держания строя группой БЛА мультикоптерного типа с использованием централизованно-
го алгоритма планирования движения и децентрализованного алгоритма. В централизо-
ванном алгоритме используется ведущий БЛА, который передает свои координаты ведо-
мым БЛА. На основании полученных координат и заданной структуре строя ведомые БЛА
планируют свое движение. В децентрализованной систем соседние БЛА группы передают
свои координаты друг другу, на основании чего планируется движение отдельного БЛА.
Точность исследуется в зависимости от погрешностей навигационной системы и часто-
ты обновления данных о положении ведущего или соседних БЛА. Полагается, что БЛА
группы в дискретные моменты времени определяют свои координаты, используя внешнюю
навигационную систему. Централизованный и децентрализованный алгоритмы отрабаты-
ваются одинаковой системой управления движением. Алгоритмы исследуются в данной
статье методами численного моделирования. В процессе моделирования учитываются
модели кинематики, динамики и исполнительных механизмов, а также модели формирова-
ния погрешностей навигационной системы. Показано, что децентрализованный алгоритм
группового планирования движения обеспечивает более высокую точность по сравнению с
централизованным алгоритмом. Однако техническая реализация децентрализованного
алгоритма более сложна с точки зрения организации системы групповой связи. В центра-
лизованной систем должна быть реализована передача данных от ведущего БЛА ведомым.
В децентрализованной системе требуется реализовать сетевую связь.








