Найти
Результаты поиска
-
ИССЛЕДОВАНИЕ ИНТЕЛЛЕКТУАЛЬНОГО АДАПТИВНОГО АЛГОРИТМА УПРАВЛЕНИЯ НА БАЗЕ МЕТОДА ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ
А. Н. Карапеев , Е.Ю. Косенко , М. Ю. Медведев , В. Х. Пшихопов2025-04-27Аннотация ▼Предложен и исследован алгоритм адаптивного управления двигателем постоянного тока,
базирующийся на применении технологии машинного обучения с подкреплением. Дан обзор и крат-
кий анализ состояния дел в области интеллектуальных систем управления приводами. Представ-
лено математическое описание двигателя, приведена структурная схема обучения интеллекту-
ального агента. Предложена интеллектуальная система адаптивного управления скоростью
вращения двигателя, при построении которой двигатель представляется в виде черного ящика с
заданными ограничениями на вход и выход. Система управления строится на базе алгоритма
Q-обучения нулевого порядка. Предполагается, что выходом интеллектуального агента является
управление, подаваемое на вход двигателя. Экспериментальным путем подобрано множество
таких управлений, позволяющих реализовать заданную точность поддержания частоты враще-
ния. В интеллектуальной системе используются приближенные табличные оценки ценности каж-
дого из управлений в зависимости от желаемой и текущей частоты вращения двигателя. В на-
стоящей статье проведено исследование влияния дискретности представления значений состоя-
ния, используемого множества управляющих воздействий, применяемых вознаграждений, а так-
же параметров алгоритма обучения на ошибку управления. Исследована чувствительность ин-
теллектуальной системы управления к изменению параметров моделируемого двигателя и не из-
меряемому моменту сопротивления на валу двигателя. По результатам проведенного исследова-
ния сделан вывод о необходимости использования модифицированного алгоритма, в котором
предполагается измерение или оценка тока статорной обмотки двигателя и использование непре-
рывного упарвления. В данной постановке задачи алгоритм управления обеспечивает робастность
к переменным параметрам и внешнему возмущению. Также обсуждаются вопросы аппроксимации
функции ценности управления с помощью полиномов и с применением нейронной сети. Показана
возможность высокой точности аппроксимации с помощью нейронной сети простой структуры








