Найти
Результаты поиска
-
МЕТРИКИ ОЦЕНКИ АЛГОРИТМОВ АВТОМАТИЧЕСКОГО СОПРОВОЖДЕНИЯ
А. Е. Щелкунов, В. В. Ковалев, К.И. Морев, И. В. Сидько2020-07-10Аннотация ▼Работа посвящена обзору существующих метрик для оценки качества выполнения задачи сопровождения объектов на видео различными алгоритмами. При оценке алгоритмов сопро-вождения для последующего их сравнения недостаточно использовать одну метрику, а следует оценивать алгоритмы по набору различных независимых оценок. С этой целью было проведено исследование существующих метрик оценки алгоритмов, результаты которого приведены в статье. В обзоре участвует множество различных подходов к оценке алгоритмов. Например, подходы основанные на оценке определения центра объекта сопровождения, которые являют-ся одними из первых и популярных до сих пор метрик оценки алгоритмов сопровождения. К основным недостаткам таких подходов можно отнести сложность определения истинного центра объекта, а также интерпретация оценок при различных размерах объекта. Для устра-нения этих недостатков в статье вводится новая метрика: несмещенная (оконная) ошибка определения центра объекта, которая учитывает постоянную составляющую ошибки опреде-ления центра. К другим подходам можно отнести метрики, основанные на анализе коэффици-ента Жаккара. Так же в статье рассмотрены подходы, основанные на анализе сбоев сопровождения, в которых учитывается длина сопровождения и интенсивность отказов. Предложен новый метод оценки алгоритмов при потере визуального контакта с сопровождаемым объектом, учитывающий количество кадров в которых был потерян визуальный контакт с объек-том. В ходе исследования были рассмотрены подходы оценки алгоритмов одновременного сопровождения нескольких объектов. Были предложены интегральные метрики, задача которых получение комплексной оценки алгоритма сопровождения. Для формирования комплексной оценки желательно использование различных некоррелированных метрик. Комплексные оценки предоставляют возможность сравнивать алгоритмы между собой. В качестве комплексной оценки в статье предлагается использование метрики, объединяющей точность и устойчивость алгоритма. Как правило, в качестве метрики точности используется коэффициент Жаккара, однако для задач где точность сопровождения центра объекта является основопола-гающей, авторами предлагается использовать в качестве метрики точности несмещенную ошибку определения центра.
-
АЛГОРИТМ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ВИДЕОИЗОБРАЖЕНИЙ ДЛЯ ПОВЫШЕНИЯ ТОЧНОСТИ ОБНАРУЖЕНИЯ МАЛОРАЗМЕРНЫХ ОБРАЗОВ
В. В. Ковалев , Н. Е. Сергеев2021-12-24Аннотация ▼Распознавание определенных образов в видеоизображениях, снятой камерой, осуще-
ствляется с помощью методов обучения на основе сверточных нейронных сетей. Чем
больше количество образов с множеством признаков и разнообразнее обучающая выборка
видеоизображений, тем лучше сверточные нейронные сети извлекают признаки из после-
довательности видеоизображений, которые не были включены в обучающую выборку. Это
является следствием повышения точности обнаружения визуальных образов на видеоизоб-
ражениях, содержащих признаки целевых образов. Однако, существуют ограничения в
улучшении характеристик обнаружения, когда размеры образа, который нужно обнару-
жить, значительно меньше, чем область фона или, когда образ описан малым количеством
информации. Для решения проблем подобного рода авторами статьи разработан алго-
ритм пространственно-временного комплексирования информации о движении динамиче-
ских образов. Алгоритм обрабатывает фиксированное количество видеоизображений в
определенные моменты времени и извлекает новые независимые признаки движения дина-
мических образов на основе пространственно-временной обработки видеоизображений.
Далее объединяет новые локальные признаки движения с исходными признакам видеоизоб-
ражения. Это позволяет добавить признак движения динамических образов с сохранением
исходных признаков изображения, описывающих статичные образы. Области видеоизоб-
ражения, характеризующие признак движения, отображаются «цветным» кластером.
Применение предварительной обработки направлено на повышение точности обнаруже-
ния образов при условии наличия динамических визуальных образов на статичном заднем
фоне. Если камера работает в режиме сканирования, то статичный задний фон можно
обеспечить стабилизатором видеоизображений. Экспериментальным путем получены
оценки интегральных критериев точности детекционных нейросетевых алгоритмов, пока-
зывающие увеличение в точности обнаружения визуальных образов с применением алго-
ритма пространственно-временного комплексирования информации о движении. -
УСКОРЕНИЕ ПРЯМОГО ПРОХОДА ПРИ РЕАЛИЗАЦИИ СНС НА ОГРАНИЧЕННОМ ВЫЧИСЛИТЕЛЬНОМ РЕСУРСЕ
А.Е. Щелкунов , В.В. Ковалев , И. В. Сидько , Н. Е. Сергеев2022-04-21Аннотация ▼Работа посвящена оптимизации архитектуры нейронной сети для ее запуска на ограни-
ченном вычислительном ресурсе. Рассмотрено несколько подходов оптимизации, приведены
оценки сложности и времени выполнения прямого прохода нейронной сети. Приведены сравни-
тельные оценки сложности сети при применении разных подходов оптимизации. В работе
представлен анализ выбранной архитектуры сети, получены оценки вычислительной сложно-
сти отдельных составных частей (модулей) архитектуры. Произведен анализ возможных ме-
тодов оптимизации каждого модуля. Описаны параметры рассмотренных модулей, размеры
входных и выходных тензоров. Для оптимизации модуля выделения признаков протестировано
несколько архитектур, ResNet 50, ResNet 18, MobileNet v3 small, MobileNet v3 large. Представлен
сравнительный анализ вычислительной сложности и времени выполнения прямого прохода для
каждой архитектуры. Замеры времени выполнения прямого прохода осуществлялись на
встраиваемом вычислительном устройстве Jetson AGX Xaver от компании Nvidia. Представле-
ны оценки времени выполнения прямого прохода для каждого модуля рассматриваемых нейрон-
ных сетей. В работе приведены результаты сравнения оценок точности нейронной сети до и
после оптимизации архитектуры. Набор данных для тестирования состоит из 100 видео запи-
сей. В тестовых видеозаписях участвует 5 различных типовых объектов, для каждого класса
объекта записано 10 различных сценариев. Для каждой из разработанных архитектур получе-
ны оценки точности, произведен сравнительный анализ. В работе намечены пути для после-
дующей оптимизации архитектуры сети. -
АЛГОРИТМ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ ДЛЯ СНИЖЕНИЯ ВЕРОЯТНОСТИ ПЕРЕОБУЧЕНИЯ СВЁРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ НА НЕЙРОННОМ УСКОРИТЕЛЕ
В.В. Ковалев2024-11-10Аннотация ▼Основной объём требований в системах раннего обнаружения объектов предъявляется к
производительности алгоритмов цифровой обработки изображений, которые реализуются на
встраиваемых устройствах с ограниченным вычислительным ресурсом. В задаче раннего обнару-
жения объекты на изображениях представлены малым количеством пикселей. Поэтому чтобы
обеспечить требуемые характеристики точности алгоритмов поиска и распознавания объектов
на изображениях применяют алгоритмы предварительной обработки последовательности видео-
кадров для расширения исходного признакового пространства. Обработка изображений высокого
разрешения алгоритмами предварительной обработки изображений приводит к неприемлемой
временной задержке выполнения алгоритма и является «узким местом» всего алгоритма. В рабо-
те предложен алгоритм предварительной обработки последовательности видеокадров для ней-
ронного ускорителя с целью расширения признакового пространства, который позволяет увели-
чить скорость обработки данных. Это достигается за счет слияний алгоритма предварительной
обработки изображений с экстрактором признаков свёрточной нейронной сети и переносом вы-
полнения нового экстрактора признаков на вычислительные мощности нейронного ускорителя.
Произведена апробация разработанного алгоритма путём проведения вычислительного экспери-
мента. На вычислительных устройствах NVIDIA Jetson и Rockchip реализован алгоритм предва-
рительной обработки дважды на центральном процессоре и нейронном ускорителе, согласно раз-
работанному алгоритму. Получены оценки времени выполнения алгоритмов, которые показыва-
ют, что предложенный алгоритм предварительной обработки изображений для нейронного уско-
рителя позволяет увеличить скорость обработки данных в 1.4–4 раз в зависимости от типа раз-
рядности вычислений. Однако, переход к целочисленному типу вычислений модели СНС с модифи-
цированным экстрактором признаков приводит к снижению метрики Mean Average Precision на
5–19.4%, характеризующей интегральную среднюю точность поиска и распознавания объектов на
изображениях. -
РАСШИРЕНИЕ ПРИЗНАКОВОГО ПРОСТРАНСТВА В ЗАДАЧЕ ПОИСКА И РАСПОЗНАВАНИЯ МАЛОРАЗМЕРНЫХ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ
В. В. Ковалев , Н.E. Сергеев2024-04-16Аннотация ▼Одним из актуальных направлений при создании систем раннего обнаружения объектов
является разработка алгоритмов поиска и распознавания малоразмерных объектов на изобра-
жениях. В задаче раннего обнаружения приходится распознавать объекты на дальних рас-
стояниях от места их фиксации камерой. Образ на изображении таких объектов представлен
малой компактной группой пикселей, которая претерпевает пространственные и яркостные
изменения от кадра к кадру. Для успешного решения этой задачи целевые объекты реального
мира должны иметь большие физические размеры. Кроме физических размеров объекта на
образ объекта на изображении влияют большое количество факторов: разрешение матрицы
камеры, фокусное расстояние объектива, светочувствительность матрицы и др. Вектор ре-
шения такой задачи направлен в сторону сверточных нейронных сетей. Однако, даже у передо-
вых архитектур сверточных нейронных сетей поиск и распознавание малоразмерных объектов
на изображениях вызывает трудности. Эта проблема напрямую связана с эффектом переобу-
чения модели нейронной сети. Переобучение модели нейронной сети можно оценить на основе
анализа кривых обучения. Для снижения вероятности переобучения применяют специальные
методы, которые объединяет термин регуляризация. Однако, в распознавании малоразмерных
объектов существующих методов регуляризации бывает недостаточно. В работе произведено
исследование разработанного алгоритма предварительной обработки последовательности
видеокадров, увеличивающего исходное пространство признаков новым независимым признаком
движения в кадре. Алгоритм предварительной обработки основан на пространственно-
временной фильтрации последовательности видеокадров, применение которого распространя-
ется на широкий спектр архитектур сверточных нейронных сетей. Для исследования характе-
ристик точности и распознавания сверточных нейронных сетей сформированы датасеты
изображений в градациях серого и изображений с признаком движения на основе среды разра-
ботки 3D графики Unreal Engine 5. В работе приведен критерий малоразмерности объектов на
изображениях. Произведено обучение и оценка характеристик точности тестовой модели
сверточной нейронной сети и анализ динамики кривых обучения тестовой модели. Показано
положительное влияние предложенного алгоритма предварительной обработки последова-
тельности видеокадров на интегральную точность обнаружения малоразмерных объектов -
ИНТЕГРАЛЬНЫЙ ВЫПРЯМИТЕЛЬ-УМНОЖИТЕЛЬ НАПРЯЖЕНИЯ ДЛЯ ПИТАНИЯ МАЛОМОЩНЫХ БЕСПРОВОДНЫХ ПАССИВНЫХ МИКРОУСТРОЙСТВ
А.С. Синюкин , Б. Г. Коноплев , А.В. Ковалев2023-10-23Аннотация ▼В связи с активным развитием технологий автоматизации и их широким внедрением
в логистику, торговлю, промышленность, строительство и другие отрасли экономики все
большее распространение за счет своего удобства и доступности получают беспроводные
системы. Чаще всего в них используются миниатюрные устройства, способные выполнять
операции по идентификации, измерению параметров внешней среды, приему и передаче
сигналов. В свою очередь, существует ряд областей, в которых использование батарейных
микроустройств ограничено, поскольку замена разрядившейся батареи не всегда осущест-
вима и целесообразна, к тому же стоимость активных устройств относительно высока.
В таких приложениях могут применяться пассивные устройства, получающие энергию для
работы посредством принимаемого антенной радиочастотного излучения из окружающе-
го пространства. Для массового производства подобных недорогих устройств требуется
интегральное исполнение микросхемы, ключевым модулем источника питания которой
является выпрямитель напряжения с функцией умножения. В работе представлены ре-
зультаты разработки интегральных выпрямителей-умножителей напряжения по типо-
вым КМОП-технологиям CM018G 180 нм и HCMOS8D 180 нм в САПР Cadence IC. Рас-
смотрена степень влияния порогового напряжения и числа каскадов на выходные характе-
ристики умножителей. Показано, что в восьмикаскадном умножителе, построенном по
технологии HCMOS8D, уровень выходного напряжения 2 В, необходимый для питания мик-
росхемы беспроводного устройства, достигается при амплитуде входного напряжения
375 мВ, а в умножителе на шестнадцати каскадах - при амплитуде 300 мВ. Предлагаемые
выпрямители-умножители могут быть использованы при построении источников пита-
ния беспроводных пассивных устройств. -
РЕАЛИЗАЦИЯ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ НА ВСТРАИВАЕМЫХ УСТРОЙСТВАХ С ОГРАНИЧЕННЫМ ВЫЧИСЛИТЕЛЬНЫМ РЕСУРСОМ
В. В. Ковалев , Н.Е. Сергеев2022-01-31Аннотация ▼Большие объемы видеоданных, фиксируемые сенсорными датчиками в различных спек-
тральных диапазонах, существенные размеры архитектур сверточных нейронных сетей
создают проблемы с реализацией нейросетевых алгоритмов на периферийных устройствах
из-за значительных ограничений вычислительных ресурсов на встраиваемых вычислительных
устройствах. В статье рассмотрено применение алгоритмов автоматического поиска и
распознавания образов на основе методов машинного обучения, реализованных на встраивае-
мых устройствах с вычислительным ресурсом Graphics Processing Unit. В качестве алгорит-
ма поиска и распознавания образов используются детекционные сверточные нейронные сети
«You Only Look Once V3» и «You Only Look Once V3-Tiny», которые реализованы на встраи-
ваемых вычислительных устройствах линейки NVIDIA Jetson, находящиеся в разном ценовом
диапазоне и с различным вычислительным ресурсом. Также в работе экспериментальным
путем вычислены оценки алгоритмов на встраиваемых устройствах по таким показателям,
как потребляемая мощность, время прямого прохода сверточнной нейронной сети и точ-
ность обнаружения. На основе решений реализованных, как на аппаратном уровне, так и на
программном, представляющихся компанией NVIDIA становится возможным применение
глубоких нейросетевых алгоритмов на основе операции свертка в режиме реального времени.
Рассмотрены методы оптимизации вычислений, предлагаемые компанией NVIDIA. Произве-
дены экспериментальное исследования влияния вычислений с пониженной точностью на ско-
рость работы и точность обнаружения объектов на изображениях, исследуемых архитек-
тур сверточных нейронных сетей, которые были предварительно обучены на выборке изо-
бражений состоящей из датасетов PASCAL VOC 2007 и PASCAL VOC 2012








