КОМПЛЕКСИРОВАНИЕ МОДЕЛЕЙ СЕГМЕНТАЦИИ, СОПРОВОЖДЕНИЯ И КЛАССИФИКАЦИИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ВИДЕОАНАЛИТИКИ

Авторы

  • А.Е. Архипов Государственный научный центр РФ – Федеральное госу- дарственное автономное научное учреждение «Центральный научно-исследовательский и опытно-конструкторский институт робототехники и технической кибернетики»
  • И.С. Фомин Государственный научный центр РФ – Федеральное госу- дарственное автономное научное учреждение «Центральный научно-исследовательский и опытно-конструкторский институт робототехники и технической кибернетики»
  • В.Д. Матвеев Государственный научный центр РФ – Федеральное госу- дарственное автономное научное учреждение «Центральный научно-исследовательский и опытно-конструкторский институт робототехники и технической кибернетики»

Ключевые слова:

Нейронные сети, сегментация, сопровождения, классификация, видеоаналитика, системы технического зрения

Аннотация

Комплексирование нескольких моделей в одну систему технического зрения позволит ре-
шать более сложные и комплексные задачи. В частности, для мобильной робототехники и
беспилотных летательных аппаратов (БЛА) является актуальной проблемой отсутствие на-
боров данных для различных условий. В работе в качестве решения данной проблемы предлага-
ется комплексирование нескольких моделей: сегментации, сопровождения и классификации.
Это позволит значительно повысить качество решения сложных задач без дополнительного
обучения. Модель сегментации позволяет выделять произвольные объекты из кадров, поэтому
ее можно использовать в недетерминированных и динамических средах. Модель классификации
позволяет определить необходимые для навигации объекты, которые затем сопровождаются
с помощью третей модели. В работе подробно описан алгоритм комплексирования моделей.
Ключевым элементом в алгоритме является коррекция предсказаний моделей, позволяющая
достаточно надежно сегментировать и сопровождать различные объекты. Процедура кор-
рекции предсказаний моделей решает следующие задачи: добавление новых объектов для сопро-
вождения, валидация сегментированных масок объектов и уточнение сопровождаемых масок.
Универсальность данного решения подтверждается работой в сложных условиях, на которых
не обучали модели, например, подводная съемка или изображения с БЛА. Проведено экспери-
ментальное исследование каждой из моделей в условиях открытой местности и в помещении.
Наборы данных включали сцены актуальные для мобильной робототехники. В частности, в
сценах присутствовали движущиеся объекты (человек, автомобиль) и возможные преграды на
пути робота. Для большинства классов метрики качества сегментации превышали 80 %. Ос-
новные ошибки связаны с размерами объектов. Проведенные эксперименты наглядно демонст-
рируют универсальность данного решения без дополнительного обучения моделей. Дополни-
тельно проведено исследование быстродействия на персональном компьютере с различными
входными параметрами и разрешением. Увеличение количества моделей значительно повыша-
ет вычислительную нагрузку и не достигает реального времени. Поэтому одним из направления
дальнейших исследований является повышение быстродействия системы

Библиографические ссылки

Загрузки

Опубликован

2024-04-16

Выпуск

Раздел

РАЗДЕЛ IV. ТЕХНИЧЕСКОЕ ЗРЕНИЕ