Найти
Результаты поиска
-
ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ В СИСТЕМАХ ОБРАБОТКИ ВИЗУАЛЬНОЙ ИНФОРМАЦИИ
О.Б. Лебедев , Р.И. Черкасов254-2762025-11-10Аннотация ▼Рассмотрено применение технологий искусственного интеллекта, в частности компьютерного зрения в системах обработки визуальной информации. Проведен комплексный анализ нейросетевых подходов к решению задач компьютерного зрения, включая систематизацию ключевых типов задач: классификацию изображений, детектирование объектов и семантическую сегментацию. Детально исследованы архитектурные принципы сверточных нейронных сетей с акцентом на механизмы извлечения пространственных признаков через сверточные слои, оптимизацию представления данных посредством операций пулинга и преобразование признаков в полносвязных слоях. Особое внимание уделено эволюции методов обнаружения объектов, где задача выбора модели рассмотрена как расширение классификации за счет интеграции регрессии пространственных координат, а также проведена оценка эффективности детекторов на основе метрик IoU, Precision, Recall и F1-score, демонстрирующих фундаментальный компромисс между точностью локализации и скоростью обработки. В качестве оптимального решения для систем реального времени представлен алгоритм YOLOv7, архитектура которого основана на разбиении входного изображения на сетку S×S ячеек с прямым предсказанием параметров ограничивающих рамок (координаты центра, ширина, высота) и вероятностей классов для каждой ячейки, а также использовании специализированных слоёв (SPP, PANet) для мультимасштабной агрегации признаков. Структура нейронной сети подтверждает эффективность используемого подхода, обеспечивающего высокое быстродействие без критического снижения точности в стратегически важных приложениях видеонаблюдения, автономных систем и дополненной реальности. Проведено сравнительное исследование одноэтапных и двухэтапных детекторов с оценкой их производительности по ключевым метрикам. Особое внимание уделено практическим аспектам применения технологий компьютерного зрения в реальных системах обработки визуальной информации
-
ИНТЕЛЛЕКТУАЛЬНОЕ УПРАВЛЕНИЕ РОБОТОТЕХНИЧЕСКИМИ СРЕДСТВАМИ В ЗАДАЧЕ СЕГМЕНТАЦИИ НОР ГРЫЗУНОВ С ИСПОЛЬЗОВАНИЕМ ГЛУБОКИХ СВЕРТОЧНЫХ АРХИТЕКТУР
М.А. Астапова19-302025-04-27Аннотация ▼Исследуется применение нейросетевых архитектур для семантической сегментации нор
грызунов с целью мониторинга их популяции на сельскохозяйственных полях. В частности, рас-
сматриваются три модели для семантической сегментации: сверточный автокодировщик (САК),
SegNet и U-Net. Эти модели применяются для анализа изображений, полученных с беспилотных летательных аппаратов (БпЛА) и наземных роботизированных средств (РТС), что позволяет
автоматически выявлять норы, минимизируя необходимость в трудозатратах при обработке
больших объемов данных. Для обучения и тестирования моделей была подготовлена выборка,
включающая 247 RGB-изображений, содержащих 1098 размеченных нор. Оценка показателей ка-
чества семантической сегментации проводилась с использованием метрики Джаккара (IoU), в
результате чего были получены следующие значения: 0,511 для САК, 0,548 для SegNet и 0,529 для
U-Net. Была проведена оценка вычислительных ресурсов, необходимых для внедрения этих моделей
в бортовые вычислительные устройства (БВУ) мобильных РТС. Рассмотрены два критерия: ко-
личество операций с плавающей точкой (GFLOPS) и количество параметров моделей. Результа-
ты показали, что SegNet требует 2,23 GFLOPS и имеет 0,76 миллиона параметров, что в 2,58 и
2,33 раза меньше по сравнению с САК и U-Net соответственно. Количество операций с плавающей
точкой для SegNet также оказалось на 2,43 и 1,88 раза ниже, чем у САК и U-Net соответственно.
В результате, SegNet превзошла САК и U-Net как в эффективности сегментации, так и в требуе-
мых вычислительных ресурсах. Данная работа выполнялась в рамках реализации системы компь-
ютерного зрения сельскохозяйственной РТС. -
РАЗРАБОТКА МОДЕЛИ СЕМАНТИЧЕСКОЙ СЕГМЕНТАЦИИ RTC-SAM ДЛЯ ОПРЕДЕЛЕНИЯ ПРЕПЯТСТВИЙ НА ПУТИ МОБИЛЬНОГО РОБОТА
В.Д. Матвеев , А. Е. Архипов , И. С. Фомин2025-04-27Аннотация ▼Задача определения препятствий перед мобильным роботом успешно и давно решена с примене-
нием лазерных и ультразвуковых датчиков. Однако, препятствия, не обнаруживаемые такими видами
датчиков, могут угрожать безопасности робота. Для их обнаружения в работе предлагается исполь-
зовать систему технического зрения (СТЗ), информацию с которой обрабатывает нейронная сеть
семантической сегментации, возвращающая маску препятствия на кадре и его класс. Основой для та-
кой сети стала сеть универсальной сегментации SAM, требующая доработки для применения к задаче
семантической сегментации. Особенность данной сети состоит в ее универсальной применимости, то
есть возможности выделения любых объектов в произвольных условиях съемки. При этом SAM не
предсказывает семантику объекта. В данной работе предложен дополнительный модуль, позволяю-
щий реализовать семантическую сегментацию за счет классификации признаков выделяемых объек-
тов. Обоснована возможность использования такого модуля для решения задачи дополнения выхода
сети новой информацией. Результат классификации далее поступает в тот же алгоритм фильтра-
ции, что и маски, чтобы гарантировать соответствие между полученным результатом универсаль-
ной сети и дополняющего модуля. После интеграции модуля с моделью получена новая модель семанти-
ческой сегментации, названная в работе RTC-SAM. С ее помощью проведена семантическая сегмента-
ция общедоступного набора данных с изображениями открытой местности. Полученный результат в
45 % по метрике IoU превосходит результат существующих методов на 13 %. Показанные в работе
изображения результатов применения новой сети позволяют убедиться в ее работоспособности.
Также описано тестирование разработанного решения с проведением исследования быстродействия
разработанной модели на ПК и мобильном вычислителе. Алгоритм на мобильном вычислителе показы-
вает недостаточную скорость для выхода в режим реального времени – больше 3,5 секунд на обра-
ботку одного кадра. В связи с этим, одно из направлений дальнейших исследований в области повыше-
ния быстродействия системы.








