Найти
Результаты поиска
-
ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ В СИСТЕМАХ ОБРАБОТКИ ВИЗУАЛЬНОЙ ИНФОРМАЦИИ
О.Б. Лебедев , Р.И. Черкасов254-2762025-11-10Аннотация ▼Рассмотрено применение технологий искусственного интеллекта, в частности компьютерного зрения в системах обработки визуальной информации. Проведен комплексный анализ нейросетевых подходов к решению задач компьютерного зрения, включая систематизацию ключевых типов задач: классификацию изображений, детектирование объектов и семантическую сегментацию. Детально исследованы архитектурные принципы сверточных нейронных сетей с акцентом на механизмы извлечения пространственных признаков через сверточные слои, оптимизацию представления данных посредством операций пулинга и преобразование признаков в полносвязных слоях. Особое внимание уделено эволюции методов обнаружения объектов, где задача выбора модели рассмотрена как расширение классификации за счет интеграции регрессии пространственных координат, а также проведена оценка эффективности детекторов на основе метрик IoU, Precision, Recall и F1-score, демонстрирующих фундаментальный компромисс между точностью локализации и скоростью обработки. В качестве оптимального решения для систем реального времени представлен алгоритм YOLOv7, архитектура которого основана на разбиении входного изображения на сетку S×S ячеек с прямым предсказанием параметров ограничивающих рамок (координаты центра, ширина, высота) и вероятностей классов для каждой ячейки, а также использовании специализированных слоёв (SPP, PANet) для мультимасштабной агрегации признаков. Структура нейронной сети подтверждает эффективность используемого подхода, обеспечивающего высокое быстродействие без критического снижения точности в стратегически важных приложениях видеонаблюдения, автономных систем и дополненной реальности. Проведено сравнительное исследование одноэтапных и двухэтапных детекторов с оценкой их производительности по ключевым метрикам. Особое внимание уделено практическим аспектам применения технологий компьютерного зрения в реальных системах обработки визуальной информации
-
ИНТЕЛЛЕКТУАЛЬНОЕ УПРАВЛЕНИЕ РОБОТОТЕХНИЧЕСКИМИ СРЕДСТВАМИ В ЗАДАЧЕ СЕГМЕНТАЦИИ НОР ГРЫЗУНОВ С ИСПОЛЬЗОВАНИЕМ ГЛУБОКИХ СВЕРТОЧНЫХ АРХИТЕКТУР
М.А. Астапова19-302025-04-27Аннотация ▼Исследуется применение нейросетевых архитектур для семантической сегментации нор
грызунов с целью мониторинга их популяции на сельскохозяйственных полях. В частности, рас-
сматриваются три модели для семантической сегментации: сверточный автокодировщик (САК),
SegNet и U-Net. Эти модели применяются для анализа изображений, полученных с беспилотных летательных аппаратов (БпЛА) и наземных роботизированных средств (РТС), что позволяет
автоматически выявлять норы, минимизируя необходимость в трудозатратах при обработке
больших объемов данных. Для обучения и тестирования моделей была подготовлена выборка,
включающая 247 RGB-изображений, содержащих 1098 размеченных нор. Оценка показателей ка-
чества семантической сегментации проводилась с использованием метрики Джаккара (IoU), в
результате чего были получены следующие значения: 0,511 для САК, 0,548 для SegNet и 0,529 для
U-Net. Была проведена оценка вычислительных ресурсов, необходимых для внедрения этих моделей
в бортовые вычислительные устройства (БВУ) мобильных РТС. Рассмотрены два критерия: ко-
личество операций с плавающей точкой (GFLOPS) и количество параметров моделей. Результа-
ты показали, что SegNet требует 2,23 GFLOPS и имеет 0,76 миллиона параметров, что в 2,58 и
2,33 раза меньше по сравнению с САК и U-Net соответственно. Количество операций с плавающей
точкой для SegNet также оказалось на 2,43 и 1,88 раза ниже, чем у САК и U-Net соответственно.
В результате, SegNet превзошла САК и U-Net как в эффективности сегментации, так и в требуе-
мых вычислительных ресурсах. Данная работа выполнялась в рамках реализации системы компь-
ютерного зрения сельскохозяйственной РТС.








