Найти
Результаты поиска
-
ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ В СИСТЕМАХ ОБРАБОТКИ ВИЗУАЛЬНОЙ ИНФОРМАЦИИ
О.Б. Лебедев , Р.И. Черкасов254-2762025-11-10Аннотация ▼Рассмотрено применение технологий искусственного интеллекта, в частности компьютерного зрения в системах обработки визуальной информации. Проведен комплексный анализ нейросетевых подходов к решению задач компьютерного зрения, включая систематизацию ключевых типов задач: классификацию изображений, детектирование объектов и семантическую сегментацию. Детально исследованы архитектурные принципы сверточных нейронных сетей с акцентом на механизмы извлечения пространственных признаков через сверточные слои, оптимизацию представления данных посредством операций пулинга и преобразование признаков в полносвязных слоях. Особое внимание уделено эволюции методов обнаружения объектов, где задача выбора модели рассмотрена как расширение классификации за счет интеграции регрессии пространственных координат, а также проведена оценка эффективности детекторов на основе метрик IoU, Precision, Recall и F1-score, демонстрирующих фундаментальный компромисс между точностью локализации и скоростью обработки. В качестве оптимального решения для систем реального времени представлен алгоритм YOLOv7, архитектура которого основана на разбиении входного изображения на сетку S×S ячеек с прямым предсказанием параметров ограничивающих рамок (координаты центра, ширина, высота) и вероятностей классов для каждой ячейки, а также использовании специализированных слоёв (SPP, PANet) для мультимасштабной агрегации признаков. Структура нейронной сети подтверждает эффективность используемого подхода, обеспечивающего высокое быстродействие без критического снижения точности в стратегически важных приложениях видеонаблюдения, автономных систем и дополненной реальности. Проведено сравнительное исследование одноэтапных и двухэтапных детекторов с оценкой их производительности по ключевым метрикам. Особое внимание уделено практическим аспектам применения технологий компьютерного зрения в реальных системах обработки визуальной информации
-
ДЕТЕКТИРОВАНИE ВЫБРОСОВ В МЕТОДЕ ПРЯМОЙ СТЕРЕО-ВИЗУАЛЬНОЙ ОДОМЕТРИИ НА БАЗЕ ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ
П. А. Пантелюк2021-07-18Аннотация ▼Представляется подход к стерео-визуальной одометрии без явного вычисления оп-
тического потока. Визуальная одометрия – метод получения навигационной информации
путем обработки последовательности кадров с бортовых камер. Существует два подхода
к обработке видеоинформации – используя хорошо локализуемые участки изображения –
признаковые точки и используя все высококонтрастные пиксели – прямой метод. Прямой
метод работает, используя интенсивности всех высококонтрастных пикселей изображе-
ния, что позволяет снизить вычислительную сложность, затраченную на поиск, описание,
сопоставление признаковых точек и повысить точность оценки движения. Однако мето-
ды подобного класса обладают недостатком – наличие движущихся объектов в кадре су-
щественно снижают точность оценки параметров движения. Для избегания этого приме-
няются методы детектирования выбросов. Классические методы детектирования выбро-
сов во входных данных, такие как RANSAC плохо применимы, и имеют высокие вычисли-
тельны затраты из-за вычислительно сложной функции рейтингования гипотез. Целью
данной работы является описание и демонстрация подхода детектирования выбросов на
базе алгоритма иерархической кластеризации, который выделяет статистически наибо-
лее вероятное решение, минуя этап рейтингования каждой гипотезы, что значительно
снижает вычислительную сложность. Для иерархической кластеризации предлагается
мера расстояния между гипотезами с низкой чувствительностью к ошибкам оценки пара-
метров движения. Также предлагается расширение алгоритма стерео-визуальной одо-
метрии для работы в более сложных условиях видимости благодаря переходу от интен-
сивностного представления изображения к многоканальному бинарному. Перевод изобра-
жения к многоканальному бинарному представлению дает инвариантность к изменениям
яркости изображения, однако, требует модификации алгоритмов нелинейной оптимиза-
ции для работы с бинарными дескрипторами. В результате работы показано, что пред-
ложенный алгоритм детектирования выбросов способен работать в реальном масштабе
времени на мобильных устройствах, и может служить менее ресурсоёмкой заменой алго-
ритма RANSAC в задачах визуальной одометрии и выселения оптического потока. Качест-
венные метрики предложенного решения демонстрируются на датасете KITTI. Приведе-
ны зависимости качества работы алгоритма от параметров алгоритма.








