Найти
Результаты поиска
-
ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ В СИСТЕМАХ ОБРАБОТКИ ВИЗУАЛЬНОЙ ИНФОРМАЦИИ
О.Б. Лебедев , Р.И. Черкасов254-2762025-11-10Аннотация ▼Рассмотрено применение технологий искусственного интеллекта, в частности компьютерного зрения в системах обработки визуальной информации. Проведен комплексный анализ нейросетевых подходов к решению задач компьютерного зрения, включая систематизацию ключевых типов задач: классификацию изображений, детектирование объектов и семантическую сегментацию. Детально исследованы архитектурные принципы сверточных нейронных сетей с акцентом на механизмы извлечения пространственных признаков через сверточные слои, оптимизацию представления данных посредством операций пулинга и преобразование признаков в полносвязных слоях. Особое внимание уделено эволюции методов обнаружения объектов, где задача выбора модели рассмотрена как расширение классификации за счет интеграции регрессии пространственных координат, а также проведена оценка эффективности детекторов на основе метрик IoU, Precision, Recall и F1-score, демонстрирующих фундаментальный компромисс между точностью локализации и скоростью обработки. В качестве оптимального решения для систем реального времени представлен алгоритм YOLOv7, архитектура которого основана на разбиении входного изображения на сетку S×S ячеек с прямым предсказанием параметров ограничивающих рамок (координаты центра, ширина, высота) и вероятностей классов для каждой ячейки, а также использовании специализированных слоёв (SPP, PANet) для мультимасштабной агрегации признаков. Структура нейронной сети подтверждает эффективность используемого подхода, обеспечивающего высокое быстродействие без критического снижения точности в стратегически важных приложениях видеонаблюдения, автономных систем и дополненной реальности. Проведено сравнительное исследование одноэтапных и двухэтапных детекторов с оценкой их производительности по ключевым метрикам. Особое внимание уделено практическим аспектам применения технологий компьютерного зрения в реальных системах обработки визуальной информации
-
АЛГОРИТМЫ ГЕНЕРАЦИИ И ОБРАБОТКИ SEM-ИЗОБРАЖЕНИЙ ДЛЯ ИДЕНТИФИКАЦИИ СВОЙСТВ БИОНЕОРГАНИЧЕСКИХ МАТРИЦ И МЕТОДЫ ИХ ВЕРИФИКАЦИИ
А.В. Полтавский , Д. С. Поляниченко , Е. Р. Коломенская , М. А. Бутакова2025-01-30Аннотация ▼Одним из распространенных методов анализа характеристик материалов, получаемых в ре-
зультате химического синтеза, является сканирующая электронная микроскопия (SEM), примене-
ние которой позволяет получить изображения с высоким разрешением и увеличением. В статье
исследуются алгоритмы анализа изображений материалов, обладающих определенными свойст-
вами (например, пористостью) – бионеорганических матриц. Пористые структуры представля-
ют собой обширный класс материалов с широкой областью применения, включая сельское хозяй-
ство, медицину, катализ и многое другое. Одна из важных сфер использования подобных структур
– тканевая инженерия, в которой подобные каркасы необходимы для обеспечения восстанови-
тельных процессов тканей организма. И для каждого организма матрицы должны быть персона-
лизированными, что требует выполнения трудоемкого процесса по подбору характеристик кар-
каса, применимого в конкретном случае. Эта задача в настоящее время частично решается при-
менением технологий искусственного интеллекта для повышения точности или поддержки при-
нятия решения во время изготовления или анализа матрицы. Однако, часть работы в этом процессе
все еще выполняется вручную и представляет из себя трудозатратную рутину для специалиста.
В частности, процесс анализа SEM-изображений с целью вычисления характеристик полученного
материала все еще представляет множество длительных этапов с использованием различных ин-
струментов. При этом такие характеристики как пористость, извилистость, диффузность явля-
ются очень важным фактором для эксперта в процессе принятия решения о применимости изго-
товленной бионеорганической матрицы в каждом конкретном случае. Соответственно целью дан-
ного исследования является разработка комплекса алгоритмов для полностью автоматической об-
работки SEM-изображений. Также, исходя из поставленной цели, в рамках исследования можно
выделить ряд задач: разработка алгоритмов для детекции объектов на изображении, разработка
модели нейронной сети для уточнения результатов детекции, реализация алгоритмов вычисления
характеристик пористого материала, а также проектирование и выполнение ряда верификацион-
ных испытаний для подтверждения качества выполненных вычислений. В результате проведенного
исследования мы сделали некоторые выводы. В частности, подход, использующий генерацию синте-
тических данных, может существенно ускорить и упросить процесс обучения нейронной сети, а
также повысить качество выходной модели. Далее мы заключили, что полученные алгоритмы мо-
гут полностью автоматизировать процесс анализа SEM-изображений с пористой структурой, а
качество вычислений подтвердили с помощью ряда верификационных тестов. Полученные алго-
ритмы могут быть распространены на другие аналогичные задачи, связанные с проблемами ана-
лиза изображений и выявления необходимых признаков и характеристик. -
РАЗРАБОТКА МОДЕЛИ СЕМАНТИЧЕСКОЙ СЕГМЕНТАЦИИ RTC-SAM ДЛЯ ОПРЕДЕЛЕНИЯ ПРЕПЯТСТВИЙ НА ПУТИ МОБИЛЬНОГО РОБОТА
В.Д. Матвеев , А. Е. Архипов , И. С. Фомин2025-04-27Аннотация ▼Задача определения препятствий перед мобильным роботом успешно и давно решена с примене-
нием лазерных и ультразвуковых датчиков. Однако, препятствия, не обнаруживаемые такими видами
датчиков, могут угрожать безопасности робота. Для их обнаружения в работе предлагается исполь-
зовать систему технического зрения (СТЗ), информацию с которой обрабатывает нейронная сеть
семантической сегментации, возвращающая маску препятствия на кадре и его класс. Основой для та-
кой сети стала сеть универсальной сегментации SAM, требующая доработки для применения к задаче
семантической сегментации. Особенность данной сети состоит в ее универсальной применимости, то
есть возможности выделения любых объектов в произвольных условиях съемки. При этом SAM не
предсказывает семантику объекта. В данной работе предложен дополнительный модуль, позволяю-
щий реализовать семантическую сегментацию за счет классификации признаков выделяемых объек-
тов. Обоснована возможность использования такого модуля для решения задачи дополнения выхода
сети новой информацией. Результат классификации далее поступает в тот же алгоритм фильтра-
ции, что и маски, чтобы гарантировать соответствие между полученным результатом универсаль-
ной сети и дополняющего модуля. После интеграции модуля с моделью получена новая модель семанти-
ческой сегментации, названная в работе RTC-SAM. С ее помощью проведена семантическая сегмента-
ция общедоступного набора данных с изображениями открытой местности. Полученный результат в
45 % по метрике IoU превосходит результат существующих методов на 13 %. Показанные в работе
изображения результатов применения новой сети позволяют убедиться в ее работоспособности.
Также описано тестирование разработанного решения с проведением исследования быстродействия
разработанной модели на ПК и мобильном вычислителе. Алгоритм на мобильном вычислителе показы-
вает недостаточную скорость для выхода в режим реального времени – больше 3,5 секунд на обра-
ботку одного кадра. В связи с этим, одно из направлений дальнейших исследований в области повыше-
ния быстродействия системы. -
ИНТЕЛЛЕКТУАЛЬНОЕ УПРАВЛЕНИЕ РОБОТОТЕХНИЧЕСКИМИ СРЕДСТВАМИ В ЗАДАЧЕ СЕГМЕНТАЦИИ НОР ГРЫЗУНОВ С ИСПОЛЬЗОВАНИЕМ ГЛУБОКИХ СВЕРТОЧНЫХ АРХИТЕКТУР
М.А. Астапова19-302025-04-27Аннотация ▼Исследуется применение нейросетевых архитектур для семантической сегментации нор
грызунов с целью мониторинга их популяции на сельскохозяйственных полях. В частности, рас-
сматриваются три модели для семантической сегментации: сверточный автокодировщик (САК),
SegNet и U-Net. Эти модели применяются для анализа изображений, полученных с беспилотных летательных аппаратов (БпЛА) и наземных роботизированных средств (РТС), что позволяет
автоматически выявлять норы, минимизируя необходимость в трудозатратах при обработке
больших объемов данных. Для обучения и тестирования моделей была подготовлена выборка,
включающая 247 RGB-изображений, содержащих 1098 размеченных нор. Оценка показателей ка-
чества семантической сегментации проводилась с использованием метрики Джаккара (IoU), в
результате чего были получены следующие значения: 0,511 для САК, 0,548 для SegNet и 0,529 для
U-Net. Была проведена оценка вычислительных ресурсов, необходимых для внедрения этих моделей
в бортовые вычислительные устройства (БВУ) мобильных РТС. Рассмотрены два критерия: ко-
личество операций с плавающей точкой (GFLOPS) и количество параметров моделей. Результа-
ты показали, что SegNet требует 2,23 GFLOPS и имеет 0,76 миллиона параметров, что в 2,58 и
2,33 раза меньше по сравнению с САК и U-Net соответственно. Количество операций с плавающей
точкой для SegNet также оказалось на 2,43 и 1,88 раза ниже, чем у САК и U-Net соответственно.
В результате, SegNet превзошла САК и U-Net как в эффективности сегментации, так и в требуе-
мых вычислительных ресурсах. Данная работа выполнялась в рамках реализации системы компь-
ютерного зрения сельскохозяйственной РТС.








