НЕЙРОСЕТЕВОЙ АЛГОРИТМ ПОЛНОКАДРОВОГО РАСПОЗНАВАНИЯ НАДВОДНЫХ ОБЪЕКТОВ В РЕАЛЬНОМ ВРЕМЕНИ

  • В. А. Тупиков АО «Научно-производственное предприятие «Авиационная и морская электроника»
  • В. А. Павлова АО «Научно-производственное предприятие «Авиационная и морская электроника»
  • В. А. Бондаренко АО «Научно-производственное предприятие «Авиационная и морская электроника»
  • Н. Г. Холод АО «Научно-производственное предприятие «Авиационная и морская электроника»
Ключевые слова: Безэкипажное судовождение, автоматическое обнаружение и распознавание, искус-ственная нейронная сеть, базы данных образов

Аннотация

Исследованы современные нейросетевые архитектуры для осуществления автома-тического обнаружения и распознавания надводных объектов и препятствий заданных классов по всей области изображения, применимые к выполнению в реальном или условно реальном времени для задач оптоэлектронной системы технического зрения с целью ав-томатизации и повышения безопасности гражданского судовождения. Дана формальная постановка задачи автоматического обнаружения объектов на изображениях. Проанали-зирован текущий научно-исследовательский задел в области алгоритмов детектирования объектов на изображениях, основанных на искусственных свёрточных нейронных сетях, произведено их сравнение и сделан обоснованный выбор в пользу наиболее эффективной нейросетевой архитектуры по соотношению вычислительной сложности и точности распознавания. Исследованы имеющиеся в открытом доступе базы данных образов над-водных объектов, подходящие для применения при обучении алгоритмов с использованием искусственных нейронных сетей. Сделан вывод о недостаточности имеющихся данных для обучения нейросетевых алгоритмов, в результате чего авторами выполнен самостоятель-ный сбор исследовательских изображений и видеопоследовательностей, произведена под-готовка и разметка собранных данных, содержащих надводные объекты и иные препят-ствия, представляющие навигационную опасность для судов. На основе выбранной архи-тектуры разработан новый нейросетевой алгоритм автоматического обнаружения и распознавания надводных объектов, выполняемого по всей области изображения (т.е. пол-нокадрового), выполнено обучение искусственной нейронной сети по подготовленной базе данных образов типовых объектов. Полученный алгоритм протестирован авторами на валидационном наборе данных, произведена оценка качества его работы с помощью различных метрик, а также оценена производительность алгоритма. Сделаны выводы о необходимости расширения собранной базы данных образов типовых объектов, предложены дальнейшие шаги по повышению точности разработанного программно-алгоритмического комплекса и его внедрению в состав перспективной судовой оптоэлектронной системы технического зрения.

Литература

1. Goodfellow I., Bengio Y., Courville A. Deep Learning. MIT Press, 2016, 781 p.
2. Deng L. and Deep D.Yu. Learning: Methods and Applications, Foundations and Trends in Signal Processing, 2013, Vol. 7, No. 3–4, pp. 197-387.
3. Girshick R. Fast r-cnn, Proceedings of the IEEE international conference on computer vision, 2015, ppP. 1440-1448.
4. Ren S. et al. Faster r-cnn: Towards real-time object detection with region proposal networks, Advances in neural information processing systems, 2015, pp. 91-99.
5. Redmon J. et al. You only look once: Unified, real-time object detection, Proceedings of the IEEE conference on computer vision and pattern recognition, 2016, pp. 779-788.
6. Liu W. et al. Ssd: Single shot multibox detector, European conference on computer vision, Springer, Cham, 2016, pp. 21-37.
7. Ioffe S., Szegedy C. Batch normalization: Accelerating deep network training by reducing in-ternal covariate shift, arXiv preprint arXiv:1502.03167, 2015.
8. Szegedy C. et al. Scalable, high-quality object detection, ArXiv abs/1412.1441, 2015.
9. Zhou X., Wang D., Krähenbühl P. Objects as points, ArXiv abs/1904.07850, 2019.
10. Shao Z. et al. Seaships: A large-scale precisely annotated dataset for ship detection, IEEE Transactions on Multimedia, 2018, Vol. 20, No. 10, pp. 2593-2604.
11. Prasad D.K. et al. Video processing from electro-optical sensors for object detection and tracking in a maritime environment: a survey, IEEE Transactions on Intelligent Transportation Systems, 2017, Vol. 18, No. 8, pp. 1993-2016.
12. Crowston K. Amazon Mechanical Turk: A Research Tool for Organizations and Information Systems Scholars. In: Bhattacherjee A., Fitzgerald B. (eds) Shaping the Future of ICT Re-search. Methods and Approaches. IFIP Advances in Information and Communication Tech-nology. Vol. 389. Springer, Berlin, Heidelberg, 2012.
13. Yandex Toloka url: https://toloka.yandex.ru (accessed 18 February 2020).
14. Paszke A., Gross S., Massa F. and others. PyTorch: An Imperative Style, High Performance Deep Learning Library, Advances in Neural Information Processing Systems 32, Curran Asso-ciates, Inc., 2019, pp. 8024-8035.
15. Lin T.Y. et al. Focal loss for dense object detection, Proceedings of the IEEE international conference on computer vision, 2017, pp. 2980-2988.
16. He K. et al. Deep residual learning for image recognition, Proceedings of the IEEE conference on computer vision and pattern recognition, 2016, pp. 770-778.
17. Sandler M. et al. Mobilenetv2: Inverted residuals and linear bottlenecks, Proceedings of the IEEE conference on computer vision and pattern recognition, 2018, ppP. 4510-4520.
18. Lin T., Maire M., Belongie S.J., Bourdev L.D., Girshick R.B., Hays J., Perona P., Ramanan D., Dollár P. and Zitnick C.L. Microsoft COCO: Common Objects in Context, 2014. DOI: 10.1007/978-3-319-10602-1_48.
19. Deng J., Dong W., Socher R., Li L., Kai Li and Li Fei-Fei. ImageNet: A large-scale hierar-chical image database, 2009 IEEE Conference on Computer Vision and Pattern Recognition, Miami, FL, 2009, pp. 248-255.
20. Kingma D.P., Ba J. Adam: A method for stochastic optimization, arXiv preprint arXiv:1412.6980, 2014.
Опубликован
2020-07-10
Выпуск
Раздел
РАЗДЕЛ IV. СВЯЗЬ, НАВИГАЦИЯ И НАВЕДЕНИЕ