МОДУЛЬ КОРРЕКТИРОВКИ ПАРАМЕТРОВ АЛГОРИТМОВ АВТОМАТИЧЕСКОГО ОБНАРУЖЕНИЯ И СОПРОВОЖДЕНИЯ ОБЪЕКТОВ ДЛЯ ОПТИКО-ЭЛЕКТРОННЫХ СИСТЕМ

  • В. А. Тупиков АО «Научно-производственное предприятие «Авиационная и морская электроника»
  • В. А. Павлова АО «Научно-производственное предприятие «Авиационная и морская электроника»
  • А.И. Лизин АО «Научно-производственное предприятие «Авиационная и морская электроника»
  • П.А. Гессен АО «Научно-производственное предприятие «Авиационная и морская электроника»
Ключевые слова: Автоматическое обнаружение, обучение на лету, метод опорных векторов, гисто- грамма направленных градиентов, кластеризация, автоматическое сопровождение

Аннотация

В целях создания инновационного модуля автоматической корректировки алгорит-
мов автоматического обнаружения и сопровождения объектов с обучением в реальном
времени произведено исследование мирового опыта в области автоматического сопрово-
ждения общего назначения с возможностью распознавания объекта сопровождения для
применения во встраиваемых вычислительных устройствах оптико-электронных систем
перспективных робототехнических комплексов. На основе проведенных исследований ото-
браны и протестированы методы и подходы, которые позволяют с наибольшей точно-
стью, при сохранении высокой вычислительной эффективности, обеспечивать обучение
классификаторов на лету (online learning) без априорного знания о типе объекта слежения
и обеспечивать последующую корректировку во время слежения и обнаружение исходного
объекта в случае его кратковременной потери. В число таких способов входит гисто-
грамма направленных градиентов – дескриптор ключевых признаков, основывающийся на
анализе распределения градиентов яркости изображения объекта. Его использование по-
зволяет сократить количество используемой информации без потери ключевых данных об
объекте и увеличить скорость обработки изображений. В статье обоснован выбор одного
из алгоритмов классификации в режиме реального времени, позволяющего решить задачу
бинарной классификации – метода опорных векторов. В виду высокой скорости обработки
данных и необходимости небольшого количества исходных обучающих данных для по-
строения разделяющей гиперплоскости, на основе которой и происходит классификация
объектов, данный метод выбран как наиболее подходящий для решения поставленной за-
дачи. Для осуществления online-обучения была выбрана модификация метода опорных
векторов, реализующая стохастический градиентный спуск на каждом шаге работы алго-
ритма – Pegasos. Еще одним вспомогательным способом является метод кластеризации
ключевых точек – таким образом обеспечивается ускоренный выбор объектов для обуче-
ния и классификации. Авторами исследования проведена разработка и полунатурное моде-
лирование предлагаемого модуля, проведена оценка эффективности его работы в задачах
корректировки и обнаружения объекта интереса в режиме реального времени с предвари-
тельным online-обучением в процессе слежения за объектом. Разработанный алгоритм
показал высокую эффективность при решении поставленной задачи. В заключении пред-
ставлены предложения по дальнейшему повышению точности и вероятности обнаруже-
ния объекта интереса разработанным алгоритмом, а также по повышению его произво-
дительности путем оптимизации вычислений.

Литература

1. Bertinetto L., Valmadre J., Henriques J.F., Vedaldi A., Torr P.H.S. Fully-Convolutional Siamese
Networks for Object Tracking, In: Hua G., Jégou H. (eds), Computer Vision – ECCV
2016 Workshops: Lecture Notes in Computer Science. Springer, Cham, 2016, Vol. 9914.
2. Zhang Y., Wang L., Qi J., Wang D., Feng M., Lu H. Structured Siamese Network for Real-
Time Visual Tracking, In: Ferrari V., Hebert M., Sminchisescu C., Weiss Y. (eds), Computer
Vision – ECCV 2018: Lecture Notes in Computer Science. Springer, Cham, 2018, Vol. 11213.
3. Li D., Yu Y. & Chen X. Object tracking framework with Siamese network and re-detection
mechanism, J Wireless Com Network, 2019, 261.
4. Kalal Z., Mikolajczyk K., Matas J. Tracking-Learning-Detection, IEEE Transactions on Pattern
Analysis and Machine Intelligence, 2012, Vol. 34, No. 7, pp. 1409-1422.
5. Bertinetto L., Valmadre J., Golodetz S., Miksik O. and Torr P.H.S. Staple: Complementary
Learners for Real-Time Tracking, 2016 IEEE Conference on Computer Vision and Pattern
Recognition (CVPR), 2016, P. 1401-1409. DOI: 10.1109/CVPR.2016.156.
6. Dalal N., Triggs B. Histograms of oriented gradients for human detection, 2005 IEEE Computer
Society Conference on Computer Vision and Pattern Recognition (CVPR'05), San Diego,
CA, USA, 2005, Vol. 1, pp. 886-893. DOI: 10.1109/CVPR.2005.177.
7. Rybski P.E., Huber D., Morris D.D., Hoffman R. Visual classification of coarse vehicle orientation
using Histogram of Oriented Gradients features, 2010 IEEE Intelligent Vehicles Symposium,
La Jolla, CA, USA, 2010, pp. 921-928. DOI: 10.1109/IVS.2010.5547996.
8. Dollár P., Appel R., Belongie S. and Perona P. Fast Feature Pyramids for Object Detection,
IEEE Transactions on Pattern Analysis and Machine Intelligence, Aug. 2014, Vol. 36, No. 8,
pp. 1532-1545.
9. Samsonov N.A., Gneushev A.N. Deskriptor v akkumulyatornom prostranstve Hafa
gradientnogo polya izobrazheniya dlya detektirovaniya peshekhodov [Descriptor in the accumulator
space of the Hough gradient field of the image for detecting pedestrians], Mashinnoe
obuchenie i analiz dannykh [Machine learning and data analysis], 2017, No. 3, Vol. 3, pp. 203-
215. eISSN: 2223-3792.
10. Misra I., Shrivastava A., Hebert M. HOG and Spatial Convolution on SIMD Architecture,
Technical report. Robotics Institute, Carnegie Mellon University, 2013.
11. Huang C., Huang J. A Fast HOG Descriptor Using Lookup Table and Integral Image, ArXiv,
abs/1703.06256, 2017.
12. Roshan K., Saurabh S. Machine Learning: A Review on Binary Classification, International
Journal of Computer Applications, 2017.
13. Cortes C., Vapnik V. Support Vector Networks, Mach. Learn., 1995, Vol. 20, pp. 273-297
14. Burges J.C. A tutorial on support vector machines for pattern recognition, Data Min. Knowl.
Disc., 1998, pp. 121-167.
15. Cristianini N., Shawe-Taylor J. An Introduction to Support Vector Machines and other kernelbased
learning methods. Cambridge University Press, Cambridge, 2000.
16. Zhou X., Zhang X., Wang B. Online Support Vector Machine: A Survey, In: Kim J., Geem Z.
(eds), Harmony Search Algorithm. Advances in Intelligent Systems and Computing, Vol. 382.
Springer, Berlin, Heidelberg, 2016.
17. Shalev-Shwartz S., Singer Y., Srebro N. et al. Pegasos: primal estimated sub-gradient solver for
SVM, Math. Program., 2020, Vol. 127, pp. 3-30.
18. Bondarenko V.A., El'cova D.K., Lizin A.I., Pavlova V.A., Sozinova M.V., Tupikov V.A.
Mnogoagentnyy algoritm avtomaticheskogo obnaruzheniya i soprovozhdeniya nedetermini
rovannykh ob"ektov [Multi-agent algorithm for automatic detection and tracking of nondeterministic
objects], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences],
2020, No. 1 (211), pp. 218-232.
19. Bondarenko V.A., Gagarina A.Yu., Pavlova V.A., Tupikov V.A. Programmnyy kompleks
avtomatizatsii testirovaniya algoritmov obnaruzheniya i soprovozhdeniya ob"ektov na
videoposledovatel'nostyakh [Software package for testing automation of algorithms for detecting
and tracking objects on video sequences], Perspektivnye sistemy i zadachi upravleniya:
Mater. XVI Vserossijskoy nauchno-prakticheskoy konferentsii i XII molodezhnoy shkolyseminara
«Upravlenie i obrabotka informatsii v tekhnicheskikh sistemakh» [Promising management
systems and tasks: Materials of the XVI All-Russian Scientific and Practical Conference
and the XII Youth School-seminar "Information Management and processing in technical
systems"]. Taganrog: IP Maruk M.R., 2021, 355 p.
20. Rezatofighi H., Tsoi N., Gwak J., Sadeghian A., Reid I. Savarese S. Generalized Intersection Over
Union: A Metric and a Loss for Bounding Box Regression, 2019 IEEE/CVF Conference on
Computer Vision and Pattern Recognition (CVPR), Long Beach, CA, USA, 2019, pp. 658-666.
21. Heikkilä M., Pietikäinen M. A texture-based method for modeling the background and detecting
moving objects, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006,
Vol. 28 (4), pp. 657-662.
22. Kertész C. Texture-Based Foreground Detection, International Journal of Signal Processing,
Image Processing and Pattern Recognition (IJSIP), 2011, Vol. 4, No. 4.
23. Khalifa T. Şengül G. The Integrated Usage of LBP and HOG Transformations and Machine
Learning Algorithms for Age Range Prediction from Facial Images, Tehnicki Vjesnik, Vol. 25,
pp. 1356-1362. 10.17559/TV-20170308030459, 2018.
Опубликован
2022-04-20
Выпуск
Раздел
РАЗДЕЛ I. ПЕРСПЕКТИВЫ ПРИМЕНЕНИЯ РОБОТОТЕХНИЧЕСКИХ КОМПЛЕКСОВ