АЛЬТЕРНАТИВНЫЕ ГИБРИДНЫЕ СТРУКТУРЫ ДЛЯ ПОВЫШЕНИЯ ВЫЧИСЛИТЕЛЬНОЙ ЭФФЕКТИВНОСТИ РЕАЛИЗАЦИИ НЕЙРОННЫХ СЕТЕЙ ГЛУБОКОГО ОБУЧЕНИЯ
Аннотация
Предлагается новый подход к организации вычислительных структур слоев и меж-
слойных связей при построении искусственных нейронных сетей для решения широкого
круга задач обработки многомерных данных. Основной проблемой построения сетей глубо-
кого обучения является необходимость введения большого количества параметров обуче-
ния сети. Имеющиеся рабочие экземпляры таких сетей содержат миллиарды параметров,
что позволяет достигать высокой эффективности применения таких сетей. Обратной
стороной такой широко используемой структуры сетей в виде многослойных сверточных
структур являются высокие затраты на обучение сетей с большим количеством струк-
турно схожих слоев свертки методом обратного распространения. Решение проблемы
повышения эффективности таких многослойных структур может быть найдено в приме-
нении гибридных слоев, реализующих операции гранулирования данных, которые были раз-
виты в наших работах. В новых гибридных моделях вместо векторных значений парамет-
ров обучения используются матричные информационные элементы, позволяющие кодиро-
вать подмножества значений данных (информационные гранулы) вместо кодирования
отдельных точек данных, как в классических сверточных сетях. Предложенные гибридные
слои обучаются без учителя и допускают параллельную реализацию алгоритмов обучения,
что принципиально отличается от последовательных алгоритмов обратного распростра-
нения. В результате вычислительная эффективность применения подобных гибридныхнейросетей может быть существенно повышена. Предлагаемый в работе теоретический
подход к моделированию и оптимизации структур сетей глубокого обучения может быть
распространен на широкий круг задач вычислительного интеллекта.
Литература
with neurocomputers]. Moscow: IPRZhR, 2002, 480 p.
2. Gorban' A.N., Dunin-Barkovskiy V.L., Kirdin A.N. i dr. Neyroinformatika [NeuroInformatics].
Novosibirsk: Nauka. Sibirskoe predpriyatie RAN, 1998, 296 p.
3. Deng L., Yu D. Deep learning: methods and applications, Foundations and Trends in Signal
Processing, 2014, 7, pp. 197-387.
4. Mosavi A., Lopez A., Varkonyi-Koczy A. Industrial Applications of Big Data: State of the Art
Survey, Advances in Intelligent Systems and Computing, 2017.
5. Butenkov S.A. Komponenty gibridnykh neyrosetevykh intellektual'nykh sistem,
ispol'zuyushchie metod informatsionnoy granulyatsii [The hybrid neuro systems components,
based on information granulation], Sb. trudov XII Vserossiyskoy nauchno-tekhnicheskoy
konferentsii “Neyroinformatika–2010”, Moskva, 25-29 yanvarya 2010 [Collection of proceedings
of the XII All-Russian Scientific and Technical Conference “Neuroinformatics-2010”,
Moscow, January 25-29, 2010], Vol. 2, pp. 54-64.
6. Butenkov S.A. Granulyatsiya i inkapsulyatsiya v sistemakh effektivnoy obrabotki mnogomernoy
informatsii [Data granulation an encapsulation in efficient multidimensional data processing
systems], Iskusstvennyy intellect [Artificial Intelligence], 2005, No. 4, pp. 106-115.
7. Butenkov S.A., Zhukov A.L. Informatsionnaya granulyatsiya na osnove izomorfizma
algebraicheskikh sistem [Information Granulation based on the Algebraic Systems Isomorphism],
Sb. trudov Mezhdunarodnoy algebraicheskoy konferentsii, posvyashchennoy 80-letiyuso dnya rozhdeniya A.I. Kostrikina, Nal'chik, 12-18 iyulya 2009 g. [Collection of proceedings
of the International Algebraic Conference dedicated to the 80th anniversary of the birth of
A.I. Kostrikina, Nalchik, July 12-18, 2009], pp. 206-209.
8. Butenkov S., Krivsha V., Al-Dhouyani S. Granular Computing in Computer Image Perception:
basic issues and Glass Box models, In Proc. IASTED Conf. “AIA 2006”, Innsbruk, Austria,
February 16-18 2006, pp. 811-816.
9. Butenkov S.A., Krivsha V.V., Krivsha N.S. Recognition and Perception of Images. Fundamentals
and Applications. Chap. 7. The use of Mathematical Apparatus of Spatial Granulation in
the Problems of Perception and Image Recognition, 2021, John Wiley & Sons, Inc., 111, River
Street, Hoboken, NJ07030, USA, pp. 220-257. ISBN 9871119750550.
10. Weng J., Ahuja N. and Huang T.S. Cresceptron: a self-organizing neural network which grows
adaptively, Proc. International Joint Conference on Neural Networks, Baltimore, Maryland,
June, 1992, Vol. I, pp. 576-581.
11. Zadeh L.A. Toward a theory of fuzzy information granulation and its centrality in human reasoning
and fuzzy logic, Fuzzy Sets and Systems, 1997, Vol. 90, pp. 111-127.
12. Butenkov S.A. Algebraicheskie modeli v zadachakh intellektual'nogo analiza mnogomernykh
dannykh [The algebraic models for the intelligent data analysis], Sb. trudov mezhdunarodnoy
konferentsii “Matematicheskaya teoriya sistem 2009”, Moskva, 26-30 yanvarya 2009 [Collection
of proceedings of the international conference “Mathematical theory of systems 2009”,
Moscow, January 26-30, 2009], pp. 93-101.
13. Butenkov S.A., Krivsha V.V., Krivsha N.S. Topologicheskie prostranstvennye otnosheniya v
modelyakh granulirovaniya mnogomernykh dannykh [Topological spatial relations for the
granulated multidimensional data models], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya
SFedU. Engineering Sciences], 2010, No. 6, pp. 200-211.
14. Kohonen T. Self-Organizing Maps. Berlin–New York: Springer-Verlag. Third extended edition,
2001.
15. Butenkov S.A. Matrichnye neyronnye seti dlya zadach obrabotki i klassifikatsii mnogomernykh
dannykh [Matrix Neuro Nets in the Multidimensional Data Processing and Classification Problems],
Mater. Vos'moy Vserossiyskoy mul'tikonferentsii po problemam upravleniya “MKPU–
2015”, Gelendzhik, 28 sentyabrya –3 oktyabrya 2015 g. [Materials of the Eighth All-Russian
Multi-Conference on Control Problems “MKPU-2015”, Gelendzhik, September 28 – October
3, 2015]. Rostov-on-Don: Izd-vo YuFU, 2015, Vol. 1, pp. 34-39.
16. Butenkov S., Zhukov A., Nagorov A., Krivsha N. Granular Computing Models and Methods
Based on the Spatial Granulation, XII Int. Symposium «Intelligent Systems», INTELS’16, 5-7
October 2016, Moscow, Russia. Elsevier Procedia Computer Science, 2017, 103, pp. 295-302.
17. Yarushkina N.G. Osnovy teorii nechetkikh i gibridnykh system [The fundamentals of fuzzy
and hybrid systems]. Moscow: Finansy i statistika, 2004, 320 p.
18. Krivsha N., Krivsha V., Butenkov S. The Analytical Approach to the Parameterized Fuzzy
Operators Design, 13th International Symposium Intelligent Systems - 2018 (INTELS'18),
Elsevier Procedia Computer Science, 2019, St. Petersburg, Russia, pp. 193-200.
19. Butenkov S.A., Krivsha V.V., Krivsha N.S. Modelirovanie struktur vychisleniya [Modeling
computation structures], Informatizatsiya i svyaz' [Informatization and communication], 2021,
No. 3, pp. 28-32.
20. Butenkov S.A. Strukturnaya organizatsiya granulirovannykh vychisleniy pri obrabotke dannykh
na rekonfiguriruemykh vychislitel'nykh sistemakh [The structural organization of the granulated
computing for the data processing by the reconfigurable computers], Izvestiya YuFU.
Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2018, No. 8 (202), pp. 250-262.