ОЦЕНКА ОСУЩЕСТВИМОСТИ РЕШЕНИЯ ЗАДАЧ НА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ ПРИ ГРУППОВОМ ОБСЛУЖИВАНИИ
Аннотация
Рост производительности вычислительных систем (ВС) связан как с масштабируе-
мостью, так и с развитием архитектуры вычислительных элементов системы. Кластер-
ные ВС, которые являются масштабируемыми, составляют 93% суперкомпьютеров спи-
ска Top500 и относятся к высокопроизводительным. При этом по – прежнему остается
проблема эффективного и полного использования всего имеющегося вычислительного ре-
сурса суперкомпьютера и ВС для решения пользовательских задач. Отказы элементарных
машин (узлов, вычислительных модулей) снижают технико-экономическую эффектив-
ность вычислительных систем и эффективность решения пользовательских задач. По-
этому при планировании процесса решения задач, уменьшение потерь времени на восста-
новление ВС от сбоев, отказов является важной задачей. Для количественной оценки по-
тенциальных возможностей вычислительных систем используются показатели осущест-
вимости решения задач. Эти показатели характеризуют качество работы систем с уче-
том надежности, временных характеристик и параметров обслуживания поступающих
задач. В работе предлагается математическая модель функционирования вычислительной
системы с накопителем при групповом обслуживании потока задач. Математическая
модель использует методы теории массового обслуживания, основанных на теории веро-
ятностей и системах дифференциальных уравнений. Следует заметить, что методика
составления систем дифференциальных уравнений достаточна проста, если представлена
соответствующая им граф-схема. Однако точное решение систем уравнений и, как прави-
ло, в элементарных функциях, не существует, либо формулы труднообозримы. Здесь реше-
ние получено в стационарном режиме функционирования системы массового обслужива-
ния. Рассчитаны показатели, позволяющие оценить наполненность накопителя. Получен-
ные аналитические решения просты, могут быть использованы для экспресс-анализа
функционирования вычислительных систем.
Литература
Acta Numerica, 2012, pp. 1-96.
2. khoroshevskiy V.G. Arkhitektura vychislitel'nykh system [Architecture of computing systems].
Moscow: MGTU im. Baumana, 2008, 520 p.
3. TOP500 Supercomputers Official Site. TOP500 Lists 2021. Available at: http://www.top500.org.
4. Gupta S., Patel T., Engelmann C. and Tiwari D. Failures in large scale systems: long-term
measurement, analysis, and implications SC '17: Proc. of the International Conference for
High Performance Computing, Networking, Storage and Analysis (Denver, Colorado), 2017,
Vol. 44.
5. Schroeder В. and Gibson Garth. A 2006 large-scale study of failures in high-performance
computing systems, Proceedings of the International Conference on Dependable Systems and
Networks (DSN2006) (Philadelphia, PA, USA), pp. 10.
6. Korobkin V., Melnik E., Klimenko A. Fault-tolerant architecture for the hazardous object information
control systems, Application of information and communication technologies -
AICT2015 (IEEE catalog number CFPI556H-PRT): conference proceedings (Rostov-on-Don,
Russia 14-16 October 2015). Rostov-on-Don: SFedU, 2015, pp. 274-276.
7. Khoroshevskiy V.G. Modeli analiza i organizatsii funktsionirovaniya bol'shemasshtabnykh
raspredelennykh vychislitel'nykh sistem [Models of analysis and organization of functioning of
large-scale distributed computing systems], Elektronnoe modelirovanie [Electronic modeling].
Kiev, 2003, Vol. 25, No. 6.
8. Xie M., Dai Y.S. and Poh K.L. Computing system reliability: models and analysis. New York:
Kluwer academic publishers, 2004.
9. Blischke W.R. and Murthy D.N.P. Reliability. New York: Wiley, 2000
10. Hoyland A., Rausand M. System reliability theory. New York: Wiley, 1994.
11. Kuo W., Zuo M.J. Optimal reliability modeling: principles and applications. New York: Wiley,
2003.
12. Mor Harchol-Balter. Performance Modeling and Design of Computer Systems: Queueing
Theory in Action. Cambridge University Press, 2013.
13. Chechel'nitskiy A.A., Kucherenko O.V. Statsionarnye kharakteristiki parallel'no
funktsioniruyushchikh sistem obsluzhivaniya s dvumernym vkhodnym potokom [Stationary
characteristics of parallel functioning service systems with a two-dimensional input stream],
Sb. nauchnykh statey [Collection of scientific articles]. Minsk, 2009. Issue 2, pp. 262-268.
14. Pavsky V.A., Pavsky K.V. Stochastic models and calculations of distributed computer systems
reserve size, Proc. of 2019 International Multi-Conference on Industrial Engineering and
Modern Technologies (FarEastCon), Vladivostok, Russia, 2019, pp. 1-5.
15. Nazarov A.A., Terpugov A.F. Teoriya massovogo obsluzhivaniya [Queuing theory]. Tomsk:
Izd-vo NTL, 2010, 228 p.
16. Saati T.L. Elementy teorii massovogo obsluzhivaniya i ee prilozheniya [Elements of the theory
of queuing and its applications]. 3 ed. Moscow: Knizhnyy dom «LIBROKOM», 2010, 520 p.
17. Kleynrok L. Teoriya massovogo obsluzhivaniya [Theory of queuing]. Moscow:
Mashinostroenie, 1979, 432 p.
18. Borovkov A.A. Veroyatnostnye protsessy v teorii massovogo obsluzhivaniya [Probabilistic
processes in the theory of queuing]. Moscow: Nauka, 1972, 368 p.
19. Venttsel' E.S. Teoriya sluchaynykh protsessov i ee inzhenernye prilozheniya [Theory of random
processes and its engineering applications]. Moscow: Nauka, 1991, 384 p.
20. Feller V. Vvedenie v teoriyu veroyatnostey i ee prilozheniya [Introduction to probability theory
and its applications]: In 2 vol. Vol. 1. Moscow: LIBROKOM, 2010, 528 p.