Оценка надежности восстанавливаемого кластера контейнерной виртуализацией
https://doi.org/10.17586/2226-1494-2025-25-5-988-995
Аннотация
В ведение. При построении отказоустойчивых кластеров высокой готовности с малыми задержками обслуживания потоков запросов все большее применение находит технология контейнерной виртуализации. При проектировании высоконадежных кластеров важной задачей является их структурно-параметрический модельноориентированный синтез с учетом влияния числа развертываемых контейнеров на производительность, задержки обслуживания потоков запросов и надежность системы.
Метод. Обоснование решений по обеспечению высокой готовности кластера основывается на разработке моделей восстанавливаемого кластера при реконфигурации с учетом миграции виртуальных контейнеров. Новизна предлагаемых марковских моделей кластера состоит в учете двухэтапного восстановления его работоспособности с определением влияния на надежность кластера числа контейнеров, подлежащих миграции в процессе реконфигурации — до и после физического восстановления отказавших серверов. Рассмотрены два варианта миграции контейнеров при восстановлении кластера. В первом варианте, на этапе физического восстановления отказавшего сервера, миграция контейнеров на исправный сервер не происходит, а во втором — происходит. На втором этапе реконфигурации после физического восстановления отказавшего сервера осуществляется миграция контейнеров, при которой возможно как увеличение, так и уменьшение числа развернутых в них контейнеров.
Основные результаты. На основе предлагаемых марковских моделей надежности кластера с контейнерной виртуализацией дана оценка его коэффициента готовности и определено влияние числа контейнеров, загружаемых при миграции на двух этапах реконфигурации, на надежность системы.
Обсуждение. Предложенные марковские модели надежности кластера с контейнерной виртуализацией направлены на обоснование выбора проектных решений по организации и восстановлению работоспособности кластера после отказов серверов с учетом влияния вариантов реализации миграции виртуальных контейнеров на готовность системы. В дальнейших исследованиях предполагается анализ влияния вариантов миграции контейнеров как на готовность кластера, так и на задержки обслуживания запросов на двух рассматриваемых этапах реконфигурации.
Об авторах
В. А. БогатыревРоссия
Богатырев Владимир Анатольевич — доктор технических наук, профессор; профессор
sc 7006571069
Санкт-Петербург, 190000
Санкт-Петербург, 197101
В. К. Фунг
Россия
Фунг Ван Кю — аспирант
Санкт-Петербург, 197101
Список литературы
1. Goyal P., Deora S.S. Reliability of Trust Management Systems in Cloud Computing // Indian Journal of Cryptography and Network Security. 2022. V. 2. N 1. P. 1–5. https://doi.org/10.54105/ijcns.C1417.051322
2. Chen G., Guan N., Huang K., Yi W. Fault-tolerant real-time tasks scheduling with dynamic fault handling // Journal of Systems Architecture. 2020. V. 102. P. 101688. https://doi.org/10.1016/j.sysarc.2019.101688
3. Shubinsky I.B., Rozenberg I.N., Papic L. Adaptive fault tolerance in real-time information systems // Reliability: Theory and Applications. 2017. V. 12. N 1 (44). P. 18–25.
4. Chinnaiah N.R., Niranjan N. Fault tolerant software systems using software configurations for cloud computing // Journal of Cloud Computing. 2018. V. 7. P. 3. https://doi.org/10.1186/s13677-018-0104-9
5. Srivastava A., Kumar N. Queueing model based dynamic scalability for containerized cloud // International Journal of Advanced Computer Science and Applications. 2023. V. 14. N 1. P. 465–472. https://doi.org/10.14569/IJACSA.2023.0140150
6. Shukur H.M., Zeebaree S.R.M., Zebari R.R., Zeebaree D.Q., Ahmed O.M., Salih A.A. Cloud computing virtualization of resources allocation for distributed systems // Journal of Applied Science and Technology Trends. 2020. V. 1. N 2. P. 98–105. https://doi.org/10.38094/jastt1331
7. Alam I., Sharif K., Li F., Latif Z., Karim M.M., Biswas S., Nour B., Wang Y. A survey of network virtualization techniques for Internet of things using SDN and NFV // ACM Computing Surveys. 2020. V. 53. N 2. P. 1–40. https://doi.org/10.1145/3379444
8. Chen H., Qin W., Wang L. Task partitioning and offloading in IoT cloud-edge collaborative computing framework: a survey // Journal of Cloud Computing. 2022. V. 11. P. 86. https://doi.org/10.1186/s13677-022-00365-8
9. Kushchazli A., Safargalieva A., Kochetkova I., Gorshenin A. Queuing model with customer class movement across server groups for analyzing virtual machine migration in cloud computing // Mathematics. 2024. V. 12. N 3. P. 468. https://doi.org/10.3390/math12030468
10. Kumari P., Kaur P. A survey of fault tolerance in cloud computing // Journal of King Saud University — Computer and Information Sciences. 2021. V. 33. N 10. P. 1159–1176. https://doi.org/10.1016/j.jksuci.2018.09.021
11. Tatarnikova T.M., Arkhiptsev E.D. Designing fault-tolerant systems with micro-service architecture // Proc. of the 27th International Conference on Soft Computing and Measurements (SCM). 2024. P. 348–351. https://doi.org/10.1109/SCM62608.2024.10554143
12. Bogatyrev V.A. Protocols for dynamic distribution of requests through a bus with variable logic ring for reception authority transfer // Automatic Control and Computer Sciences. 1999. V. 33. N 1. P. 57–63.
13. Sovetov B.Ya., Tatarnikova T.M., Poymanova E.D. Storage scaling management model // Information and Control Systems. 2020. N 5 (108). P. 43–49. https://doi.org/10.31799/1684-8853-2020-5-43-49
14. Bogatyrev A.V., Bogatyrev V.A., Bogatyrev S.V. The probability of timeliness of a fully connected exchange in a redundant real-time communication system // Proc. of the Wave Electronics and its Application in Information and Telecommunication Systems (WECONF). 2020. P. 1–4. https://doi.org/10.1109/WECONF48837.2020.9131517
15. Bogatyrev V.A., Bogatyrev S.V., Bogatyrev A.V. Control of multipath transmissions in the nodes of switching segments of reserved paths // Proc. of the International Conference on Information, Control, and Communication Technologies (ICCT). 2022. P. 1–5. https://doi.org/10.1109/ICCT56057.2022.9976839
16. Terskov V., Sakash I. The reliability evaluation of local computer networks using markov model of multiple heterogeneous groups of switches // E3S Web of Conferences. 2024. V. 592. P. 3036. https://doi.org/10.1051/e3sconf/202459203036
17. Половко А.М., Гуров С.В. Основы теории надежности. СПб.: БХВ-Петербург, 2006. 702 с.
18. Koren I. Fault-Tolerant Systems. Morgan Kaufmann, 2007. 400 p.
19. Aysan H. Fault-tolerance strategies and probabilistic guarantees for real-time systems. Doctoral dissertation, Mälardalen University, 2012. 109 p.
20. Рахман П.А., Шарипов М.И. Модель надежности двухузлового кластера приложений высокой готовности в системах управления предприятием // Экономика и менеджмент систем управления. 2015. № 3 (17). С. 85–102.
21. Хомоненко А.Д., Благовещенская Е.А., Проурзин О.В., Андрук А.А. Прогноз надежности кластерной вычислительной системы с помощью полумарковской модели альтернирующих процессов и мониторинга // Наукоемкие технологии в космических исследованиях Земли. 2018. Т. 10. № 4. С. 72–82. https://doi.org/10.24411/2409-5419-2018-10099
22. Bogatyrev V.A., Vinokurova M.S. Control and safety of operation of duplicated computer systems // Communications in Computer and Information Science. 2017. V. 700. P. 331–342. https://doi.org/10.1007/978-3-319-66836-9_28
23. Bogatyrev V.A. Exchange of duplicated computing complexes in fault-tolerant systems // Automatic Control and Computer Sciences. 2011. V. 45. N 5. P. 268–276. https://doi.org/10.3103/S014641161105004X
24. Богатырев В.А., Богатырев С.В., Богатырев А.В. Оценка готовности компьютерной системы к своевременному обслуживанию запросов при его совмещении с информационным восстановлением памяти после отказов // Научно-технический вестник информационных технологий, механики и оптики. 2023. Т. 23. № 3. С. 608–617. https://doi.org/10.17586/2226-1494-2023-23-3-608-617
25. Compastié M., Badonnel R., Festor O., He R. From virtualization security issues to cloud protection opportunities: An in-depth analysis of system virtualization models // Computers & Security. 2020. V. 97. P. 101905. https://doi.org/10.1016/j.cose.2020.101905
26. Choudhary A., Govil M.C., Singh G., Awasthi L.K., Pilli E.S., Kapil D. A critical survey of live virtual machine migration techniques // Journal of Cloud Computing. 2017. V. 6. P. 23. https://doi.org/10.1186/s13677-017-0092-1
27. Алексанков С.М. Модели динамической миграции с итеративным подходом и сетевой миграции виртуальных машин // Научнотехнический вестник информационных технологий, механики и оптики. 2015. Т. 15. № 6. С. 1098–1104. https://doi.org/10.17586/2226-1494-2015-15-6-1098-1104
28. Bogatyrev V.A., Derkach A.N. Evaluation of a cyber-physical computing system with migration of virtual machines during continuous computing // Computers. 2020. V. 9. N 2. P. 42. https://doi.org/10.3390/computers9020042
29. Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. 432 с.
30. Фунг В., Богатырев В.А., Кармановский Н.С., Лэ В.Х. Оценка вероятностно-временных характеристик компьютерной системы с контейнерной виртуализацией // Научно-технический вестник информационных технологий, механики и оптики. 2024. Т. 24. № 2. С. 249–255. https://doi.org/10.17586/2226-1494-2024-24-2-249-255
31. Nguyen T.A., Kim D.S., Park J.S. A comprehensive availability modeling and analysis of a virtualized servers system using stochastic reward nets // The Scientific World Journal. 2014. V. 2014. P. 165316. https://doi.org/10.1155/2014/165316
Рецензия
Для цитирования:
Богатырев В.А., Фунг В.К. Оценка надежности восстанавливаемого кластера контейнерной виртуализацией. Научно-технический вестник информационных технологий, механики и оптики. 2025;25(5):988-995. https://doi.org/10.17586/2226-1494-2025-25-5-988-995
For citation:
Bogatyrev V.A., Phung V.Q. Assessment of the reliability of a recoverable container virtualization cluster. Scientific and Technical Journal of Information Technologies, Mechanics and Optics. 2025;25(5):988-995. (In Russ.) https://doi.org/10.17586/2226-1494-2025-25-5-988-995































