О топологической отказоустойчивости масштабируемых вычислительных систем

Автор(ы): Мелентьев В.А.

Название статьи: О топологической отказоустойчивости масштабируемых вычислительных систем

Выпуск: 70

Рубрика: Сетевые модели в управлении

Год: 2017

Библиография: Мелентьев В.А. О топологической отказоустойчивости масштабируемых вычислительных систем // Управление большими системами. Выпуск 70. М.: ИПУ РАН, 2017. С.58-86. URL: https://doi.org/10.25728/ubs.2017.70.3

Дата опубликования: 30.11.2017

Ключевые слова: масштабируемые вычислительные системы, их топологическая отказоустойчивость

Аннотация: Рассматриваются проблемы анализа топологической отказоустойчивости масштабируемой вычислительной системы (ВС) и обеспечения ее устойчивости к отказам заданной кратности. Предложен критерий топологической отказоустойчивости, напрямую связывающий топологию с потенциальным параллелизмом системы при заданной кратности допускаемых отказов. Определена взаимосвязь функций топологической масштабируемости и топологической отказоустойчивости систем. Показана обусловленность минимума топологической отказоустойчивости обхватом графа вычислительной системы. Модель параллельных вычислений, а также функции топологической отказоустойчивости и масштабируемости адаптированы к наличию уникальных узлов в информационной топологии решаемой задачи. Предложен способ конфигурирования отказоустойчивых подсистем при дефицитной топологической отказоустойчивости ВС, при этом обеспечение заданной для приложения кратности отказов достигается дублированием подсистем, сконфигурированных для меньшей, чем заданная, кратности отказов.

Author(s): Melentiev V.

Article title: On topological fault-tolerance of scalable computing systems

Issue: 70

Year: 2017

Keywords: scalable computing systems, their topological fault-tolerance

Abstract: Problems of the analysis of topological fault tolerance of the scalable computing system and ensuring its sustainability to fault of the given multiplicity are considered. The measure of topological fault tolerance is offered, which connects the computing system topology with its potential parallelism for the given fault multiplicity. The relationship between the functions of topological scalability and topological fault tolerance is defined. The dependence of the minimum of a topological fault tolerance by the girth of the system graph is shown. Model of parallel computings, and functions of the topological fault tolerance and scalability are adapted to the existence of unique nodes in information topology of the solved task. A method for configuring fault-tolerant subsystems for a deficient topological fault tolerance of a computing system is proposed, while providing the preassigned fault multiplicity for the solved task is achieved by duplicating subsystems which are configured for less, than the preassigned, fault multiplicity.

в формате PDF
Обсудить статью в Интернет-конференции по проблемам управления

Просмотров: 3333; загрузок: 1061, за месяц: 17.

Назад