четверг, 5 мая 2011 г.

Расчет доступности системы. Подход первый

Краткое вступление

В данном цикле я опишу подходы, которые используются для расчета доступности (availability) системы. 
Важное замечание: подходы основываются на том факте, что известна доступность каждого элемента системы: сервера, СХД, коммутатора, сеть также может выступать в качестве элемента. Во всех подходах используется принцип инкапсуляции - нас не интересует, что находится внутри сервера, какие компоненты, каковы их параметры, как считается доступность всего элемента в зависимости от их взаимодействия - это тема для отдельного цикла статей.

Статьи на тему:


Библия по теории доступности:
Breaking the Availability Barrier, Dr. Bill Highleyman, Paul J. Holenstein
http://www.gravic.com/shadowbase/breaking_the_availability_barrier.html

Подход Первый

По всей видимости, это наиболее часто встречающийся подход, описанный во многих книгах или статьях.Смысл заключается в переводе реальной схемы архитектуры системы в схему, состоящую из логических компонентов, соединенных последовательно или параллельно и в последующем расчете коэффициента готовности системы.
Этапы расчета 
  1. Понять архитектурную схему
  2. Перенести архитектуру на логические элементы — сформировать логическую схему системы
  3. Выделить типы соединений
  4. Произвести расчет коэффициента готовности согласно правилам
Типы соединений
  • Последовательное 
Отказ 1 элемента приводит к отказу всей системы
  • Параллельное нагруженное
Система функционирует, если работает хотя бы 1 элемент
  • Параллельное ненагруженное 
При отказе основного элемента включается в работу резервный элемент. Данный тип вряд ли будет использован.

Коэффициент готовности — вероятность того, что объект окажется в работоспособном состоянии в произвольный момент времени, кроме планируемых периодов, в течение которых применение объекта по назначению не предусматривается.
Для последовательного соединения:
Вероятность безотказной работы системы
Рс(t)=Произв[Pj(t)]
Для параллельного соединения:
Pc(t)=1-Произв[1-Pj(t)]

Связь коэффициента готовности и времени простоя системы
Для расчета суммарного времени простоя за заданный интервал времени (год), необходимо вычислить коэффициент простоя (Кп) и умножить на интервал времени
Кп = 1 — Кг
tп = Кп * T

Пример

Пример
К1
0,99999
К2
0,9999
К3
0,9999
К4
0,9999
К5
0,99999
Кc
0,99987999

Кс=К1*(1-(1-К2)*(1-К3))*К4*К5


Перевод Кг в tп
Коэффициент готовности
Кг
0,99987999
Коэффициент простоя
Кп
0,00012001
Период (дн)
T
365
Время отказа за период (мин)
tп
63,07615161

Проблема
В случае моделирования аднным способом получается, что при отказе системы несколько раз в год время простоя суммируется, т.е вместо обещанных, например, 5 часов в год получается уже 10.
Практика 
Этот же подход используется в книге High Availability Network Fundamentals
Sun
Sun 2
Windchill OpSim (formerly Relex OpSim)
Ссылки:
Мат часть:
ГОСТ 27.002-89 «Надежность в технике. Основные понятия. Термины и определения»
Кратко и по делу:
http://www.edgeblog.net/2007/in-search-of-five-9s/

Комментариев нет:

Отправить комментарий