Краткое вступление
В данном цикле я опишу подходы, которые используются для расчета доступности (availability) системы.
Важное замечание: подходы основываются на том факте, что известна доступность каждого элемента системы: сервера, СХД, коммутатора, сеть также может выступать в качестве элемента. Во всех подходах используется принцип инкапсуляции - нас не интересует, что находится внутри сервера, какие компоненты, каковы их параметры, как считается доступность всего элемента в зависимости от их взаимодействия - это тема для отдельного цикла статей.
Статьи на тему:
Статьи на тему:
Библия по теории доступности:
Breaking the Availability Barrier, Dr. Bill Highleyman, Paul J. Holenstein
http://www.gravic.com/shadowbase/breaking_the_availability_barrier.html
Подход Первый
По всей видимости, это наиболее часто встречающийся подход, описанный во многих книгах или статьях.Смысл заключается в переводе реальной схемы архитектуры системы в схему, состоящую из логических компонентов, соединенных последовательно или параллельно и в последующем расчете коэффициента готовности системы.
Этапы расчета
- Понять архитектурную схему
- Перенести архитектуру на логические элементы — сформировать логическую схему системы
- Выделить типы соединений
- Произвести расчет коэффициента готовности согласно правилам
Типы соединений
- Последовательное
Отказ 1 элемента приводит к отказу всей системы
- Параллельное нагруженное
Система функционирует, если работает хотя бы 1 элемент
- Параллельное ненагруженное
При отказе основного элемента включается в работу резервный элемент. Данный тип вряд ли будет использован.
Коэффициент готовности — вероятность того, что объект окажется в работоспособном состоянии в произвольный момент времени, кроме планируемых периодов, в течение которых применение объекта по назначению не предусматривается.
Для последовательного соединения:
Вероятность безотказной работы системы
Рс(t)=Произв[Pj(t)]
Для параллельного соединения:
Pc(t)=1-Произв[1-Pj(t)]
Связь коэффициента готовности и времени простоя системы
Для расчета суммарного времени простоя за заданный интервал времени (год), необходимо вычислить коэффициент простоя (Кп) и умножить на интервал времени
Кп = 1 — Кг
tп = Кп * T
Пример
Пример | |
К1 | 0,99999 |
К2 | 0,9999 |
К3 | 0,9999 |
К4 | 0,9999 |
К5 | 0,99999 |
Кc | 0,99987999 |
Кс=К1*(1-(1-К2)*(1-К3))*К4*К5
Перевод Кг в tп | ||
Коэффициент готовности | Кг | 0,99987999 |
Коэффициент простоя | Кп | 0,00012001 |
Период (дн) | T | 365 |
Время отказа за период (мин) | tп | 63,07615161 |
Проблема
В случае моделирования аднным способом получается, что при отказе системы несколько раз в год время простоя суммируется, т.е вместо обещанных, например, 5 часов в год получается уже 10.
Практика
Этот же подход используется в книге High Availability Network Fundamentals
Sun
Sun 2
Windchill OpSim (formerly Relex OpSim)
Этот же подход используется в книге High Availability Network Fundamentals
Sun
Sun 2
Windchill OpSim (formerly Relex OpSim)
Ссылки:
Мат часть:
ГОСТ 27.002-89 «Надежность в технике. Основные понятия. Термины и определения»
Кратко и по делу:
http://www.edgeblog.net/2007/in-search-of-five-9s/
http://www.edgeblog.net/2007/in-search-of-five-9s/
Комментариев нет:
Отправить комментарий