Как расчитать показатель надежности для системы?

terminus

Возникла задача - клиент просит предоставить расчет надежности для системы состоящей из нескольких серверов объедененных в кластер. Необходимо обосновать, что на уровне железа надежность будет 99.999

Как расчитывать такие показатели?

Производители железных компонентов обычно пишут для низ MTBF (mean time between failures / среднее время до отказа) - по-идее это есть готовая вероятность...

Хорошо, проедположим что есть вероятности для всех-всех основных железок из которых состоят серваки и инфраструктура - что дальше то? Вероятность выхода из строя сервака как целого, наверно можно посчитать на основании вероятности для самого слабого из его компонентов? Например, если для процессора Р = 0.000001, а для единственного жесткого диска Р = 0.001 то сам сервер будет полностью зависеть от работы диска и вероятность его отказа = 0.001...

У меня в кластере будет 4 машины и один стекуемый свитч состоящий из 2х частей. 2 машини это ноды данных, вторые 2 машины это ноды SQL - они дублируют друг друга. Таким образом мне нужно найти вероятности одновременного выхода из строя для 2х нод данны (Рdata), потом для 2х SQL нод (Рsql), потом для свитча (Pswith), а потом просто перемножить их между собой: Рdata х Рsql х Pswith

В итоге я получу, скажем число 0.0001 для вероятности сбоя железа, что есть 99.999 вероятность не сбоя - она же бужет желанный uptime?

Я правильно рассуждаю? Кто-нить пните в верном направлении если ошибаюсь.

Хостинг HostFood.ru · **Хостинг HostFood.ru**

Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/

terminus

вот такой пример нашел в одной книжке про расчеты надежностей тех. систем. По ней как я понял можно будет расчитать вероятности для отдельных серверов. Потом полученные значения перемножаем и будет общее для всей системы.

Burner · Непрочитанное сообщение **Burner** » 2009-10-15 12:48:35

terminus писал(а):Необходимо обосновать, что на уровне железа надежность будет 99.999

гы...

terminus

Ну вот как-то так, да... Для этого все сервера в кластере продублированны и все такое. Требовать надежность в 5 девяток от конкретного жесткого диска никто, конечно, не станет, но чуваки серьезно ориентированны на научный подход на фазе планирования.

Если получится расчитать ожидаемый uptime для конкретных серверов в кластере то это уже будет подспорье.

Gloft · Непрочитанное сообщение **Gloft** » 2009-10-15 13:49:12

terminus писал(а): У меня в кластере будет 4 машины и один стекуемый свитч состоящий из 2х частей. 2 машини это ноды данных, вторые 2 машины это ноды SQL - они дублируют друг друга. Таким образом мне нужно найти вероятности одновременного выхода из строя для 2х нод данны (Рdata), потом для 2х SQL нод (Рsql), потом для свитча (Pswith), а потом просто перемножить их между собой: Рdata х Рsql х Pswith
В итоге я получу, скажем число 0.0001 для вероятности сбоя железа, что есть 99.999 вероятность не сбоя - она же бужет желанный uptime?
Я правильно рассуждаю? Кто-нить пните в верном направлении если ошибаюсь.

По моему ты рассуждаешь неверно. Тебе надо найти вероятность выхода из строя одновременно двух узлов (оба сервера баз данных, оба свича, оба сервера приложений) из всей системы.
Т.к. именно в этом случае вся система будет выведена из строя.
Посмотри источник Вл.В.Воеводин, С.А.Жуматий. Вычислительное дело и кластерные системы. На сайте http://www.parallel.ru/.
Там думаю ты найдешь что искал или подскажут у кого можно спросить.

rainy · Непрочитанное сообщение **rainy** » 2009-10-15 14:52:31

а потом просто перемножить их между собой: Рdata х Рsql х Pswith

не перемножить, а сложить
Подумай, а то по твоей логике с умножением получается, чем больше узлов в системе, тем она надежней.

Burner · Непрочитанное сообщение **Burner** » 2009-10-15 15:07:23

ну и арифметика пошла...
A - вероятность отказа одной ноды данных. В - вероятность отказа одной ноды SQL, C - вероятность отказа свича.
Вероятность выхода из строя системы равна (1-(1-A^2)*(1-B^2)*(1-C))

terminus

не перемножить, а сложить
Подумай, а то по твоей логике с умножением получается, чем больше узлов в системе, тем она надежней.

вероятности исчисляются от [0;1]
0.99 * 0.98 = 0,9702

Меня интересует событие отказ всей системы поэтому решил что надо считать по "теореме умножения вероятностей".

Ненавижу терию вероятности и статистику

rainy · Непрочитанное сообщение **rainy** » 2009-10-15 16:27:53

вероятности исчисляются от [0;1]
0.99 * 0.98 = 0,9702

мне кажется ты уже запутался. Ты хочешь посчитать вероятность выхода из строя или вероятность не выхода?

Меня интересует событие отказ всей системы поэтому решил что надо считать по "теореме умножения вероятностей"

Это было бы актуально, если бы выход из строя одной части системы не влиял на нее целиком. Если, например, выйдет из строя свитч, то система не будет работать.

На простом примере: Вероятность, что пойдет дождь сегодня 0,3%, вероятность, что пойдет снег - 0,1%. Таким образом, вероятность выпадения осадков 0,4. У тебя тоже самое. То есть, если использовать обозначения Burner, то формула для надёжности будет следующая:

Код: Выделить всё

1-A^2-B^2-C

f_andrey

terminus писал(а):Ну вот как-то так, да... Для этого все сервера в кластере продублированны и все такое. Требовать надежность в 5 девяток от конкретного жесткого диска никто, конечно, не станет, но чуваки серьезно ориентированны на научный подход на фазе планирования.

Если получится расчитать ожидаемый uptime для конкретных серверов в кластере то это уже будет подспорье.

Не в обиду будет сказано, но если бы они были ориентированы на 99.999 то вы явно не были бы их исполнителем

А по теме да надо много искать и вероятно дохрена считать причем понимая специфику, ну и если уж искать то в зарубежной литературе и стандартах, у нас тоже есть всякие методики расчета надежности, но они были больше рассчитаны на механику ну или электронику, да и разрабатывались давненько.

paradox · Непрочитанное сообщение **paradox** » 2009-10-15 16:33:25

обратитесь к преподавателю по теории вероятности в университет
он точно знает
мы например похожие примеры кажеться проходили
мне конспект лень искать)
да и не факт что найду
давненько было

Burner · Непрочитанное сообщение **Burner** » 2009-10-15 16:36:01

rainy писал(а): На простом примере: Вероятность, что пойдет дождь сегодня 0,3%, вероятность, что пойдет снег - 0,1%. Таким образом, вероятность выпадения осадков 0,4. У тебя тоже самое. То есть, если использовать обозначения Burner, то формула для надёжности будет следующая:
Код: Выделить всё
1-A^2-B^2-C

дааа.. а если вероятность дождя 60% и снега 50%, то вероятность выпадения осадков 110%? Молчите, будете умнее казаться. Правильную формулу я уже указал.

terminus

f_andrey писал(а): Не в обиду будет сказано, но если бы они были ориентированы на 99.999 то вы явно не были бы их исполнителем
А по теме да надо много искать и вероятно дохрена считать причем понимая специфику, ну и если уж искать то в зарубежной литературе и стандартах, у нас тоже есть всякие методики расчета надежности, но они были больше рассчитаны на механику ну или электронику, да и разрабатывались давненько.

Они еще не купили, они еще пока только щупаютЪ

а моя контора значит предлагает (а йа поставлен исполнителем)...
Если я сам не найду методику расчета то озабочу этим манагеров.

rainy · Непрочитанное сообщение **rainy** » 2009-10-15 17:25:05

дааа.. а если вероятность дождя 60% и снега 50%, то вероятность выпадения осадков 110%? Молчите, будете умнее казаться. Правильную формулу я уже указал.

ну а по вашей формуле 0,3, т.е. вероятность наступления осадков меньше чем выпадения дождя или снега.
в случае дождя и снега вероятность будет 0,6+0,5-0,6*0,5.
я ошибся, события ведь совместно могут произойти.
В любом случае, ваша формула тоже неверна.

paradox · Непрочитанное сообщение **paradox** » 2009-10-15 17:27:04

Burner · Непрочитанное сообщение **Burner** » 2009-10-15 18:06:35

rainy писал(а):
дааа.. а если вероятность дождя 60% и снега 50%, то вероятность выпадения осадков 110%? Молчите, будете умнее казаться. Правильную формулу я уже указал.
ну а по вашей формуле 0,3, т.е. вероятность наступления осадков меньше чем выпадения дождя или снега.
в случае дождя и снега вероятность будет 0,6+0,5-0,6*0,5.
я ошибся, события ведь совместно могут произойти.
В любом случае, ваша формула тоже неверна.

Откуда это волшебное число 0.3? Школота.. откройте учебник уже.

rainy · Непрочитанное сообщение **rainy** » 2009-10-15 21:54:25

Откуда это волшебное число 0.3? Школота.. откройте учебник уже.

гы....
чувство собственной важности зашкаливает, однако

LizardOfOzz

Даже если договориться о формуле расчёта вероятностей, где вы возьмёте вероятности отказа каждого компонента системы?

terminus

Кроме "Коэффициента оперативной готовности" для которого я нашел формулки с примером
http://ru.wikipedia.org/wiki/Коэффициен ... готовности

я еще нашарил вот такой "Коэффициент готовности"
http://ru.wikipedia.org/wiki/Коэффициент_готовности
http://ru.wikipedia.org/wiki/Наработка_на_отказ

тут вообще все в шоколаде с расчетами - "Наработка на отказ" указывается производителем каждой железки, а время вынужденного простоя можно спрогнозировать (сколько времени надо для замены диска в рейде?). Вот только формула даст результаты для отдельных компонентов системы (диски, проц, память, тыры-пыры), а вот как потом объеденить полученные результаты вмести и вывести общий коэфициент для сервера, для кластера.

По идее ведь мы будем работать с теми же вероятностями, значит можно применять стандартные методы...

---
Вот почему я клал болт на теорию вероятности и спал на парах?

paradox · Непрочитанное сообщение **paradox** » 2009-10-15 22:46:15

потому что ни один превод не может внятно обьяснит практическое применение теории вероятности
поэтому студенты мало ею интерисуються)

Alex Keda

0.6 x 0.5 = 0.3
профессор прав, вообще-то.

paradox · Непрочитанное сообщение **paradox** » 2009-10-15 23:18:36

но про дождь и снег это однозначно надо в next
досих пор смеюсь когда перечитываю

а если вероятность дождя 60% и снега 50%, то вероятность выпадения осадков 110%?

ну а по вашей формуле 0,3, т.е. вероятность наступления осадков меньше чем выпадения дождя или снега

Burner · Непрочитанное сообщение **Burner** » 2009-10-16 7:38:58

зачем, ну зачем умножать 0,6 на 0,5? Ну откуда это следует?
Для самых одаренных, еще раз объясняю:
А - вероятность выпадения дождя, В - вероятность выпадения снега
Вероятность выпадения осадков равна (1-(1-А)(1-В))=1-(1-B-A+A*B)=A+B-A*B
Удивительно, не правда ли?

rainy · Непрочитанное сообщение **rainy** » 2009-10-16 8:23:03

давайте я попробую расставить все точки над i
to terminus: Вы хотели использовать теорему умножения вероятностей?
тогда перемножать надо не вероятности выхода из строя, а вероятности невыхода, т.е. по той формуле, которую вам дал Burner, она верная.
Я хотел дать вам формулу для теоремы сложения вероятностей, но ошибся, и меня тут же закидали говном. Сейчас, конечно, я могу ее написать правильно, но это уже неактуально.
to Burner: я конечно понимаю, что методика "закидать говном оппонента" чрезвычайно популярна в российских интернетах. Но, может стоит уже начинать отходить от этой порочной практики. Все таки форумы для передачи знаний и информации, а не для оскорблений.

rainy · Непрочитанное сообщение **rainy** » 2009-10-16 8:26:48

потому что ни один превод не может внятно обьяснит практическое применение теории вероятности
поэтому студенты мало ею интерисуються)

Когда я учился, у нас двое одногрупников любили играть в автоматы(тогда они были повсеместно), так по этому предмету у них была очень хорошая успеваемость.

forum.lissyara.su

Как расчитать показатель надежности для системы?

Как расчитать показатель надежности для системы?

Услуги хостинговой компании Host-Food.ru

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?

Re: Как расчитать показатель надежности для системы?