Страница 1 из 2
Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 11:07:44
terminus
Возникла задача - клиент просит предоставить расчет надежности для системы состоящей из нескольких серверов объедененных в кластер. Необходимо обосновать, что на уровне железа надежность будет 99.999
Как расчитывать такие показатели?
Производители железных компонентов обычно пишут для низ MTBF (mean time between failures / среднее время до отказа) - по-идее это есть готовая вероятность...
Хорошо, проедположим что есть вероятности для всех-всех основных железок из которых состоят серваки и инфраструктура - что дальше то? Вероятность выхода из строя сервака как целого, наверно можно посчитать на основании вероятности для самого слабого из его компонентов? Например, если для процессора Р = 0.000001, а для единственного жесткого диска Р = 0.001 то сам сервер будет полностью зависеть от работы диска и вероятность его отказа = 0.001...
У меня в кластере будет 4 машины и один стекуемый свитч состоящий из 2х частей. 2 машини это ноды данных, вторые 2 машины это ноды SQL - они дублируют друг друга. Таким образом мне нужно найти вероятности одновременного выхода из строя для 2х нод данны (Рdata), потом для 2х SQL нод (Рsql), потом для свитча (Pswith), а потом просто перемножить их между собой: Рdata х Рsql х Pswith
В итоге я получу, скажем число 0.0001 для вероятности сбоя железа, что есть 99.999 вероятность не сбоя - она же бужет желанный uptime?
Я правильно рассуждаю? Кто-нить пните в верном направлении если ошибаюсь.

Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 11:49:00
terminus
вот такой пример нашел в одной книжке про расчеты надежностей тех. систем. По ней как я понял можно будет расчитать вероятности для отдельных серверов. Потом полученные значения перемножаем и будет общее для всей системы.

Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 12:48:35
Burner
terminus писал(а):Необходимо обосновать, что на уровне железа надежность будет 99.999
гы...
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 13:17:51
terminus
Ну вот как-то так, да... Для этого все сервера в кластере продублированны и все такое. Требовать надежность в 5 девяток от конкретного жесткого диска никто, конечно, не станет, но чуваки серьезно ориентированны на научный подход на фазе планирования.
Если получится расчитать ожидаемый uptime для конкретных серверов в кластере то это уже будет подспорье.
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 13:49:12
Gloft
terminus писал(а):
У меня в кластере будет 4 машины и один стекуемый свитч состоящий из 2х частей. 2 машини это ноды данных, вторые 2 машины это ноды SQL - они дублируют друг друга. Таким образом мне нужно найти вероятности одновременного выхода из строя для 2х нод данны (Рdata), потом для 2х SQL нод (Рsql), потом для свитча (Pswith), а потом просто перемножить их между собой: Рdata х Рsql х Pswith
В итоге я получу, скажем число 0.0001 для вероятности сбоя железа, что есть 99.999 вероятность не сбоя - она же бужет желанный uptime?
Я правильно рассуждаю? Кто-нить пните в верном направлении если ошибаюсь.

По моему ты рассуждаешь неверно. Тебе надо найти вероятность выхода из строя одновременно двух узлов (оба сервера баз данных, оба свича, оба сервера приложений) из всей системы.
Т.к. именно в этом случае вся система будет выведена из строя.
Посмотри источник Вл.В.Воеводин, С.А.Жуматий. Вычислительное дело и кластерные системы. На сайте
http://www.parallel.ru/.
Там думаю ты найдешь что искал или подскажут у кого можно спросить.
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 14:52:31
rainy
а потом просто перемножить их между собой: Рdata х Рsql х Pswith
не перемножить, а сложить
Подумай, а то по твоей логике с умножением получается, чем больше узлов в системе, тем она надежней.
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 15:07:23
Burner
ну и арифметика пошла...
A - вероятность отказа одной ноды данных. В - вероятность отказа одной ноды SQL, C - вероятность отказа свича.
Вероятность выхода из строя системы равна (1-(1-A^2)*(1-B^2)*(1-C))
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 15:43:50
terminus
не перемножить, а сложить
Подумай, а то по твоей логике с умножением получается, чем больше узлов в системе, тем она надежней.
вероятности исчисляются от [0;1]
0.99 * 0.98 = 0,9702
Меня интересует событие отказ всей системы поэтому решил что надо считать по "теореме умножения вероятностей".
Ненавижу терию вероятности и статистику

Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 16:27:53
rainy
вероятности исчисляются от [0;1]
0.99 * 0.98 = 0,9702
мне кажется ты уже запутался. Ты хочешь посчитать вероятность выхода из строя или вероятность не выхода?
Меня интересует событие отказ всей системы поэтому решил что надо считать по "теореме умножения вероятностей"
Это было бы актуально, если бы выход из строя одной части системы не влиял на нее целиком. Если, например, выйдет из строя свитч, то система не будет работать.
На простом примере: Вероятность, что пойдет дождь сегодня 0,3%, вероятность, что пойдет снег - 0,1%. Таким образом, вероятность выпадения осадков 0,4. У тебя тоже самое. То есть, если использовать обозначения Burner, то формула для надёжности будет следующая:
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 16:30:01
f_andrey
terminus писал(а):Ну вот как-то так, да... Для этого все сервера в кластере продублированны и все такое. Требовать надежность в 5 девяток от конкретного жесткого диска никто, конечно, не станет, но чуваки серьезно ориентированны на научный подход на фазе планирования.
Если получится расчитать ожидаемый uptime для конкретных серверов в кластере то это уже будет подспорье.
Не в обиду будет сказано, но если бы они были ориентированы на 99.999 то вы явно не были бы их исполнителем
А по теме да надо много искать и вероятно дохрена считать причем понимая специфику, ну и если уж искать то в зарубежной литературе и стандартах, у нас тоже есть всякие методики расчета надежности, но они были больше рассчитаны на механику ну или электронику, да и разрабатывались давненько.
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 16:33:25
paradox
обратитесь к преподавателю по теории вероятности в университет
он точно знает
мы например похожие примеры кажеться проходили
мне конспект лень искать)
да и не факт что найду
давненько было
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 16:36:01
Burner
rainy писал(а):
На простом примере: Вероятность, что пойдет дождь сегодня 0,3%, вероятность, что пойдет снег - 0,1%. Таким образом, вероятность выпадения осадков 0,4. У тебя тоже самое. То есть, если использовать обозначения Burner, то формула для надёжности будет следующая:
дааа.. а если вероятность дождя 60% и снега 50%, то вероятность выпадения осадков 110%? Молчите, будете умнее казаться. Правильную формулу я уже указал.
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 16:41:44
terminus
f_andrey писал(а):
Не в обиду будет сказано, но если бы они были ориентированы на 99.999 то вы явно не были бы их исполнителем
А по теме да надо много искать и вероятно дохрена считать причем понимая специфику, ну и если уж искать то в зарубежной литературе и стандартах, у нас тоже есть всякие методики расчета надежности, но они были больше рассчитаны на механику ну или электронику, да и разрабатывались давненько.
Они еще не купили, они еще пока только щупаютЪ

а моя контора значит предлагает (а йа поставлен исполнителем)...
Если я сам не найду методику расчета то озабочу этим манагеров.
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 17:25:05
rainy
дааа.. а если вероятность дождя 60% и снега 50%, то вероятность выпадения осадков 110%? Молчите, будете умнее казаться. Правильную формулу я уже указал.
ну а по вашей формуле 0,3, т.е. вероятность наступления осадков меньше чем выпадения дождя или снега.
в случае дождя и снега вероятность будет 0,6+0,5-0,6*0,5.
я ошибся, события ведь совместно могут произойти.
В любом случае, ваша формула тоже неверна.

Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 17:27:04
paradox
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 18:06:35
Burner
rainy писал(а):дааа.. а если вероятность дождя 60% и снега 50%, то вероятность выпадения осадков 110%? Молчите, будете умнее казаться. Правильную формулу я уже указал.
ну а по вашей формуле 0,3, т.е. вероятность наступления осадков меньше чем выпадения дождя или снега.
в случае дождя и снега вероятность будет 0,6+0,5-0,6*0,5.
я ошибся, события ведь совместно могут произойти.
В любом случае, ваша формула тоже неверна.

Откуда это волшебное число 0.3? Школота.. откройте учебник уже.
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 21:54:25
rainy
Откуда это волшебное число 0.3? Школота.. откройте учебник уже.
гы....
чувство собственной важности зашкаливает, однако
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 22:08:47
LizardOfOzz
Даже если договориться о формуле расчёта вероятностей, где вы возьмёте вероятности отказа каждого компонента системы?
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 22:42:07
terminus
Кроме "Коэффициента оперативной готовности" для которого я нашел формулки с примером
http://ru.wikipedia.org/wiki/Коэффициен ... готовности
я еще нашарил вот такой "Коэффициент готовности"
http://ru.wikipedia.org/wiki/Коэффициент_готовности
http://ru.wikipedia.org/wiki/Наработка_на_отказ
тут вообще все в шоколаде с расчетами - "Наработка на отказ" указывается производителем каждой железки, а время вынужденного простоя можно спрогнозировать (сколько времени надо для замены диска в рейде?). Вот только формула даст результаты для отдельных компонентов системы (диски, проц, память, тыры-пыры), а вот как потом объеденить полученные результаты вмести и вывести общий коэфициент для сервера, для кластера.

По идее ведь мы будем работать с теми же вероятностями, значит можно применять стандартные методы...
---
Вот почему я клал болт на теорию вероятности и спал на парах?

Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 22:46:15
paradox
потому что ни один превод не может внятно обьяснит практическое применение теории вероятности
поэтому студенты мало ею интерисуються)
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 23:09:16
Alex Keda
0.6 x 0.5 = 0.3
профессор прав, вообще-то.
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-15 23:18:36
paradox
но про дождь и снег это однозначно надо в next
досих пор смеюсь когда перечитываю
а если вероятность дождя 60% и снега 50%, то вероятность выпадения осадков 110%?
ну а по вашей формуле 0,3, т.е. вероятность наступления осадков меньше чем выпадения дождя или снега

Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-16 7:38:58
Burner
зачем, ну зачем умножать 0,6 на 0,5? Ну откуда это следует?
Для самых одаренных, еще раз объясняю:
А - вероятность выпадения дождя, В - вероятность выпадения снега
Вероятность выпадения осадков равна (1-(1-А)(1-В))=1-(1-B-A+A*B)=A+B-A*B
Удивительно, не правда ли?
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-16 8:23:03
rainy
давайте я попробую расставить все точки над i
to terminus: Вы хотели использовать теорему умножения вероятностей?
тогда перемножать надо не вероятности выхода из строя, а вероятности невыхода, т.е. по той формуле, которую вам дал Burner, она верная.
Я хотел дать вам формулу для теоремы сложения вероятностей, но ошибся, и меня тут же закидали говном. Сейчас, конечно, я могу ее написать правильно, но это уже неактуально.
to Burner: я конечно понимаю, что методика "закидать говном оппонента" чрезвычайно популярна в российских интернетах. Но, может стоит уже начинать отходить от этой порочной практики. Все таки форумы для передачи знаний и информации, а не для оскорблений.
Re: Как расчитать показатель надежности для системы?
Добавлено: 2009-10-16 8:26:48
rainy
потому что ни один превод не может внятно обьяснит практическое применение теории вероятности
поэтому студенты мало ею интерисуються)
Когда я учился, у нас двое одногрупников любили играть в автоматы(тогда они были повсеместно), так по этому предмету у них была очень хорошая успеваемость.
