10 рейд через geom

Решение проблем связванных с работой железа. Проблемы программно-аппаратной совместимости.
Правила форума
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
playnet
мл. сержант
Сообщения: 75
Зарегистрирован: 2009-07-02 15:33:24

10 рейд через geom

Непрочитанное сообщение playnet » 2009-12-10 1:22:24

Есть кучка серверов, где через gmirror сделано зеркало. И при ребуте по питанию оно всегда переходит в degraded, ставя один из дисков на перестройку. А если это будет 6 дисков в 10? Или к примеру 12... Все мирроры будут рассыпаться, но страйп будет всегда исправен? Какова вероятность распадения страйпа и что потом вообще делать.. И что делать программно, чтобы оно не распадалось. Подключать gjournal поможет? Или может попробовать zfs-raid...
Аппаратно меры принимаются, но в последний раз к примеру блок батарей ибп не то оплавился, не то так красиво вздулся... Но в общем умер.

Хостинговая компания Host-Food.ru
Хостинг HostFood.ru
 

Услуги хостинговой компании Host-Food.ru

Хостинг HostFood.ru

Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/

Аватара пользователя
angelas_
сержант
Сообщения: 212
Зарегистрирован: 2009-08-26 13:04:09
Откуда: Oslo, Norway
Контактная информация:

Re: 10 рейд через geom

Непрочитанное сообщение angelas_ » 2009-12-10 14:26:34

Использовать UPS'ы и хардверные рейд контроллеры.
:smile:
Тэстэд ин экстримс!

playnet
мл. сержант
Сообщения: 75
Зарегистрирован: 2009-07-02 15:33:24

Re: 10 рейд через geom

Непрочитанное сообщение playnet » 2009-12-11 13:29:13

angelas_ писал(а):Использовать UPS'ы и хардверные рейд контроллеры.
:smile:
Про упс смотри выше. Был кстати стоечный, 2-юнитовый.. Не знаю, что там произошло, но потом все от электролита отмывал. Батарейный блок (ББ) восстановлению не подлежит. Поставил пока ББ от другой упсы, менее нужной.
аппаратный рейд это хорошо, но вопрос был по программным. НЕту пока финансов на аппаратные.

Аватара пользователя
angelas_
сержант
Сообщения: 212
Зарегистрирован: 2009-08-26 13:04:09
Откуда: Oslo, Norway
Контактная информация:

Re: 10 рейд через geom

Непрочитанное сообщение angelas_ » 2009-12-11 14:04:07

playnet писал(а):Про упс смотри выше. Был кстати стоечный, 2-юнитовый.. Не знаю, что там произошло, но потом все от электролита отмывал. Батарейный блок (ББ) восстановлению не подлежит. Поставил пока ББ от другой упсы, менее нужной.
аппаратный рейд это хорошо, но вопрос был по программным. НЕту пока финансов на аппаратные.
Странно конечно, за всю свою жизнь не видел такого, правда у меня в основном везде APC упсы были. Но, всяко бывает, мож дополнительную защиту ставьте? Или там у вас не от сети он погорел? Может акумы левые были?


Да, аппаратные рейды не дёшевы... Если нет денег на аппаратные рейды - значит будете наблюдать как будут сыпаться рейды и после перезагрузки восстанавливаться. Можете попробовать поставить gjournal на gmirror, чтоб хотя бы fsck меньше работы было и не слишком боялся потери питания. Ну или дождаться по крайней мере UFS+SU+J, так как gjournal всё-таки помедленнее будет.
:smile:
Тэстэд ин экстримс!

playnet
мл. сержант
Сообщения: 75
Зарегистрирован: 2009-07-02 15:33:24

Re: 10 рейд через geom

Непрочитанное сообщение playnet » 2009-12-11 22:32:29

angelas_ писал(а):Странно конечно, за всю свою жизнь не видел такого, правда у меня в основном везде APC упсы были. Но, всяко бывает, мож дополнительную защиту ставьте? Или там у вас не от сети он погорел? Может акумы левые были?
Фирменные. Вряд ли это питание, еще несколько таких же стояли недалеко, и все с ними хорошо. Причем мой настольный PCM даже не пискнул, когда тот на секунду отрубил нагрузку и запахло горелым. Похоже, на автоматическом самотестировании пробило один из аккумов и получили внутреннее КЗ на большие токи.
Да, аппаратные рейды не дёшевы... Если нет денег на аппаратные рейды - значит будете наблюдать как будут сыпаться рейды и после перезагрузки восстанавливаться. Можете попробовать поставить gjournal на gmirror, чтоб хотя бы fsck меньше работы было и не слишком боялся потери питания. Ну или дождаться по крайней мере UFS+SU+J, так как gjournal всё-таки помедленнее будет.
:smile:
Зеркала-то пусть распадаются, меня больше волнует, чтобы страйпы при этом дисков не теряли. Ибо это совсем другая проблема.. с потерей рейда и ...

Аватара пользователя
angelas_
сержант
Сообщения: 212
Зарегистрирован: 2009-08-26 13:04:09
Откуда: Oslo, Norway
Контактная информация:

Re: 10 рейд через geom

Непрочитанное сообщение angelas_ » 2009-12-12 0:03:51

playnet писал(а):Фирменные. Вряд ли это питание, еще несколько таких же стояли недалеко, и все с ними хорошо. Причем мой настольный PCM даже не пискнул, когда тот на секунду отрубил нагрузку и запахло горелым. Похоже, на автоматическом самотестировании пробило один из аккумов и получили внутреннее КЗ на большие токи.
Нда.. Жесть.. :(
playnet писал(а):Зеркала-то пусть распадаются, меня больше волнует, чтобы страйпы при этом дисков не теряли. Ибо это совсем другая проблема.. с потерей рейда и ...
Ну так если потеряете оба диска из одного зеркала, тогда даже и хардверный рейд не поможет. Делайте 0 из 2 зеркал и не парьтесь ;-)
Тэстэд ин экстримс!

playnet
мл. сержант
Сообщения: 75
Зарегистрирован: 2009-07-02 15:33:24

Re: 10 рейд через geom

Непрочитанное сообщение playnet » 2009-12-12 16:52:14

angelas_ писал(а):
playnet писал(а):Зеркала-то пусть распадаются, меня больше волнует, чтобы страйпы при этом дисков не теряли. Ибо это совсем другая проблема.. с потерей рейда и ...
Ну так если потеряете оба диска из одного зеркала, тогда даже и хардверный рейд не поможет. Делайте 0 из 2 зеркал и не парьтесь ;-)
Это и называется 10 рейд. И зеркала теряют по 1 диску из пары. Скорее всего, хард рейд с батарейкой тут бы помог.
10 бывает не только на 4 диска, может быть страйп и из 4 зеркал, и более.
Причины распадания зеркала мне примерно понятны, а вот что будет со страйпом при отключениях, для меня вопрос. Это надо брать 4-8 дисков и тестить-тестить...

Аватара пользователя
angelas_
сержант
Сообщения: 212
Зарегистрирован: 2009-08-26 13:04:09
Откуда: Oslo, Norway
Контактная информация:

Re: 10 рейд через geom

Непрочитанное сообщение angelas_ » 2009-12-12 21:27:00

playnet писал(а):Это и называется 10 рейд. И зеркала теряют по 1 диску из пары. Скорее всего, хард рейд с батарейкой тут бы помог.
10 бывает не только на 4 диска, может быть страйп и из 4 зеркал, и более.
Да знаю я.
:smile:
playnet писал(а):Причины распадания зеркала мне примерно понятны, а вот что будет со страйпом при отключениях, для меня вопрос. Это надо брать 4-8 дисков и тестить-тестить...
А что со страйпом будет? Ничего не будет. Файловая система будет dirty, fsck пробежит и всё. Ну а если есть журнал - откатится и всё.
У меня, кстати, не всегда зеркало разваливалось при потери питания. Но да, это бувает очень часто. Если сервер непроизводил активных операций записи на диск, тогда может и не развалиться зеркало. А вываливается диск из зеркала потому, что при потери питания GEOM теряет информацию что уже записано, а что нет поэтому он не может гарантировать что информация на обоих дисках идентична. Для этого и делается resync. При наличии батарейки у хардверного контроллера он помнит что осталось незаписанно на диски и после восстановления питания он просто-напросто дописывает и всё. Страйпу не нужно обеспечивать идентичность (зеркало) или сохранения контрольной суммы (raid5, raid6), поэтому ему и нечего разваливаться.
А протестировать перед использованием так это нужно в обязательном порядке, я после определённых трудностей лет так 6-7 назад без тестов стараюсь не пускать систему в продакшн.
:smile:
Тэстэд ин экстримс!