10 рейд через geom
Правила форума
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
-
- мл. сержант
- Сообщения: 75
- Зарегистрирован: 2009-07-02 15:33:24
10 рейд через geom
Есть кучка серверов, где через gmirror сделано зеркало. И при ребуте по питанию оно всегда переходит в degraded, ставя один из дисков на перестройку. А если это будет 6 дисков в 10? Или к примеру 12... Все мирроры будут рассыпаться, но страйп будет всегда исправен? Какова вероятность распадения страйпа и что потом вообще делать.. И что делать программно, чтобы оно не распадалось. Подключать gjournal поможет? Или может попробовать zfs-raid...
Аппаратно меры принимаются, но в последний раз к примеру блок батарей ибп не то оплавился, не то так красиво вздулся... Но в общем умер.
Аппаратно меры принимаются, но в последний раз к примеру блок батарей ибп не то оплавился, не то так красиво вздулся... Но в общем умер.
Услуги хостинговой компании Host-Food.ru
Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/
- angelas_
- сержант
- Сообщения: 212
- Зарегистрирован: 2009-08-26 13:04:09
- Откуда: Oslo, Norway
- Контактная информация:
-
- мл. сержант
- Сообщения: 75
- Зарегистрирован: 2009-07-02 15:33:24
Re: 10 рейд через geom
Про упс смотри выше. Был кстати стоечный, 2-юнитовый.. Не знаю, что там произошло, но потом все от электролита отмывал. Батарейный блок (ББ) восстановлению не подлежит. Поставил пока ББ от другой упсы, менее нужной.angelas_ писал(а):Использовать UPS'ы и хардверные рейд контроллеры.
аппаратный рейд это хорошо, но вопрос был по программным. НЕту пока финансов на аппаратные.
- angelas_
- сержант
- Сообщения: 212
- Зарегистрирован: 2009-08-26 13:04:09
- Откуда: Oslo, Norway
- Контактная информация:
Re: 10 рейд через geom
Странно конечно, за всю свою жизнь не видел такого, правда у меня в основном везде APC упсы были. Но, всяко бывает, мож дополнительную защиту ставьте? Или там у вас не от сети он погорел? Может акумы левые были?playnet писал(а):Про упс смотри выше. Был кстати стоечный, 2-юнитовый.. Не знаю, что там произошло, но потом все от электролита отмывал. Батарейный блок (ББ) восстановлению не подлежит. Поставил пока ББ от другой упсы, менее нужной.
аппаратный рейд это хорошо, но вопрос был по программным. НЕту пока финансов на аппаратные.
Да, аппаратные рейды не дёшевы... Если нет денег на аппаратные рейды - значит будете наблюдать как будут сыпаться рейды и после перезагрузки восстанавливаться. Можете попробовать поставить gjournal на gmirror, чтоб хотя бы fsck меньше работы было и не слишком боялся потери питания. Ну или дождаться по крайней мере UFS+SU+J, так как gjournal всё-таки помедленнее будет.

Тэстэд ин экстримс!
-
- мл. сержант
- Сообщения: 75
- Зарегистрирован: 2009-07-02 15:33:24
Re: 10 рейд через geom
Фирменные. Вряд ли это питание, еще несколько таких же стояли недалеко, и все с ними хорошо. Причем мой настольный PCM даже не пискнул, когда тот на секунду отрубил нагрузку и запахло горелым. Похоже, на автоматическом самотестировании пробило один из аккумов и получили внутреннее КЗ на большие токи.angelas_ писал(а):Странно конечно, за всю свою жизнь не видел такого, правда у меня в основном везде APC упсы были. Но, всяко бывает, мож дополнительную защиту ставьте? Или там у вас не от сети он погорел? Может акумы левые были?
Зеркала-то пусть распадаются, меня больше волнует, чтобы страйпы при этом дисков не теряли. Ибо это совсем другая проблема.. с потерей рейда и ...Да, аппаратные рейды не дёшевы... Если нет денег на аппаратные рейды - значит будете наблюдать как будут сыпаться рейды и после перезагрузки восстанавливаться. Можете попробовать поставить gjournal на gmirror, чтоб хотя бы fsck меньше работы было и не слишком боялся потери питания. Ну или дождаться по крайней мере UFS+SU+J, так как gjournal всё-таки помедленнее будет.
- angelas_
- сержант
- Сообщения: 212
- Зарегистрирован: 2009-08-26 13:04:09
- Откуда: Oslo, Norway
- Контактная информация:
Re: 10 рейд через geom
Нда.. Жесть..playnet писал(а):Фирменные. Вряд ли это питание, еще несколько таких же стояли недалеко, и все с ними хорошо. Причем мой настольный PCM даже не пискнул, когда тот на секунду отрубил нагрузку и запахло горелым. Похоже, на автоматическом самотестировании пробило один из аккумов и получили внутреннее КЗ на большие токи.

Ну так если потеряете оба диска из одного зеркала, тогда даже и хардверный рейд не поможет. Делайте 0 из 2 зеркал и не парьтесьplaynet писал(а):Зеркала-то пусть распадаются, меня больше волнует, чтобы страйпы при этом дисков не теряли. Ибо это совсем другая проблема.. с потерей рейда и ...

Тэстэд ин экстримс!
-
- мл. сержант
- Сообщения: 75
- Зарегистрирован: 2009-07-02 15:33:24
Re: 10 рейд через geom
Это и называется 10 рейд. И зеркала теряют по 1 диску из пары. Скорее всего, хард рейд с батарейкой тут бы помог.angelas_ писал(а):Ну так если потеряете оба диска из одного зеркала, тогда даже и хардверный рейд не поможет. Делайте 0 из 2 зеркал и не парьтесьplaynet писал(а):Зеркала-то пусть распадаются, меня больше волнует, чтобы страйпы при этом дисков не теряли. Ибо это совсем другая проблема.. с потерей рейда и ...
10 бывает не только на 4 диска, может быть страйп и из 4 зеркал, и более.
Причины распадания зеркала мне примерно понятны, а вот что будет со страйпом при отключениях, для меня вопрос. Это надо брать 4-8 дисков и тестить-тестить...
- angelas_
- сержант
- Сообщения: 212
- Зарегистрирован: 2009-08-26 13:04:09
- Откуда: Oslo, Norway
- Контактная информация:
Re: 10 рейд через geom
Да знаю я.playnet писал(а):Это и называется 10 рейд. И зеркала теряют по 1 диску из пары. Скорее всего, хард рейд с батарейкой тут бы помог.
10 бывает не только на 4 диска, может быть страйп и из 4 зеркал, и более.

А что со страйпом будет? Ничего не будет. Файловая система будет dirty, fsck пробежит и всё. Ну а если есть журнал - откатится и всё.playnet писал(а):Причины распадания зеркала мне примерно понятны, а вот что будет со страйпом при отключениях, для меня вопрос. Это надо брать 4-8 дисков и тестить-тестить...
У меня, кстати, не всегда зеркало разваливалось при потери питания. Но да, это бувает очень часто. Если сервер непроизводил активных операций записи на диск, тогда может и не развалиться зеркало. А вываливается диск из зеркала потому, что при потери питания GEOM теряет информацию что уже записано, а что нет поэтому он не может гарантировать что информация на обоих дисках идентична. Для этого и делается resync. При наличии батарейки у хардверного контроллера он помнит что осталось незаписанно на диски и после восстановления питания он просто-напросто дописывает и всё. Страйпу не нужно обеспечивать идентичность (зеркало) или сохранения контрольной суммы (raid5, raid6), поэтому ему и нечего разваливаться.
А протестировать перед использованием так это нужно в обязательном порядке, я после определённых трудностей лет так 6-7 назад без тестов стараюсь не пускать систему в продакшн.

Тэстэд ин экстримс!