Intel SRCU42X Degraded RAID5
Правила форума
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
- FreeBSP
- майор
- Сообщения: 2020
- Зарегистрирован: 2009-05-24 20:20:19
- Откуда: Москва
Intel SRCU42X Degraded RAID5
Дано:
* сервер с контроллером Intel SRCU42X
* аппаратный RAID5 из пяти 73-гектарных сказей320 в состоянии Degraded.
Цель:
* восстановить RAID из Degraded до Optimal, желательно без полного ребилда и инициализации массива
нашел вот эти руководства
http://www.intel.com/cd/channel/reselle ... 257580.htm
http://www.intel.com/cd/channel/reselle ... 250742.htm
как я понимаю, надо заменить битый хард на исправный и сделать ребилд вновь вставленного харда?
непонятно как перевести битый хард в оффлайн, тем более что уже вставил новый. достаточно ли просто запустить ребилд одного нового харда? не повлечет ли это ребилд и инициализацию всего массива?
PS Прошу прощения за нубские вопросы, ткните плз носом, что почитать, или посоветуйте что делать..
* сервер с контроллером Intel SRCU42X
* аппаратный RAID5 из пяти 73-гектарных сказей320 в состоянии Degraded.
Цель:
* восстановить RAID из Degraded до Optimal, желательно без полного ребилда и инициализации массива
нашел вот эти руководства
http://www.intel.com/cd/channel/reselle ... 257580.htm
http://www.intel.com/cd/channel/reselle ... 250742.htm
как я понимаю, надо заменить битый хард на исправный и сделать ребилд вновь вставленного харда?
непонятно как перевести битый хард в оффлайн, тем более что уже вставил новый. достаточно ли просто запустить ребилд одного нового харда? не повлечет ли это ребилд и инициализацию всего массива?
PS Прошу прощения за нубские вопросы, ткните плз носом, что почитать, или посоветуйте что делать..
Человек начинает получать первые наслаждения от знакомства с unix системами. Ему нужно помочь - дальше он сможет получать наслаждение самостоятельно ©
Ламер — не желающий самостоятельно разбираться. Не путать с новичком: ламер опасен и знает это!
Ламер — не желающий самостоятельно разбираться. Не путать с новичком: ламер опасен и знает это!
Услуги хостинговой компании Host-Food.ru
Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/
- Alex Keda
- стреляли...
- Сообщения: 35426
- Зарегистрирован: 2004-10-18 14:25:19
- Откуда: Made in USSR
- Контактная информация:
Re: Intel SRCU42X Degraded RAID5
насколько помню -
пометить активным,
запустить ребилд.
всё мона из интерфейса ерйда.
======
если ждёт - могу в понедельник притащщить такой же (src-чё-то-там) - попробовать на нём эмулировать ситуацию
пометить активным,
запустить ребилд.
всё мона из интерфейса ерйда.
======
если ждёт - могу в понедельник притащщить такой же (src-чё-то-там) - попробовать на нём эмулировать ситуацию
Убей их всех! Бог потом рассортирует...
- FreeBSP
- майор
- Сообщения: 2020
- Зарегистрирован: 2009-05-24 20:20:19
- Откуда: Москва
Re: Intel SRCU42X Degraded RAID5
вот тут в пункте 14 пишут наоборот,
http://forum.ixbt.com/post.cgi?id=annc:11:38437
что принудительно ставить диски в онлайн можно только если упало _одновременно_ два и более дисков и если точно известно, что они упали одновременно(например при отключении света), а не последовательно(например при отключении света). и если поставить в онлайн дохлый или левый диск то это может погубить весь массив
время терпит, где то до среды минимум, в выходные доступа к серверу скорее всего не будет, но и информация лишней не будет
http://forum.ixbt.com/post.cgi?id=annc:11:38437
что принудительно ставить диски в онлайн можно только если упало _одновременно_ два и более дисков и если точно известно, что они упали одновременно(например при отключении света), а не последовательно(например при отключении света). и если поставить в онлайн дохлый или левый диск то это может погубить весь массив
время терпит, где то до среды минимум, в выходные доступа к серверу скорее всего не будет, но и информация лишней не будет

Человек начинает получать первые наслаждения от знакомства с unix системами. Ему нужно помочь - дальше он сможет получать наслаждение самостоятельно ©
Ламер — не желающий самостоятельно разбираться. Не путать с новичком: ламер опасен и знает это!
Ламер — не желающий самостоятельно разбираться. Не путать с новичком: ламер опасен и знает это!
- Alex Keda
- стреляли...
- Сообщения: 35426
- Зарегистрирован: 2004-10-18 14:25:19
- Откуда: Made in USSR
- Контактная информация:
Re: Intel SRCU42X Degraded RAID5
могу и заблуждаться
в понедельник попробую, отпишусь
в понедельник попробую, отпишусь
Убей их всех! Бог потом рассортирует...
-
- проходил мимо
Re: Intel SRCU42X Degraded RAID5
Спасибо
я не утверждаю, что там правильно, просто видел другую точку зрения

- FreeBSP
- майор
- Сообщения: 2020
- Зарегистрирован: 2009-05-24 20:20:19
- Откуда: Москва
Re: Intel SRCU42X Degraded RAID5
сделал, еще вчера, но отписаться есть время только сейчас
все сказанное сделал на контроллере SRCU42X, но может работать и на следующих контроллерах
все делал из RAID BIOS Console, но вроде в веб-консоли тоже можно
кроме того, если контроллер и корзинка для хардов умеют правильно обрабатывать выключение и включение харда в работе, то горячая замена дохлого харда на новый может повлечь автоматический запуск ребилда вновь вставленного диска и через время, если все пройдет успешно, диск поднимется в онлайн, а массив соотвественно в optimal
но я о возможностях контроллера и корзинки обрабатывать горячую замену диска не знал, сервак не боевой, поэтому все делал через выключение сервера.
Есть degraded raid5 из пяти одинаковых ultra320 сказевых хардов. Один из хардов отказал и массив перешел в состояние degraded - напомню, это такое состояние массива, при котором массив работоспособен при отсутствии/отказе одного любого диска. Надежность массива понижается до уровня raid0, а информация, содержавшаяся на выпавшем диске вычисляется из имеющейся информации и parity-блоков. Как следствие, существенно понижается скорость доступа к массиву.
В рейд биосе дохлый хард отображается как Failed, его лампочка в корзинке горит желтым, а сервак пищит протяжным неприятным писком, сигнализируя о деградировавшем массиве. Диск рекомендуется как можно быстрее заменить, причем желательно на идентичный выпавшему. Нередки случаи, когда два диска умирают один за другим с небольшим промежутком.
Диск заменил на выключенном сервере, но писк не прекратился, в рейд биосе диск остался Failed, а массив - Degraded. Логично, аппаратная замена диска не повлекла восстановление массива. А чтобы диск встал в массив надо сделать ребилд вновь вставленного диска. При этом вся информация, содержавшаяся на выпавшем диске будет перевычислена и записана на вставленный диск, а сам диск по окончании этой операции станет частью массива. На главном экране в верхней правой части выпавший диск будет иметь статус Failed. Тыркаем на него и попадаем в его свойства. Тут можно принудительно отправить диск в онлайн, или сделать его ребилд. Нам нужно сделать ребилд замененного диска, поэтому ставим соответствующую и жмем Гоу. Есть еще какой то выбор, но там оставляем все как есть. Прогрессбар появится внизу страницы свойств диска. На ребилд 73-гигового винчестера у меня ушло около полутора часов, после чего диск сам встал в онлайн, массив вернулся в Optimal, а писк прекратился.
Немного о граблях - чтобы писк не давил на мозги можно его выключить, ткнув на соотвествующую кнопочку. Одинарное тырканье эффекта над раздражителем не возымело, а двойное вызывало подвисание. Кстати, ребут во время ребилда может убить хард(ы), так что советую опробовать эффект заветной кнопочки до начала ребилда.
Операция Make Online может спасти ситуацию, если два и более дисков выпали _одновременно_, диски исправны физически и логически, но контроллер почему то считает что они умерли. Операция Make Online заставит контроллер считать что диск исправен и, внимание, на нем заведомо верные данные. Но если диски неисправны, или, даже,просто читались на другой машине под виндой, то эта операция повлечет утрату всей информации на массиве. Так что перед этой операцией рекомендуется сделать полное посекторное копирование всех дисков массива.
Напоследок стоит отметить, что Биос определяет контроллер как диск(или диски, если создано несколько массивов). Поэтому как только начинается инициализация дисков мы попадаем на экран контроллера, где можем войти в рейд биос, нажав Control+G. А вход в обычный биос материнки будет выполнен только после того как контроллер разберется со своими дисками и сообщит БИОСу машины информацию о массивах. Это важно, потому что заветные Del и F2
не будут иметь эффекта до тех пор, пока raid контроллер не вернет управление БИОСу материнки.
Ну и хрестоматийные слова:
1) RAID не заменяет бекап;
2) перед внесением изменений в массив создавайте полные посекторные бекапы всех дисков массива;
3) Если на массиве очень важная информация, а актуальных бекапов нет, доверьте восстановление информации профессионалам
Вроде все рассказал про свое первое знакомство с серверными сказёвыми рейдами вообще и с означенным контроллером в частности. Если есть какие вопросы, постараюсь ответить, но в этой области я сам пока еще новичок. Если материал интересен и полезен, можно причесать и вынести в статью.
все сказанное сделал на контроллере SRCU42X, но может работать и на следующих контроллерах
- Intel® RAID Controller SRCS16
- Intel® RAID Controller SRCS28X
- Intel® RAID Controller SRCU41L
- Intel® RAID Controller SRCU42E
- Intel® RAID Controller SRCU42X
- Intel® RAID Controller SRCZCRX
- Intel® RAID Controller SROMBU42E
все делал из RAID BIOS Console, но вроде в веб-консоли тоже можно
кроме того, если контроллер и корзинка для хардов умеют правильно обрабатывать выключение и включение харда в работе, то горячая замена дохлого харда на новый может повлечь автоматический запуск ребилда вновь вставленного диска и через время, если все пройдет успешно, диск поднимется в онлайн, а массив соотвественно в optimal
но я о возможностях контроллера и корзинки обрабатывать горячую замену диска не знал, сервак не боевой, поэтому все делал через выключение сервера.
Есть degraded raid5 из пяти одинаковых ultra320 сказевых хардов. Один из хардов отказал и массив перешел в состояние degraded - напомню, это такое состояние массива, при котором массив работоспособен при отсутствии/отказе одного любого диска. Надежность массива понижается до уровня raid0, а информация, содержавшаяся на выпавшем диске вычисляется из имеющейся информации и parity-блоков. Как следствие, существенно понижается скорость доступа к массиву.
В рейд биосе дохлый хард отображается как Failed, его лампочка в корзинке горит желтым, а сервак пищит протяжным неприятным писком, сигнализируя о деградировавшем массиве. Диск рекомендуется как можно быстрее заменить, причем желательно на идентичный выпавшему. Нередки случаи, когда два диска умирают один за другим с небольшим промежутком.
Диск заменил на выключенном сервере, но писк не прекратился, в рейд биосе диск остался Failed, а массив - Degraded. Логично, аппаратная замена диска не повлекла восстановление массива. А чтобы диск встал в массив надо сделать ребилд вновь вставленного диска. При этом вся информация, содержавшаяся на выпавшем диске будет перевычислена и записана на вставленный диск, а сам диск по окончании этой операции станет частью массива. На главном экране в верхней правой части выпавший диск будет иметь статус Failed. Тыркаем на него и попадаем в его свойства. Тут можно принудительно отправить диск в онлайн, или сделать его ребилд. Нам нужно сделать ребилд замененного диска, поэтому ставим соответствующую и жмем Гоу. Есть еще какой то выбор, но там оставляем все как есть. Прогрессбар появится внизу страницы свойств диска. На ребилд 73-гигового винчестера у меня ушло около полутора часов, после чего диск сам встал в онлайн, массив вернулся в Optimal, а писк прекратился.
Немного о граблях - чтобы писк не давил на мозги можно его выключить, ткнув на соотвествующую кнопочку. Одинарное тырканье эффекта над раздражителем не возымело, а двойное вызывало подвисание. Кстати, ребут во время ребилда может убить хард(ы), так что советую опробовать эффект заветной кнопочки до начала ребилда.
Операция Make Online может спасти ситуацию, если два и более дисков выпали _одновременно_, диски исправны физически и логически, но контроллер почему то считает что они умерли. Операция Make Online заставит контроллер считать что диск исправен и, внимание, на нем заведомо верные данные. Но если диски неисправны, или, даже,просто читались на другой машине под виндой, то эта операция повлечет утрату всей информации на массиве. Так что перед этой операцией рекомендуется сделать полное посекторное копирование всех дисков массива.
Напоследок стоит отметить, что Биос определяет контроллер как диск(или диски, если создано несколько массивов). Поэтому как только начинается инициализация дисков мы попадаем на экран контроллера, где можем войти в рейд биос, нажав Control+G. А вход в обычный биос материнки будет выполнен только после того как контроллер разберется со своими дисками и сообщит БИОСу машины информацию о массивах. Это важно, потому что заветные Del и F2
не будут иметь эффекта до тех пор, пока raid контроллер не вернет управление БИОСу материнки.
Ну и хрестоматийные слова:
1) RAID не заменяет бекап;
2) перед внесением изменений в массив создавайте полные посекторные бекапы всех дисков массива;
3) Если на массиве очень важная информация, а актуальных бекапов нет, доверьте восстановление информации профессионалам

Вроде все рассказал про свое первое знакомство с серверными сказёвыми рейдами вообще и с означенным контроллером в частности. Если есть какие вопросы, постараюсь ответить, но в этой области я сам пока еще новичок. Если материал интересен и полезен, можно причесать и вынести в статью.
Человек начинает получать первые наслаждения от знакомства с unix системами. Ему нужно помочь - дальше он сможет получать наслаждение самостоятельно ©
Ламер — не желающий самостоятельно разбираться. Не путать с новичком: ламер опасен и знает это!
Ламер — не желающий самостоятельно разбираться. Не путать с новичком: ламер опасен и знает это!
-
- проходил мимо
- Сообщения: 8
- Зарегистрирован: 2009-10-27 11:29:11
Re: Intel SRCU42X Degraded RAID5
Может кому-то пригодится.
На днях "сварился" один винт из 5го рейда на данном контроллере.
Винт был заменен на новый, но в статусе значился как "Not Responding". Немного довелось понервничать, пока не вспомнил про адресацию скази дисков (последний рейд на скази собирал где-то в 2007).
Поставил правильно джампер, сделал ребилд и все завелось.
Порядок расположения перемычек (слева-направо или наоборот) зависит от конкретной модели винта.
Также выводы перемычек бывают как "сзади" винта, так и на его "передней" части. В таком случае они работают в параллели.
1 = замкнутая перемычка.
0000=0
1000=1
0100=2
1100=3
0010=4
1010=5
0110=6
1110=7
0001=8
1001=9
0101=10
1101=11
0011=12
1011=13
0111=14
1111=15
На днях "сварился" один винт из 5го рейда на данном контроллере.
Винт был заменен на новый, но в статусе значился как "Not Responding". Немного довелось понервничать, пока не вспомнил про адресацию скази дисков (последний рейд на скази собирал где-то в 2007).
Поставил правильно джампер, сделал ребилд и все завелось.
Порядок расположения перемычек (слева-направо или наоборот) зависит от конкретной модели винта.
Также выводы перемычек бывают как "сзади" винта, так и на его "передней" части. В таком случае они работают в параллели.
1 = замкнутая перемычка.
0000=0
1000=1
0100=2
1100=3
0010=4
1010=5
0110=6
1110=7
0001=8
1001=9
0101=10
1101=11
0011=12
1011=13
0111=14
1111=15