Intel SRCU42X Degraded RAID5

Решение проблем связванных с работой железа. Проблемы программно-аппаратной совместимости.
Правила форума
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
Аватара пользователя
FreeBSP
майор
Сообщения: 2020
Зарегистрирован: 2009-05-24 20:20:19
Откуда: Москва

Intel SRCU42X Degraded RAID5

Непрочитанное сообщение FreeBSP » 2010-07-23 15:00:24

Дано:
* сервер с контроллером Intel SRCU42X
* аппаратный RAID5 из пяти 73-гектарных сказей320 в состоянии Degraded.
Цель:
* восстановить RAID из Degraded до Optimal, желательно без полного ребилда и инициализации массива

нашел вот эти руководства
http://www.intel.com/cd/channel/reselle ... 257580.htm
http://www.intel.com/cd/channel/reselle ... 250742.htm
как я понимаю, надо заменить битый хард на исправный и сделать ребилд вновь вставленного харда?

непонятно как перевести битый хард в оффлайн, тем более что уже вставил новый. достаточно ли просто запустить ребилд одного нового харда? не повлечет ли это ребилд и инициализацию всего массива?

PS Прошу прощения за нубские вопросы, ткните плз носом, что почитать, или посоветуйте что делать..
Человек начинает получать первые наслаждения от знакомства с unix системами. Ему нужно помочь - дальше он сможет получать наслаждение самостоятельно ©
Ламер — не желающий самостоятельно разбираться. Не путать с новичком: ламер опасен и знает это!

Хостинговая компания Host-Food.ru
Хостинг HostFood.ru
 

Услуги хостинговой компании Host-Food.ru

Хостинг HostFood.ru

Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/

Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35456
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Re: Intel SRCU42X Degraded RAID5

Непрочитанное сообщение Alex Keda » 2010-07-23 15:17:46

насколько помню -
пометить активным,
запустить ребилд.
всё мона из интерфейса ерйда.
======
если ждёт - могу в понедельник притащщить такой же (src-чё-то-там) - попробовать на нём эмулировать ситуацию
Убей их всех! Бог потом рассортирует...

Аватара пользователя
FreeBSP
майор
Сообщения: 2020
Зарегистрирован: 2009-05-24 20:20:19
Откуда: Москва

Re: Intel SRCU42X Degraded RAID5

Непрочитанное сообщение FreeBSP » 2010-07-23 16:18:34

вот тут в пункте 14 пишут наоборот,
http://forum.ixbt.com/post.cgi?id=annc:11:38437
что принудительно ставить диски в онлайн можно только если упало _одновременно_ два и более дисков и если точно известно, что они упали одновременно(например при отключении света), а не последовательно(например при отключении света). и если поставить в онлайн дохлый или левый диск то это может погубить весь массив

время терпит, где то до среды минимум, в выходные доступа к серверу скорее всего не будет, но и информация лишней не будет =)
Человек начинает получать первые наслаждения от знакомства с unix системами. Ему нужно помочь - дальше он сможет получать наслаждение самостоятельно ©
Ламер — не желающий самостоятельно разбираться. Не путать с новичком: ламер опасен и знает это!

Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35456
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Re: Intel SRCU42X Degraded RAID5

Непрочитанное сообщение Alex Keda » 2010-07-23 18:11:52

могу и заблуждаться
в понедельник попробую, отпишусь
Убей их всех! Бог потом рассортирует...

_FreeBSP
проходил мимо

Re: Intel SRCU42X Degraded RAID5

Непрочитанное сообщение _FreeBSP » 2010-07-24 19:04:55

Спасибо =) я не утверждаю, что там правильно, просто видел другую точку зрения

Аватара пользователя
FreeBSP
майор
Сообщения: 2020
Зарегистрирован: 2009-05-24 20:20:19
Откуда: Москва

Re: Intel SRCU42X Degraded RAID5

Непрочитанное сообщение FreeBSP » 2010-07-28 9:45:47

сделал, еще вчера, но отписаться есть время только сейчас
все сказанное сделал на контроллере SRCU42X, но может работать и на следующих контроллерах
  • Intel® RAID Controller SRCS16
  • Intel® RAID Controller SRCS28X
  • Intel® RAID Controller SRCU41L
  • Intel® RAID Controller SRCU42E
  • Intel® RAID Controller SRCU42X
  • Intel® RAID Controller SRCZCRX
  • Intel® RAID Controller SROMBU42E
итак, краткий мануал по восстановлению работоспособности рейд5 с одним выпавшим диском на вышеозначенных контроллерах
все делал из RAID BIOS Console, но вроде в веб-консоли тоже можно
кроме того, если контроллер и корзинка для хардов умеют правильно обрабатывать выключение и включение харда в работе, то горячая замена дохлого харда на новый может повлечь автоматический запуск ребилда вновь вставленного диска и через время, если все пройдет успешно, диск поднимется в онлайн, а массив соотвественно в optimal
но я о возможностях контроллера и корзинки обрабатывать горячую замену диска не знал, сервак не боевой, поэтому все делал через выключение сервера.


Есть degraded raid5 из пяти одинаковых ultra320 сказевых хардов. Один из хардов отказал и массив перешел в состояние degraded - напомню, это такое состояние массива, при котором массив работоспособен при отсутствии/отказе одного любого диска. Надежность массива понижается до уровня raid0, а информация, содержавшаяся на выпавшем диске вычисляется из имеющейся информации и parity-блоков. Как следствие, существенно понижается скорость доступа к массиву.
В рейд биосе дохлый хард отображается как Failed, его лампочка в корзинке горит желтым, а сервак пищит протяжным неприятным писком, сигнализируя о деградировавшем массиве. Диск рекомендуется как можно быстрее заменить, причем желательно на идентичный выпавшему. Нередки случаи, когда два диска умирают один за другим с небольшим промежутком.

Диск заменил на выключенном сервере, но писк не прекратился, в рейд биосе диск остался Failed, а массив - Degraded. Логично, аппаратная замена диска не повлекла восстановление массива. А чтобы диск встал в массив надо сделать ребилд вновь вставленного диска. При этом вся информация, содержавшаяся на выпавшем диске будет перевычислена и записана на вставленный диск, а сам диск по окончании этой операции станет частью массива. На главном экране в верхней правой части выпавший диск будет иметь статус Failed. Тыркаем на него и попадаем в его свойства. Тут можно принудительно отправить диск в онлайн, или сделать его ребилд. Нам нужно сделать ребилд замененного диска, поэтому ставим соответствующую и жмем Гоу. Есть еще какой то выбор, но там оставляем все как есть. Прогрессбар появится внизу страницы свойств диска. На ребилд 73-гигового винчестера у меня ушло около полутора часов, после чего диск сам встал в онлайн, массив вернулся в Optimal, а писк прекратился.

Немного о граблях - чтобы писк не давил на мозги можно его выключить, ткнув на соотвествующую кнопочку. Одинарное тырканье эффекта над раздражителем не возымело, а двойное вызывало подвисание. Кстати, ребут во время ребилда может убить хард(ы), так что советую опробовать эффект заветной кнопочки до начала ребилда.

Операция Make Online может спасти ситуацию, если два и более дисков выпали _одновременно_, диски исправны физически и логически, но контроллер почему то считает что они умерли. Операция Make Online заставит контроллер считать что диск исправен и, внимание, на нем заведомо верные данные. Но если диски неисправны, или, даже,просто читались на другой машине под виндой, то эта операция повлечет утрату всей информации на массиве. Так что перед этой операцией рекомендуется сделать полное посекторное копирование всех дисков массива.

Напоследок стоит отметить, что Биос определяет контроллер как диск(или диски, если создано несколько массивов). Поэтому как только начинается инициализация дисков мы попадаем на экран контроллера, где можем войти в рейд биос, нажав Control+G. А вход в обычный биос материнки будет выполнен только после того как контроллер разберется со своими дисками и сообщит БИОСу машины информацию о массивах. Это важно, потому что заветные Del и F2
не будут иметь эффекта до тех пор, пока raid контроллер не вернет управление БИОСу материнки.

Ну и хрестоматийные слова:
1) RAID не заменяет бекап;
2) перед внесением изменений в массив создавайте полные посекторные бекапы всех дисков массива;
3) Если на массиве очень важная информация, а актуальных бекапов нет, доверьте восстановление информации профессионалам =)

Вроде все рассказал про свое первое знакомство с серверными сказёвыми рейдами вообще и с означенным контроллером в частности. Если есть какие вопросы, постараюсь ответить, но в этой области я сам пока еще новичок. Если материал интересен и полезен, можно причесать и вынести в статью.
Вложения
1.png
главный экран raid bios
Человек начинает получать первые наслаждения от знакомства с unix системами. Ему нужно помочь - дальше он сможет получать наслаждение самостоятельно ©
Ламер — не желающий самостоятельно разбираться. Не путать с новичком: ламер опасен и знает это!

mefisto13
проходил мимо
Сообщения: 8
Зарегистрирован: 2009-10-27 11:29:11

Re: Intel SRCU42X Degraded RAID5

Непрочитанное сообщение mefisto13 » 2013-09-08 6:55:12

Может кому-то пригодится.
На днях "сварился" один винт из 5го рейда на данном контроллере.
Винт был заменен на новый, но в статусе значился как "Not Responding". Немного довелось понервничать, пока не вспомнил про адресацию скази дисков (последний рейд на скази собирал где-то в 2007).
Поставил правильно джампер, сделал ребилд и все завелось.

Порядок расположения перемычек (слева-направо или наоборот) зависит от конкретной модели винта.
Также выводы перемычек бывают как "сзади" винта, так и на его "передней" части. В таком случае они работают в параллели.
1 = замкнутая перемычка.

0000=0
1000=1
0100=2
1100=3
0010=4
1010=5
0110=6
1110=7
0001=8
1001=9
0101=10
1101=11
0011=12
1011=13
0111=14
1111=15