сделал, еще вчера, но отписаться есть время только сейчас
все сказанное сделал на контроллере SRCU42X, но может работать и на следующих контроллерах
- Intel® RAID Controller SRCS16
- Intel® RAID Controller SRCS28X
- Intel® RAID Controller SRCU41L
- Intel® RAID Controller SRCU42E
- Intel® RAID Controller SRCU42X
- Intel® RAID Controller SRCZCRX
- Intel® RAID Controller SROMBU42E
итак, краткий мануал по восстановлению работоспособности рейд5 с одним выпавшим диском на вышеозначенных контроллерах
все делал из RAID BIOS Console, но вроде в веб-консоли тоже можно
кроме того, если контроллер и корзинка для хардов умеют правильно обрабатывать выключение и включение харда в работе, то горячая замена дохлого харда на новый может повлечь автоматический запуск ребилда вновь вставленного диска и через время, если все пройдет успешно, диск поднимется в онлайн, а массив соотвественно в optimal
но я о возможностях контроллера и корзинки обрабатывать горячую замену диска не знал, сервак не боевой, поэтому все делал через выключение сервера.
Есть degraded raid5 из пяти одинаковых ultra320 сказевых хардов. Один из хардов отказал и массив перешел в состояние degraded - напомню, это такое состояние массива, при котором массив работоспособен при отсутствии/отказе одного любого диска. Надежность массива понижается до уровня raid0, а информация, содержавшаяся на выпавшем диске вычисляется из имеющейся информации и parity-блоков. Как следствие, существенно понижается скорость доступа к массиву.
В рейд биосе дохлый хард отображается как Failed, его лампочка в корзинке горит желтым, а сервак пищит протяжным неприятным писком, сигнализируя о деградировавшем массиве. Диск рекомендуется как можно быстрее заменить, причем желательно на идентичный выпавшему. Нередки случаи, когда два диска умирают один за другим с небольшим промежутком.
Диск заменил на выключенном сервере, но писк не прекратился, в рейд биосе диск остался Failed, а массив - Degraded. Логично, аппаратная замена диска не повлекла восстановление массива. А чтобы диск встал в массив надо сделать ребилд вновь вставленного диска. При этом вся информация, содержавшаяся на выпавшем диске будет перевычислена и записана на вставленный диск, а сам диск по окончании этой операции станет частью массива. На главном экране в верхней правой части выпавший диск будет иметь статус Failed. Тыркаем на него и попадаем в его свойства. Тут можно принудительно отправить диск в онлайн, или сделать его ребилд. Нам нужно сделать ребилд замененного диска, поэтому ставим соответствующую и жмем Гоу. Есть еще какой то выбор, но там оставляем все как есть. Прогрессбар появится внизу страницы свойств диска. На ребилд 73-гигового винчестера у меня ушло около полутора часов, после чего диск сам встал в онлайн, массив вернулся в Optimal, а писк прекратился.
Немного о граблях - чтобы писк не давил на мозги можно его выключить, ткнув на соотвествующую кнопочку. Одинарное тырканье эффекта над раздражителем не возымело, а двойное вызывало подвисание. К
стати, ребут во время ребилда может убить хард(ы), так что советую опробовать эффект заветной кнопочки до начала ребилда.
Операция Make Online может спасти ситуацию, если два и более дисков выпали _одновременно_, диски исправны физически и логически, но контроллер почему то считает что они умерли.
Операция Make Online заставит контроллер считать что диск исправен и, внимание, на нем заведомо верные данные. Но если диски неисправны, или, даже,просто читались на другой машине под виндой, то эта операция повлечет утрату всей информации на массиве. Так что перед этой операцией рекомендуется сделать полное посекторное копирование всех дисков массива.
Напоследок стоит отметить, что Биос определяет контроллер как диск(или диски, если создано несколько массивов). Поэтому как только начинается инициализация дисков мы попадаем на экран контроллера, где можем войти в рейд биос, нажав Control+G. А вход в обычный биос материнки будет выполнен только после того как контроллер разберется со своими дисками и сообщит БИОСу машины информацию о массивах. Это важно, потому что заветные Del и F2
не будут иметь эффекта до тех пор, пока raid контроллер не вернет управление БИОСу материнки.
Ну и хрестоматийные слова:
1) RAID не заменяет бекап;
2) перед внесением изменений в массив создавайте полные посекторные бекапы всех дисков массива;
3) Если на массиве очень важная информация, а актуальных бекапов нет, доверьте восстановление информации профессионалам
Вроде все рассказал про свое первое знакомство с серверными сказёвыми рейдами вообще и с означенным контроллером в частности. Если есть какие вопросы, постараюсь ответить, но в этой области я сам пока еще новичок. Если материал интересен и полезен, можно причесать и вынести в статью.