Страница 1 из 1

Пропали устройства SCSI /dev/sd*

Добавлено: 2010-10-30 8:20:09
Dmitriy_K
У моего знакомого на серваке (SUSE 2009) возник странный трабл: внезапно (во время работы) пропали подключенные устройства SCSI /dev/sd* (внешний дисковый массив). Причём, внешне в графическом интерфейсе видно, что полка подключена: Yast – Hardware – Hardware information – SCSI. Но вывод команды "fdisk -l" показывает, что диски /dev/sd* отсутствуют, пропали.
В messages и dmesg никаких сообщений об ошибках нет, ребуты не помогают.
Большая просьба помочь разобраться.:cry:
Есть нечно, похожее на мелкую зацепку. Когда я пытался просмотреть вывод информации об аппаратных устройствах (команда dmidecode), я обнаружил строки:

Код: Выделить всё

Handle 0x2000, DMI type 32, 11 bytes
System Boot Information
Status: Firmware-detected hardware failure
К сожалению, пока не могу понять, к чему это относится.

Re: Пропали устройства SCSI /dev/sd*

Добавлено: 2010-10-30 10:38:53
Dmitriy_K
Кажется, уже нашли источник проблемы. Я правильно угадал, что нужно диагностировать аппаратную часть, начиная с дискового массива. Там, похоже, вылетел один диск и контролёр выдал ошибку всего массива (MSA2324fc от HP). Конечно, ещё не до конца разобрались, так что буду благодарен за полезные советы.

Re: Пропали устройства SCSI /dev/sd*

Добавлено: 2010-10-30 14:07:53
Burner
ну а что вам сказать. Либо контроллер работает, либо нет. rescan-scsi-bus.sh из sg3_tools есть для перечитки девайсов

Re: Пропали устройства SCSI /dev/sd*

Добавлено: 2010-10-30 18:00:52
Dmitriy_K
Уже успели разобраться до конца, но всёравно спасибо за полезную информацию на будущее. Кстати, прямое попадание по поводу контролёра. Действительно, сначала в удалось поднять человека, который имел доступ в хардовую админку массива, и он увидел там общую ошибку "degdation", а потом смогли физически добраться до дискового массива и обнаружили, что там накрылся один из блоков питания. Похоже, что при этом возник скачок напряжения, который вывел из строя один двух контролёров. Из-за этого система массива отключила к нему доступ.
В общем, технологии HP хоть и хороши, но не дают полной гарантии отказоустойчивости. Да и хардовую самодиагностику можно было бы сделать ну хоть чуть более информативной. А то по удалёнке не понятно из-за чего проблема, то ли диск вылетел, то ли контролёр.