Страница 1 из 1

FreeNAS Fatal Trap 1...

Добавлено: 2014-11-14 10:16:20
pin
Всем доброго!
Вчера упал backup-сервер на FreeNAS последней редакции. При перезагрузке выдает ошибку и ступор. Диски подцеплены через аппаратный RAID ASR-5405. Отключаешь RAID-контроллер - система грузится, понятно, что дело в дисках, непонятно, куда копать?

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-14 11:55:56
guest
pin писал(а):Всем доброго!
Вчера упал backup-сервер на FreeNAS последней редакции. При перезагрузке выдает ошибку и ступор. Диски подцеплены через аппаратный RAID ASR-5405. Отключаешь RAID-контроллер - система грузится, понятно, что дело в дисках, непонятно, куда копать?
и кто додумался использовать RAID контроллер для ZFS?!

диски подключенные к RAID как оформлены:
- каждый диск как отдельный том?
или
- диски оформлены в RAID X?

zpool из чего создавался?

Не специалист в ZFS, но судя по всему, креш происходит во время работы журнала ZIL (zfs_log_rename),
есть предположение что сбоит какой-то диск? И вот тут важно как оформлен zpool, из чего сделан - см
вопросы про оформление RAID.

Одна из ВАЖНЫХ рекомендаций ZFS - не делать ZFS ПОВЕРХ Raid, использовать HBA контроллеры
для ZFS. RAID - в это случае выступает как прослойка и в свою очередь реагирует на дисковые ошибки.
Нужно определить проблемный диск - найти подобного объема и выполнить dd, заменить плохой
и посмотреть что будет.

ps. На форуме FreeNAS что советуют?

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-14 12:03:52
pin
диски в RAID5, статус RAID'а - OPTIMAL
На форум FreeNAS не ходил, совсем из головы вылетело как-то

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-14 12:37:32
guest
pin писал(а):диски в RAID5, статус RAID'а - OPTIMAL
да-а-а... печально...
На форум FreeNAS не ходил, совсем из головы вылетело как-то
попробуйте там спросить, кроме как проверить диски smartctl на smart, и short & long test,
мыслей не имею. Проверять на других PC, можно в параллель.

ps. Совет на будущее - не используйте ZFS поверх RAID!

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-14 12:41:38
pin
Диски проверил на smart - все хорошо, сейчас гоняю встроенной в RAID-bios утилитой проверки, выяснилось, что диски не RAID EDITION (должны были быть WD RED RE, заказывал их специально, видать сборщики обманули)

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-14 13:00:31
guest
pin писал(а):Диски проверил на smart - все хорошо, сейчас гоняю встроенной в RAID-bios утилитой проверки, выяснилось, что диски не RAID EDITION (должны были быть WD RED RE, заказывал их специально, видать сборщики обманули)
япона мать... какие еще RED !? Диски SATA или SAS?

Надо столько граблей собрать...
Если WD, то никаких: Green, Blue, Red, Black - сидеть потом изучать модели и править tler и idle
Если Hitachi - только UltraStar, Seagate - только Enterprise

Если уж собираете HW RAID, то только на реально правильных дисках:
- Hitachi UltraStar
- WD RE, WD RE4, WD RE SAS
- Seagate Entreprise SATA or SAS

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-14 13:36:51
guest
guest писал(а):
pin писал(а):Диски проверил на smart - все хорошо, сейчас гоняю встроенной в RAID-bios утилитой проверки, выяснилось, что диски не RAID EDITION (должны были быть WD RED RE, заказывал их специально, видать сборщики обманули)
япона мать... какие еще RED !? Диски SATA или SAS?

Надо столько граблей собрать...
Если WD, то никаких: Blue,Green,Red,Black - сидеть потом изучать модели и править tler и idle
Если Hitachi - только UltraStar, Seagate - только Enterprise

Если уж собираете HW RAID, то только на реально правильных дисках:
- Hitachi UltraStar
- WD RE, WD RE4, WD RE SAS
- Seagate Entreprise SATA or SAS

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-14 15:03:41
pin
Диски SATA, писал выше, что заказывал WD, которые Raid Edition, а мне поставили "красные", проблема в другом - сейчас подцепил два диска прямо на мать и попробовал собрать ZFS pool, сервер ушел в перезагрузку и потом застопарился с той же ошибкой, диски 100% рабочие, похоже, дело глобально в аппаратной части, попробую поменять блок питания, что называется до кучи.

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-14 16:03:42
guest
pin писал(а):Диски SATA, писал выше, что заказывал WD, которые Raid Edition, а мне поставили "красные", проблема в другом - сейчас подцепил два диска прямо на мать и попробовал собрать ZFS pool, сервер ушел в перезагрузку и потом застопарился с той же ошибкой, диски 100% рабочие, похоже, дело глобально в аппаратной части, попробую поменять блок питания, что называется до кучи.
- сначала проверьте RAM (битая память - смерть для ZFS)
- затем контроллер RAID

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-14 16:06:31
guest
pin писал(а):Диски SATA, писал выше, что заказывал WD, которые Raid Edition, а мне поставили "красные", проблема в другом - сейчас подцепил два диска прямо на мать и попробовал собрать ZFS pool, сервер ушел в перезагрузку и потом застопарился с той же ошибкой, диски 100% рабочие, похоже, дело глобально в аппаратной части, попробую поменять блок питания, что называется до кучи.
Есть линейка WD RE RED или WD RED RE, возможно ее Вам и воткнули :(
Нужно не "заказывать", а писать спецификацию продавцу и ее утрясать, по получениии - все проверять.

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-18 7:39:31
pin
У нас поставкой оборудования занимается "специально обученный человек", ему пишешь спецификацию и вперед... сборкой и установкой оборудования в стойки занимается орава электронщиков... каюсь, не проверил, что поставили, до этого четыре года не было никаких косяков в работе такой цепочки, а тут... видать по-запарке мои винты ушли в пользовательскую станцию :shock: ... но ладно, это все лирика, теперь физика: сегодня собрал RAIDZ на трех HDD, подключенных в мать, все было здорово, пока не зажужжал один из кулеров, расположенных в передней части корпуса и предназначенный для обдува винтов. Сервер выключили, вытащили корзину с дисками, поменяли кулер, при включении та же картинка, только имя процесса поменялось: было newsyslog, стало rsyncd. Акронисом грохнул все разделы на винтах, проблема осталась. Вообще не понятно, как такое может быть :st: :st: :st:

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-18 14:43:46
guest
pin писал(а):У нас поставкой оборудования занимается "специально обученный человек", ему пишешь спецификацию и вперед... сборкой и установкой оборудования в стойки занимается орава электронщиков... каюсь, не проверил, что поставили, до этого четыре года не было никаких косяков в работе такой цепочки, а тут... видать по-запарке мои винты ушли в пользовательскую станцию :shock: ... но ладно, это все лирика, теперь физика: сегодня собрал RAIDZ на трех HDD, подключенных в мать, все было здорово, пока не зажужжал один из кулеров, расположенных в передней части корпуса и предназначенный для обдува винтов. Сервер выключили, вытащили корзину с дисками, поменяли кулер, при включении та же картинка, только имя процесса поменялось: было newsyslog, стало rsyncd. Акронисом грохнул все разделы на винтах, проблема осталась. Вообще не понятно, как такое может быть :st: :st: :st:
один кулер - вероятно только начало проблем, sorry :(
ну какой еще акронис?!
затрите метаданные:

# dd if=/dev/zero of=/dev/adaX count=34
и в конце, к команде добавить skip=MAXNUMSECTOR-34

система то у Вас на UFS вроде, так проверьте диск, надеюсь RAM и sata/raid контроллеры уже проверили?

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-18 14:47:04
Alvares
memtest память походит?

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-19 7:22:03
pin
Тест памяти и контроллеров пройден успешно, очень напрягает, что ситуация повторилась уже на дисках. подключенных непосредственно к матери.

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-19 9:04:37
guest
pin писал(а):Тест памяти и контроллеров пройден успешно, очень напрягает, что ситуация повторилась уже на дисках. подключенных непосредственно к матери.
падение случилось на "пустом" месте или после броска питания или после апгрейда... ?

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-19 13:53:36
pin
на пустом, если не считать замену кулера

Re: FreeNAS Fatal Trap 1...

Добавлено: 2014-11-19 14:17:33
guest
pin писал(а):на пустом, если не считать замену кулера
если нагрузка на сервер не менялась - значит железо