Зависает контроллер

Простые/общие вопросы по UNIX системам. Спросите здесь, если вы новичок

Модераторы: vadim64, terminus

Правила форума
Убедительная просьба юзать теги [cоde] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
Harun
рядовой
Сообщения: 19
Зарегистрирован: 2014-03-26 9:02:50

Зависает контроллер

Непрочитанное сообщение Harun » 2015-03-29 12:24:09

Примерно раз в квартал на сервере зависет дисковый контроллер, в журнале появляется ошибка:

Код: Выделить всё

Mar 29 11:11:08 Storage kernel: isci: 1427609468:700992 ISCI Sending reset to device on controller 0 domain 3 CAM index 3
Mar 29 11:11:08 Storage kernel: isci: 1427609468:701950 ISCI isci: bus=0 target=3 lun=0 cdb[0]=35 terminated
И как следствие:

Код: Выделить всё

Mar 29 11:11:08 Storage kernel: (da3:isci0:0:3:0): SYNCHRONIZE CACHE(10). CDB: 35 00 00 00 00 00 00 00 00 00
Mar 29 11:11:08 Storage kernel: (da3:isci0:0:3:0): CAM status: CCB request terminated by the host
Mar 29 11:11:08 Storage kernel: (da3:isci0:0:3:0): Retrying command
SAS Контроллер интегрированный на мат. плате, гугление не помогло, непонятно, аппаратная или программная проблема. Куда копать?
Последний раз редактировалось f_andrey 2015-03-29 14:11:31, всего редактировалось 1 раз.
Причина: Автору. пожалуйста, выбирайте соответствующий раздел форума, если приведёте больше логов, это повысит вероятность ответов, а не флуда

Хостинговая компания Host-Food.ru
Хостинг HostFood.ru
 

Услуги хостинговой компании Host-Food.ru

Хостинг HostFood.ru

Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/

mr.fr
ефрейтор
Сообщения: 53
Зарегистрирован: 2014-10-09 11:12:35

Зависает контроллер

Непрочитанное сообщение mr.fr » 2015-03-29 12:49:14

не плохо было бы написать модель материнской платы :)

Harun
рядовой
Сообщения: 19
Зарегистрирован: 2014-03-26 9:02:50

Зависает контроллер

Непрочитанное сообщение Harun » 2015-03-29 13:23:46

Supermicro X9DR3-LN4F+

guest
проходил мимо

Зависает контроллер

Непрочитанное сообщение guest » 2015-03-29 16:53:32

Harun писал(а):Примерно раз в квартал на сервере зависет дисковый контроллер, в журнале появляется ошибка:

Код: Выделить всё

Mar 29 11:11:08 Storage kernel: isci: 1427609468:700992 ISCI Sending reset to device on controller 0 domain 3 CAM index 3
Mar 29 11:11:08 Storage kernel: isci: 1427609468:701950 ISCI isci: bus=0 target=3 lun=0 cdb[0]=35 terminated
И как следствие:

Код: Выделить всё

Mar 29 11:11:08 Storage kernel: (da3:isci0:0:3:0): SYNCHRONIZE CACHE(10). CDB: 35 00 00 00 00 00 00 00 00 00
Mar 29 11:11:08 Storage kernel: (da3:isci0:0:3:0): CAM status: CCB request terminated by the host
Mar 29 11:11:08 Storage kernel: (da3:isci0:0:3:0): Retrying command
SAS Контроллер интегрированный на мат. плате, гугление не помогло, непонятно, аппаратная или программная проблема. Куда копать?
Только с одним диском da3 такое?
копать в сторону smartctl short & long test da3 (если с кабелем все ok и мощности БП достаточно)

Harun
рядовой
Сообщения: 19
Зарегистрирован: 2014-03-26 9:02:50

Зависает контроллер

Непрочитанное сообщение Harun » 2015-03-29 18:43:44

Диски проверим, но странно, даже если диск неисправен, контроллер просто должен давать ошибку чтения/записи, а не останавливаться колом.

Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35297
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Зависает контроллер

Непрочитанное сообщение Alex Keda » 2015-03-29 21:34:33

и что, на этом виснет сервер? или что?
Убей их всех! Бог потом рассортирует...

Аватара пользователя
Alpha
рядовой
Сообщения: 14
Зарегистрирован: 2015-03-24 17:27:02

Зависает контроллер

Непрочитанное сообщение Alpha » 2015-03-29 22:51:37

Попробуй в биосе выставить:

Advanced --> CPU Configuration --> Power Technology --> Disabled
Advanced --> Chipset Configuration --> Integrated IO Configuration --> Active State Power Management --> [Auto]

Если поможет, отпишись.

Harun
рядовой
Сообщения: 19
Зарегистрирован: 2014-03-26 9:02:50

Зависает контроллер

Непрочитанное сообщение Harun » 2015-03-30 7:26:56

Alex Keda писал(а):и что, на этом виснет сервер? или что?
Да, все обращения к ФС блокируются.

guest
проходил мимо

Зависает контроллер

Непрочитанное сообщение guest » 2015-03-30 15:00:16

Harun писал(а):
Alex Keda писал(а):и что, на этом виснет сервер? или что?
Да, все обращения к ФС блокируются.
корпус какой? подключение SAS? backplane?

Harun
рядовой
Сообщения: 19
Зарегистрирован: 2014-03-26 9:02:50

Зависает контроллер

Непрочитанное сообщение Harun » 2015-04-01 10:12:16

Платформа SYS-6027R-3RF4+, корпус CSE-825TQ-R740LPB, подключение через backplane

guest
проходил мимо

Зависает контроллер

Непрочитанное сообщение guest » 2015-04-01 12:53:06

Harun писал(а):Платформа SYS-6027R-3RF4+, корпус CSE-825TQ-R740LPB, подключение через backplane
понято.

Хоть BPN-SAS-825TQ и слабоватая backplane - без expander'а, редко сталкивался с выходом из строя.

Виснет:
- полностью сервер?
- вся дисковая система?
- только отдельные FS входят в ступор?
- FS: UFS или ZFS?

В зависимости от верхнего, следует разделить и протестировать:
- посмотреть каким кабелем произведено подключение: контроллер <-> backplane (проверить кабель)
- исключить backplane и подсоединить диски прямо к контроллеру, придется докупить кабель...
- при прямом подключении, нужно взять 8 рабочих дисков, на один систему, другие для тестов
чтения-записи RW и нагрузить дисковую подсистему I/O по самое не балуй на несколько суток

Да, это время, и нужно 8 сторонних дисков, но иначе никак...
После опытов, если контроллер входит в ступор, написать в support Supermicro, для России - служба
поддержки в Голландии, вполне адекватные люди.
Нет желания экспериментировать, пишите сразу и спросите совета как протестировать backplane,
контроллер или что посоветуют.

Нужно два раза прогнать тесты, под FreeBSD 10.1 или 11, и под CentOS или Debian, чтобы
исключить драйвера ОС, в случае hardware проблемы.
И да, ipmi в наличии - смотреть диагностику, журнал, температуру.
Увы, с Intel C60x не сталкивался, а вот интегрированный LSI SATA/SAS очень хорошо себя вел, видимо
скоро предстоит столкнуться с реализацией SATA и SAS от Intel на C60x для бюджетных решений.
По спецификации, у C60x для SAS -> x4 PCIe uplink, должно хватать по ширине для приличных
нагрузок.

Harun
рядовой
Сообщения: 19
Зарегистрирован: 2014-03-26 9:02:50

Зависает контроллер

Непрочитанное сообщение Harun » 2015-04-01 12:57:40

Из 8 дисков собран пул ZFS, сама система грузится с отдельного диска, подключенному к отдельному интегрированному контроллеру, виснет только ZFS пул, ipmi мониторю, проблем нет.

К сожалению, тесты нет возможности проводить, задумался о покупке резервного сервера.

guest
проходил мимо

Зависает контроллер

Непрочитанное сообщение guest » 2015-04-01 17:45:10

Harun писал(а):Из 8 дисков собран пул ZFS, сама система грузится с отдельного диска, подключенному к отдельному интегрированному контроллеру, виснет только ZFS пул, ipmi мониторю, проблем нет.

К сожалению, тесты нет возможности проводить, задумался о покупке резервного сервера.
жаль
с ZFS всякое возможно, но в логе конкретно про контроллер only:
был послан reset (скорей всего после timeout) и он не отработал:
"isci: bus=0 target=3 lun=0 cdb[0]=35 terminated" - Bus 0 Lun 0 Target 3

и все же какчество sas'овского кабеля и backplane - могут влиять.

при выборе резерва, посмотрите в сторону материнки с LSI или отдельно контроллер PCIe.

ps. На сегодня, выгодней и надежней брать 2.5" sas диски, это к слову. Ну и платформу под них.

Harun
рядовой
Сообщения: 19
Зарегистрирован: 2014-03-26 9:02:50

Зависает контроллер

Непрочитанное сообщение Harun » 2015-04-13 13:50:54

В очередной раз повис сервер, при включении отказался импортировать пул, при этом на корзине горела лампочка и валились сообщения (da3:isci0:0:3:0): CAM status: CCB request terminated by the host. Видимо все-таки кривой диск вешал контроллер. Диск был извлечен из корзины и выброшен, после этого пул был импортирован и всё нормально заработало.

guest
проходил мимо

Зависает контроллер

Непрочитанное сообщение guest » 2015-04-13 14:14:18

Harun писал(а):В очередной раз повис сервер, при включении отказался импортировать пул, при этом на корзине горела лампочка и валились сообщения (da3:isci0:0:3:0): CAM status: CCB request terminated by the host. Видимо все-таки кривой диск вешал контроллер. Диск был извлечен из корзины и выброшен, после этого пул был импортирован и всё нормально заработало.
thx за инфо
поставлю галочку на предмет возможности использования Intel C60x SATA/SAS контроллера, судя по
спецификации, пропускная способность SAS вполне приемлемая.

Гость
проходил мимо

Зависает контроллер

Непрочитанное сообщение Гость » 2015-04-13 16:01:02

Harun писал(а):В очередной раз повис сервер, при включении отказался импортировать пул, при этом на корзине горела лампочка и валились сообщения (da3:isci0:0:3:0): CAM status: CCB request terminated by the host. Видимо все-таки кривой диск вешал контроллер. Диск был извлечен из корзины и выброшен, после этого пул был импортирован и всё нормально заработало.
Встречал такую "фитчу" у контролера Adaptek 31605. Один диск в 10 раиде начал подыхать, контролер все это время периодический отправлял сервер в панику, или не давал биосу добраться до загрузки системы.