Аппаратный RAID

Решение проблем связванных с работой железа. Проблемы программно-аппаратной совместимости.
Правила форума
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35454
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение Alex Keda » 2008-09-24 23:14:35

zingel писал(а):достаточно правильно настроить крон+сислог
Убей их всех! Бог потом рассортирует...

Хостинговая компания Host-Food.ru
Хостинг HostFood.ru
 

Услуги хостинговой компании Host-Food.ru

Хостинг HostFood.ru

Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/

icb
лейтенант
Сообщения: 751
Зарегистрирован: 2008-07-15 16:11:11

Re: Аппаратный RAID

Непрочитанное сообщение icb » 2008-09-25 8:28:47

Начал использовать arcconf
Работает довольно медленно (начало работы и после вывода информации) - как будто там таймер с задержкой стоит :(
Пару раз получилось что утилита зависала после вывода информации - помогла только перезагрузка сервера. Лечится как-нибудь?
Davi писал(а):
zingel писал(а):когда раз в день вываливаются из массива диски,
кто такое сказал??
Что то тоже не увидел откуда такой вывод мог получиться.
А так, достаточно правильно настроить крон+сислог
Как именно?

И еще вовпросик... заметил тут в описании что RAID поддерживает S.M.A.R.T и утилита выдает

Код: Выделить всё

Device #1
         Device is a Hard drive
         State                              : Online
         Supported                          : Yes
         .....
         FRU                                : None
         S.M.A.R.T.                         : No
Как можно включить S.M.A.R.T ? В биосе не нашел :(
Может утилитой какой?

icb
лейтенант
Сообщения: 751
Зарегистрирован: 2008-07-15 16:11:11

Re: Аппаратный RAID

Непрочитанное сообщение icb » 2008-09-25 8:56:11

Продолжнаю насиловать RAID - выдернул один диск на горячуюю из зеркала :evil:
Фряха ничего не сказала вообще :(

Код: Выделить всё

arcconf GETLOGS 1 DEVICE
arcconf GETLOGS 1 DEAD
В этих логах пусто. Что туда вообще пишется?

Код: Выделить всё

arcconf GETLOGS 1 EVENT
Полно сообщений, но вот не могу разобрать что означат... даже дата в странном формате :(
По какой ссылке можно почитать коды и константы используемые в журнале?

Davis
проходил мимо

Re: Аппаратный RAID

Непрочитанное сообщение Davis » 2008-09-25 10:32:48

lissyara писал(а):
zingel писал(а):достаточно правильно настроить крон+сислог
Хм
крон - запуск по расписанию
сислог - system log
Не понимаю, как именно "настроить"
Можете более развернуто подсказать?
Я понимаю, что можно запрашивать состояние с помощью arcconf каждую минуту.
Но принимать решения-анализировать результат команды чем?
Я пока вижу только один выход - писать свой скрипт/программу.
Типа если новый статус отличается от предыдущего - послать письмо.

Только так?

icb
лейтенант
Сообщения: 751
Зарегистрирован: 2008-07-15 16:11:11

Re: Аппаратный RAID

Непрочитанное сообщение icb » 2008-09-25 10:47:42

Мне кажется, что многие путают аппаратный и программный RAID.
Если RAID программный, то его состояние действительно будет отображаться в syslog.
С аппаратным RAID похоже такого не происходит :( все утро мучаю контроллер, но фряха не реагирует...

Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35454
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение Alex Keda » 2008-09-25 11:10:05

контроллеры разные бывают.
и поддержка их в ядре по разному реализована.
например для ciss(4) - если диск на ходу вынуть - пишет что вынут.
вставить - вставлен. что начат ребилд, что он закончен...
=======
к счастью - у нас тока они =)))
Убей их всех! Бог потом рассортирует...

icb
лейтенант
Сообщения: 751
Зарегистрирован: 2008-07-15 16:11:11

Re: Аппаратный RAID

Непрочитанное сообщение icb » 2008-09-25 11:24:39

Compiling with AAC_DEBUG set to a number between 0 and 3 will enable increasingly verbose debug messages.

The adapter can send status and alert messages asynchronously to the driver. These messages are printed on the system console, and are also queued for retrieval by a management application.
Можно это как то указать не компилируя ядро?
Самое подробное - это 3?

Аватара пользователя
zingel
beastie
Сообщения: 6204
Зарегистрирован: 2007-10-30 3:56:49
Откуда: Moscow
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение zingel » 2008-09-25 12:32:01

не
Z301171463546 - можно пожертвовать мне денег

ev
ст. лейтенант
Сообщения: 1325
Зарегистрирован: 2008-07-27 17:11:30
Откуда: Москва

Re: Аппаратный RAID

Непрочитанное сообщение ev » 2008-09-25 18:22:49

Как можно включить S.M.A.R.T
насколько помню smart включен по умолчанию
а эта строка означает наличие ошибок от smart'а
т.е. если no - ошибок нет, если yes - есть ошибки и их надо смотреть в логах контроллера

Davis
проходил мимо

Re: Аппаратный RAID

Непрочитанное сообщение Davis » 2008-09-30 10:10:47

Вобщем состряпал я скриптик, который с помощью arcconf запрашивает текущий конфиг, фильтрует результат, сравнивает с предыдущим, если отличается - шлет админу мыло.
Запускаю в кроне раз в 5 минут. В принципе нормально...
Если б еще этот arcconf не плодил два вида лог-файлов, :smile:
приходится подчищать

zak
проходил мимо
Сообщения: 3
Зарегистрирован: 2009-02-12 16:15:45

Re: Аппаратный RAID

Непрочитанное сообщение zak » 2009-02-12 17:24:47

Уважаемые знатоки!
Вопрос по поводу дружбы FreeBSD7 + 2420SA

как мониторить статус RAID ?

Доп инфо:
ОС установлена на aacd0s1, винтов больше нет.
atacontrol ничего не видит, кроме CD-привода.
RAID из 2-х дисков создан через БИОС Адаптека.

пробовал arcconf разных версий (то есть с компакта из комплекта контроллера- из разных каталогов) - он выдаёт ошибки
при запуске arcconf из каталога FreeBSD6 сообщение: /libexec/ld-elf.so1: Shared object "libpthread.so2" not found, requered by "arcconf"
при запуске arcconf из каталога FreeBSD6_X86_64 сообщение: Exec format error. Binary file not executable.
при запуске arcconf из каталога UNIXWARE сообщение: ELF binary type "0" not known. ./arcconf : Exec format error. Binary file not executable.

что посоветуете:
* или пытаться настроить arcconf под эту версию ОС (хотя на офиц сайте Adaptec нет версии arcconf для FreeBSD7 ) ?
* или компилить ядро чтоб AAC_DEBUG был равен 3 или 2 или 1 ?
Последний раз редактировалось zak 2009-02-17 15:38:55, всего редактировалось 2 раза.

Аватара пользователя
zingel
beastie
Сообщения: 6204
Зарегистрирован: 2007-10-30 3:56:49
Откуда: Moscow
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение zingel » 2009-02-12 20:37:08

ну адаптек фряха никогда не увидет, это по-опыту, она будет говорит что тупо просто массив, в 8ке это как-то пытаются разрулить но пока тихо, попробуйте настроить таки arcconf, перед этим поставив порт

Код: Выделить всё

/usr/ports/misc/compat6x
Z301171463546 - можно пожертвовать мне денег

Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35454
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение Alex Keda » 2009-02-12 21:44:39

т.е. диски никак не увидеть?
Блин... а я пятый рейд собрал, как теперь харды мониторить =((
жопой блин чуял - ciss надо было брать.
Убей их всех! Бог потом рассортирует...

Аватара пользователя
zingel
beastie
Сообщения: 6204
Зарегистрирован: 2007-10-30 3:56:49
Откуда: Moscow
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение zingel » 2009-02-12 21:50:47

ну, вообще может рвануть а может и не рвануть (с)

просто он будет видеть как одно устройство, а может и нет там от чипа зависит если не путаю, нужно смотреть
Z301171463546 - можно пожертвовать мне денег

ev
ст. лейтенант
Сообщения: 1325
Зарегистрирован: 2008-07-27 17:11:30
Откуда: Москва

Re: Аппаратный RAID

Непрочитанное сообщение ev » 2009-02-12 22:47:39

просто он будет видеть как одно устройство, а может и нет там от чипа зависит если не путаю, нужно смотреть
у меня все видит нормально и все нормально показывается через arcconf
не пробовал только дебаг в драйвере включать

Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35454
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение Alex Keda » 2009-02-12 23:09:15

ev писал(а):
просто он будет видеть как одно устройство, а может и нет там от чипа зависит если не путаю, нужно смотреть
у меня все видит нормально и все нормально показывается через arcconf
не пробовал только дебаг в драйвере включать
а мониторить постоянно как?
smartd в этом плане очень хорош, тока непонятно - как он будет себя вести - в системе 5 раид виден как 1 диск.
впрочем, в воскресенье узнаю, когда домой вернусь.
Убей их всех! Бог потом рассортирует...

ev
ст. лейтенант
Сообщения: 1325
Зарегистрирован: 2008-07-27 17:11:30
Откуда: Москва

Re: Аппаратный RAID

Непрочитанное сообщение ev » 2009-02-12 23:29:59

а мониторить постоянно как?
скриптом
плюс можно ведь опцию драйвера заюзать и писать все в syslog
smartd в этом плане очень хорош, тока непонятно - как он будет себя вести - в системе 5 раид виден как 1 диск.
все верно
arcconf показывает есть ли проблемы smart у винтов (писал об этом выше)

Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35454
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение Alex Keda » 2009-02-12 23:38:49

чё-то я не нашёл опций мониторинга у него. скрипт там писать неначём...
=======
чё за опции драйвера?
Убей их всех! Бог потом рассортирует...

Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35454
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение Alex Keda » 2009-02-12 23:41:14

> arcconf показывает есть ли проблемы smart у винтов (писал об этом выше)
а. я с aaccli перепутал.
ща гляну чё за приблуда.
Из минусов что сразу видно - компат-6х потнуло, придурастое....
Убей их всех! Бог потом рассортирует...

ev
ст. лейтенант
Сообщения: 1325
Зарегистрирован: 2008-07-27 17:11:30
Откуда: Москва

Re: Аппаратный RAID

Непрочитанное сообщение ev » 2009-02-13 9:27:27

чё за опции драйвера?

Код: Выделить всё

AAC adapter not send status and alert messages
Compiling with AAC_DEBUG set to a number between 0 and 3 will enable
increasingly verbose debug messages.

The adapter can send status and alert messages asynchronously to the
driver. These messages are printed on the system console, and are also
queued for retrieval by a management application.


To compile in debugging code:
options AAC_DEBUG=N

http://www.freebsd.org/cgi/man.cgi?query=aac&sektion=4&manpath=FreeBSD+6.3-RELEASE
послал в багтракер для freenas'а еще в сентябре 2008, а воз и ныне там :(

zak
проходил мимо
Сообщения: 3
Зарегистрирован: 2009-02-12 16:15:45

Re: Аппаратный RAID

Непрочитанное сообщение zak » 2009-02-13 12:16:01

zingel писал(а):ну адаптек фряха никогда не увидет, это по-опыту, она будет говорит что тупо просто массив, в 8ке это как-то пытаются разрулить но пока тихо, попробуйте настроить таки arcconf, перед этим поставив порт

Код: Выделить всё

/usr/ports/misc/compat6x
За это спасибо - arcconf заработал :)

Далее - надо мониторить статус массива.
я делаю это следующим образом:

Код: Выделить всё

arcconf GETCONFIG 1 LD
получаю "Command comleted succesfully", вижу статус массива и приглашение на шелл.

И всё кажется хорошо когда подключены 2 винта в зеркале,
НО! когда один из винтов специально отключаю, перезагружаюсь, и делаю

Код: Выделить всё

arcconf GETCONFIG 1 LD
то получаю "Command comleted succesfully", вижу статус массива и НЕТ ПРИГЛАШЕНИЯ НА ШЕЛЛ.
То есть операция как бы зависает.

И только по нажатию Ctrl+C пришлашение на шелл появляется.

Может кто сталкивался с таким ?

ev
ст. лейтенант
Сообщения: 1325
Зарегистрирован: 2008-07-27 17:11:30
Откуда: Москва

Re: Аппаратный RAID

Непрочитанное сообщение ev » 2009-02-13 12:19:36

/usr/ports/misc/compat6x
у меня вроде ничего не тянет
пойду попробую глянуть более подробно на сервер
То есть операция как бы зависает.
И только по нажатию Ctrl+C пришлашение на шелл появляется.
надо просто подождать
утилита иногда тупит непонятно почему

zak
проходил мимо
Сообщения: 3
Зарегистрирован: 2009-02-12 16:15:45

Re: Аппаратный RAID

Непрочитанное сообщение zak » 2009-02-13 12:27:02

ev писал(а): у меня вроде ничего не тянет
пойду попробую глянуть более подробно на сервер
не понял - о чём речь?
я поставил порт, arcconf запустился. ни у кого ничего не тянет и не жмёт :smile:

надо просто подождать
утилита иногда тупит непонятно почему
не 20 минут же! (может больше пройдёт - пока столько)

еще доп инфо по этому вопросу:
операция зависает и не даёт записать результаты GETCONFIG в файл, для дальнеёшего анализа и отсылки по почте.

Аватара пользователя
weec
лейтенант
Сообщения: 948
Зарегистрирован: 2007-07-24 11:17:35
Откуда: Afghanistan
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение weec » 2009-04-01 21:35:55

arcconf для 7ки лежит в пакете Adaptec Storage Manager на сайте adaptec, порт arcconf ставит бинарник для 6-ки, поэтому при установке, на 7-ку, тянет за собой compat6x
lissyara, для мониторинга попробуй юзать /dev/passX (в smartmontools)
icb писал(а):Начал использовать arcconf
Работает довольно медленно (начало работы и после вывода информации) - как будто там таймер с задержкой стоит :(
Пару раз получилось что утилита зависала после вывода информации - помогла только перезагрузка сервера. Лечится как-нибудь?
лечится
шей нувую сборку прошивки и лучше на живую, с помошью arcconf

на данный момент с 64x-драйверами на новые модели Adaptec RAID контроллеров имеются проблемы с зависанием самих контроллеров
замечу, что официальный в состоянии вернуть систему в работу, другое дело со штатным драйвером (виснет на мертво)
официальные, при зависании, обычно logical volume интуитивно отправляют на rebuild

пользователям FreeBSD amd64 советую использовать официальные драйверы с сайта adaptec (это на крайний случай), а вообще лучше текущую FreeBSD 7-STABLE со штатным драйвером

в Linux x86_64 имеются те же проблемы
не забывайте про обновление прошивки

Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35454
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Re: Аппаратный RAID

Непрочитанное сообщение Alex Keda » 2009-04-01 21:58:09

Код: Выделить всё

srv# smartctl -a /dev/pass0
smartctl version 5.38 [i386-portbld-freebsd7.1] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

Device: ADAPTEC  RAID-5           Version: 370F
Device type: disk
Transport protocol: Fibre channel (FCP-2)
Local Time is: Wed Apr  1 22:55:55 2009 MSD
Device supports SMART and is Enabled
Temperature Warning Disabled or Not Supported
SMART Health Status: OK

Current Drive Temperature:     47 C
Drive Trip Temperature:        85 C
Manufactured in week 34 of year 2002
Recommended maximum start stop count:  10000 times
Current start stop count:      601 times
(pass0:asr0:1:0:0): READ DEFECT DATA(10). CDB: 37 0 c 0 0 0 0 0 4 0
(pass0:asr0:1:0:0): CAM Status: SCSI Status Error
(pass0:asr0:1:0:0): SCSI Status: Check Condition
(pass0:asr0:1:0:0): ILLEGAL REQUEST asc:0,0
(pass0:asr0:1:0:0): No additional sense information

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0        0         0         0          0      12968.867           0
write:         0       55         0       246        246       1827.887           0
verify:        0        0         0         0          0        146.816           0

Non-medium error count:        0
No self-tests have been logged
Long (extended) Self Test duration: 1590 seconds [26.5 minutes]
точно такой же вывод как от da0
Убей их всех! Бог потом рассортирует...