Страница 2 из 4

Re: Аппаратный RAID

Добавлено: 2008-09-24 23:14:35
Alex Keda
zingel писал(а):достаточно правильно настроить крон+сислог

Re: Аппаратный RAID

Добавлено: 2008-09-25 8:28:47
icb
Начал использовать arcconf
Работает довольно медленно (начало работы и после вывода информации) - как будто там таймер с задержкой стоит :(
Пару раз получилось что утилита зависала после вывода информации - помогла только перезагрузка сервера. Лечится как-нибудь?
Davi писал(а):
zingel писал(а):когда раз в день вываливаются из массива диски,
кто такое сказал??
Что то тоже не увидел откуда такой вывод мог получиться.
А так, достаточно правильно настроить крон+сислог
Как именно?

И еще вовпросик... заметил тут в описании что RAID поддерживает S.M.A.R.T и утилита выдает

Код: Выделить всё

Device #1
         Device is a Hard drive
         State                              : Online
         Supported                          : Yes
         .....
         FRU                                : None
         S.M.A.R.T.                         : No
Как можно включить S.M.A.R.T ? В биосе не нашел :(
Может утилитой какой?

Re: Аппаратный RAID

Добавлено: 2008-09-25 8:56:11
icb
Продолжнаю насиловать RAID - выдернул один диск на горячуюю из зеркала :evil:
Фряха ничего не сказала вообще :(

Код: Выделить всё

arcconf GETLOGS 1 DEVICE
arcconf GETLOGS 1 DEAD
В этих логах пусто. Что туда вообще пишется?

Код: Выделить всё

arcconf GETLOGS 1 EVENT
Полно сообщений, но вот не могу разобрать что означат... даже дата в странном формате :(
По какой ссылке можно почитать коды и константы используемые в журнале?

Re: Аппаратный RAID

Добавлено: 2008-09-25 10:32:48
Davis
lissyara писал(а):
zingel писал(а):достаточно правильно настроить крон+сислог
Хм
крон - запуск по расписанию
сислог - system log
Не понимаю, как именно "настроить"
Можете более развернуто подсказать?
Я понимаю, что можно запрашивать состояние с помощью arcconf каждую минуту.
Но принимать решения-анализировать результат команды чем?
Я пока вижу только один выход - писать свой скрипт/программу.
Типа если новый статус отличается от предыдущего - послать письмо.

Только так?

Re: Аппаратный RAID

Добавлено: 2008-09-25 10:47:42
icb
Мне кажется, что многие путают аппаратный и программный RAID.
Если RAID программный, то его состояние действительно будет отображаться в syslog.
С аппаратным RAID похоже такого не происходит :( все утро мучаю контроллер, но фряха не реагирует...

Re: Аппаратный RAID

Добавлено: 2008-09-25 11:10:05
Alex Keda
контроллеры разные бывают.
и поддержка их в ядре по разному реализована.
например для ciss(4) - если диск на ходу вынуть - пишет что вынут.
вставить - вставлен. что начат ребилд, что он закончен...
=======
к счастью - у нас тока они =)))

Re: Аппаратный RAID

Добавлено: 2008-09-25 11:24:39
icb
Compiling with AAC_DEBUG set to a number between 0 and 3 will enable increasingly verbose debug messages.

The adapter can send status and alert messages asynchronously to the driver. These messages are printed on the system console, and are also queued for retrieval by a management application.
Можно это как то указать не компилируя ядро?
Самое подробное - это 3?

Re: Аппаратный RAID

Добавлено: 2008-09-25 12:32:01
zingel
не

Re: Аппаратный RAID

Добавлено: 2008-09-25 18:22:49
ev
Как можно включить S.M.A.R.T
насколько помню smart включен по умолчанию
а эта строка означает наличие ошибок от smart'а
т.е. если no - ошибок нет, если yes - есть ошибки и их надо смотреть в логах контроллера

Re: Аппаратный RAID

Добавлено: 2008-09-30 10:10:47
Davis
Вобщем состряпал я скриптик, который с помощью arcconf запрашивает текущий конфиг, фильтрует результат, сравнивает с предыдущим, если отличается - шлет админу мыло.
Запускаю в кроне раз в 5 минут. В принципе нормально...
Если б еще этот arcconf не плодил два вида лог-файлов, :smile:
приходится подчищать

Re: Аппаратный RAID

Добавлено: 2009-02-12 17:24:47
zak
Уважаемые знатоки!
Вопрос по поводу дружбы FreeBSD7 + 2420SA

как мониторить статус RAID ?

Доп инфо:
ОС установлена на aacd0s1, винтов больше нет.
atacontrol ничего не видит, кроме CD-привода.
RAID из 2-х дисков создан через БИОС Адаптека.

пробовал arcconf разных версий (то есть с компакта из комплекта контроллера- из разных каталогов) - он выдаёт ошибки
при запуске arcconf из каталога FreeBSD6 сообщение: /libexec/ld-elf.so1: Shared object "libpthread.so2" not found, requered by "arcconf"
при запуске arcconf из каталога FreeBSD6_X86_64 сообщение: Exec format error. Binary file not executable.
при запуске arcconf из каталога UNIXWARE сообщение: ELF binary type "0" not known. ./arcconf : Exec format error. Binary file not executable.

что посоветуете:
* или пытаться настроить arcconf под эту версию ОС (хотя на офиц сайте Adaptec нет версии arcconf для FreeBSD7 ) ?
* или компилить ядро чтоб AAC_DEBUG был равен 3 или 2 или 1 ?

Re: Аппаратный RAID

Добавлено: 2009-02-12 20:37:08
zingel
ну адаптек фряха никогда не увидет, это по-опыту, она будет говорит что тупо просто массив, в 8ке это как-то пытаются разрулить но пока тихо, попробуйте настроить таки arcconf, перед этим поставив порт

Код: Выделить всё

/usr/ports/misc/compat6x

Re: Аппаратный RAID

Добавлено: 2009-02-12 21:44:39
Alex Keda
т.е. диски никак не увидеть?
Блин... а я пятый рейд собрал, как теперь харды мониторить =((
жопой блин чуял - ciss надо было брать.

Re: Аппаратный RAID

Добавлено: 2009-02-12 21:50:47
zingel
ну, вообще может рвануть а может и не рвануть (с)

просто он будет видеть как одно устройство, а может и нет там от чипа зависит если не путаю, нужно смотреть

Re: Аппаратный RAID

Добавлено: 2009-02-12 22:47:39
ev
просто он будет видеть как одно устройство, а может и нет там от чипа зависит если не путаю, нужно смотреть
у меня все видит нормально и все нормально показывается через arcconf
не пробовал только дебаг в драйвере включать

Re: Аппаратный RAID

Добавлено: 2009-02-12 23:09:15
Alex Keda
ev писал(а):
просто он будет видеть как одно устройство, а может и нет там от чипа зависит если не путаю, нужно смотреть
у меня все видит нормально и все нормально показывается через arcconf
не пробовал только дебаг в драйвере включать
а мониторить постоянно как?
smartd в этом плане очень хорош, тока непонятно - как он будет себя вести - в системе 5 раид виден как 1 диск.
впрочем, в воскресенье узнаю, когда домой вернусь.

Re: Аппаратный RAID

Добавлено: 2009-02-12 23:29:59
ev
а мониторить постоянно как?
скриптом
плюс можно ведь опцию драйвера заюзать и писать все в syslog
smartd в этом плане очень хорош, тока непонятно - как он будет себя вести - в системе 5 раид виден как 1 диск.
все верно
arcconf показывает есть ли проблемы smart у винтов (писал об этом выше)

Re: Аппаратный RAID

Добавлено: 2009-02-12 23:38:49
Alex Keda
чё-то я не нашёл опций мониторинга у него. скрипт там писать неначём...
=======
чё за опции драйвера?

Re: Аппаратный RAID

Добавлено: 2009-02-12 23:41:14
Alex Keda
> arcconf показывает есть ли проблемы smart у винтов (писал об этом выше)
а. я с aaccli перепутал.
ща гляну чё за приблуда.
Из минусов что сразу видно - компат-6х потнуло, придурастое....

Re: Аппаратный RAID

Добавлено: 2009-02-13 9:27:27
ev
чё за опции драйвера?

Код: Выделить всё

AAC adapter not send status and alert messages
Compiling with AAC_DEBUG set to a number between 0 and 3 will enable
increasingly verbose debug messages.

The adapter can send status and alert messages asynchronously to the
driver. These messages are printed on the system console, and are also
queued for retrieval by a management application.


To compile in debugging code:
options AAC_DEBUG=N

http://www.freebsd.org/cgi/man.cgi?query=aac&sektion=4&manpath=FreeBSD+6.3-RELEASE
послал в багтракер для freenas'а еще в сентябре 2008, а воз и ныне там :(

Re: Аппаратный RAID

Добавлено: 2009-02-13 12:16:01
zak
zingel писал(а):ну адаптек фряха никогда не увидет, это по-опыту, она будет говорит что тупо просто массив, в 8ке это как-то пытаются разрулить но пока тихо, попробуйте настроить таки arcconf, перед этим поставив порт

Код: Выделить всё

/usr/ports/misc/compat6x
За это спасибо - arcconf заработал :)

Далее - надо мониторить статус массива.
я делаю это следующим образом:

Код: Выделить всё

arcconf GETCONFIG 1 LD
получаю "Command comleted succesfully", вижу статус массива и приглашение на шелл.

И всё кажется хорошо когда подключены 2 винта в зеркале,
НО! когда один из винтов специально отключаю, перезагружаюсь, и делаю

Код: Выделить всё

arcconf GETCONFIG 1 LD
то получаю "Command comleted succesfully", вижу статус массива и НЕТ ПРИГЛАШЕНИЯ НА ШЕЛЛ.
То есть операция как бы зависает.

И только по нажатию Ctrl+C пришлашение на шелл появляется.

Может кто сталкивался с таким ?

Re: Аппаратный RAID

Добавлено: 2009-02-13 12:19:36
ev
/usr/ports/misc/compat6x
у меня вроде ничего не тянет
пойду попробую глянуть более подробно на сервер
То есть операция как бы зависает.
И только по нажатию Ctrl+C пришлашение на шелл появляется.
надо просто подождать
утилита иногда тупит непонятно почему

Re: Аппаратный RAID

Добавлено: 2009-02-13 12:27:02
zak
ev писал(а): у меня вроде ничего не тянет
пойду попробую глянуть более подробно на сервер
не понял - о чём речь?
я поставил порт, arcconf запустился. ни у кого ничего не тянет и не жмёт :smile:

надо просто подождать
утилита иногда тупит непонятно почему
не 20 минут же! (может больше пройдёт - пока столько)

еще доп инфо по этому вопросу:
операция зависает и не даёт записать результаты GETCONFIG в файл, для дальнеёшего анализа и отсылки по почте.

Re: Аппаратный RAID

Добавлено: 2009-04-01 21:35:55
weec
arcconf для 7ки лежит в пакете Adaptec Storage Manager на сайте adaptec, порт arcconf ставит бинарник для 6-ки, поэтому при установке, на 7-ку, тянет за собой compat6x
lissyara, для мониторинга попробуй юзать /dev/passX (в smartmontools)
icb писал(а):Начал использовать arcconf
Работает довольно медленно (начало работы и после вывода информации) - как будто там таймер с задержкой стоит :(
Пару раз получилось что утилита зависала после вывода информации - помогла только перезагрузка сервера. Лечится как-нибудь?
лечится
шей нувую сборку прошивки и лучше на живую, с помошью arcconf

на данный момент с 64x-драйверами на новые модели Adaptec RAID контроллеров имеются проблемы с зависанием самих контроллеров
замечу, что официальный в состоянии вернуть систему в работу, другое дело со штатным драйвером (виснет на мертво)
официальные, при зависании, обычно logical volume интуитивно отправляют на rebuild

пользователям FreeBSD amd64 советую использовать официальные драйверы с сайта adaptec (это на крайний случай), а вообще лучше текущую FreeBSD 7-STABLE со штатным драйвером

в Linux x86_64 имеются те же проблемы
не забывайте про обновление прошивки

Re: Аппаратный RAID

Добавлено: 2009-04-01 21:58:09
Alex Keda

Код: Выделить всё

srv# smartctl -a /dev/pass0
smartctl version 5.38 [i386-portbld-freebsd7.1] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

Device: ADAPTEC  RAID-5           Version: 370F
Device type: disk
Transport protocol: Fibre channel (FCP-2)
Local Time is: Wed Apr  1 22:55:55 2009 MSD
Device supports SMART and is Enabled
Temperature Warning Disabled or Not Supported
SMART Health Status: OK

Current Drive Temperature:     47 C
Drive Trip Temperature:        85 C
Manufactured in week 34 of year 2002
Recommended maximum start stop count:  10000 times
Current start stop count:      601 times
(pass0:asr0:1:0:0): READ DEFECT DATA(10). CDB: 37 0 c 0 0 0 0 0 4 0
(pass0:asr0:1:0:0): CAM Status: SCSI Status Error
(pass0:asr0:1:0:0): SCSI Status: Check Condition
(pass0:asr0:1:0:0): ILLEGAL REQUEST asc:0,0
(pass0:asr0:1:0:0): No additional sense information

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0        0         0         0          0      12968.867           0
write:         0       55         0       246        246       1827.887           0
verify:        0        0         0         0          0        146.816           0

Non-medium error count:        0
No self-tests have been logged
Long (extended) Self Test duration: 1590 seconds [26.5 minutes]
точно такой же вывод как от da0