Страница 1 из 1

Проблемы с Nagios

Добавлено: 2008-10-17 21:00:38
Кондор
Доброго времени суток!

После переползания на 7-ю фряху вдруг проявились проблемы с Nagios. Он периодически начинает "терять" хосты. Потом появляются. Может сутками номально всё быть, а потом - достанет уведомлениями. Потом опять нормально...
В логах такое: [17-10-2008 21:56:17] HOST ALERT: SW-Razm-7h;UNREACHABLE;SOFT;1;PING CRITICAL - System call sent warnings to stderr Packet loss = 100%

Мож, кто сталкивался?

Re: Проблемы с Nagios

Добавлено: 2008-10-17 21:08:21
hizel
много хостов?

Re: Проблемы с Nagios

Добавлено: 2008-10-17 21:11:49
Кондор
hizel писал(а):много хостов?
Да нет, пара десятков примерно... На 6.3 в той же ситуации вопросов не возникало.

Причём помогает перезагрузка сервака. Перестарт службы не помогает.

Re: Проблемы с Nagios

Добавлено: 2008-10-18 0:07:30
f_andrey
А попробуй принудительно прописать использование IPv4 для пинга ключик

Re: Проблемы с Nagios

Добавлено: 2008-10-18 8:21:31
Кондор
f_andrey писал(а):А попробуй принудительно прописать использование IPv4 для пинга ключик
Это в nagios_flags?

Re: Проблемы с Nagios

Добавлено: 2008-10-18 9:00:29
f_andrey
либо в objects/commands.cfg

Код: Выделить всё

# 'check_ping' command definition
define command{
        command_name    check_ping
        command_line    $USER1$/check_ping -H $HOSTADDRESS$ -w $ARG1$ -c $ARG2$ -p 5
        }
или же каждому хосту в конфиге

Код: Выделить всё

check_command                   check_ping!100.0,20%!500.0,60% -4
У меня по моему без этого ключа и на трех хостах фигню какуюто гнало, Nagios 3.0.3 FreeBSD 8.0-CURRENT, после того как поставил ключ вроде все нормально работает.

Re: Проблемы с Nagios

Добавлено: 2008-10-20 23:33:57
Кондор
Не помогло. :( Какие ещё будут предположения/предложения?
Причём я попробовал и ping и fping.

Я вообще что-то смотрю, при переползании на 7 фряху начали глюки лезть... Причём какие-то странные и специфические (описанный - один, но не единственный). Пора обратно на 6.3, наверно, опускаться...

Re: Проблемы с Nagios

Добавлено: 2008-10-21 1:26:52
f_andrey
Кондор писал(а):Я вообще что-то смотрю, при переползании на 7 фряху начали глюки лезть... Причём какие-то странные и специфические (описанный - один, но не единственный). Пора обратно на 6.3, наверно, опускаться...
Слушай ка что то я туплю а ты как апгрейдился? пересобрал мир, ядро, удалил старые библиотеки, и пересобрал софт? или что то из этого не делал?

Re: Проблемы с Nagios

Добавлено: 2008-10-21 8:15:37
Кондор
f_andrey писал(а):
Кондор писал(а):Я вообще что-то смотрю, при переползании на 7 фряху начали глюки лезть... Причём какие-то странные и специфические (описанный - один, но не единственный). Пора обратно на 6.3, наверно, опускаться...
Слушай ка что то я туплю а ты как апгрейдился? пересобрал мир, ядро, удалил старые библиотеки, и пересобрал софт? или что то из этого не делал?
Апгрейдился я кооректно: снёс всё, сохранив конфиги и переставил.

Re: Проблемы с Nagios

Добавлено: 2008-10-21 8:31:36
f_andrey
Кондор писал(а):Апгрейдился я кооректно: снёс всё, сохранив конфиги и переставил.
Ну тогда надо разбираться в логах, что и почему не хочет срабатывать, ибо в чудеса как то слабо верится.

Re: Проблемы с Nagios

Добавлено: 2008-10-22 12:41:25
Mox
Имею такие же проблемы. Но дело совершенно не в ОС. Но мы с коллегой разобрались в чем у нас была проблема.
Например, если запустить этот плагин (./check_ping -H 192.168.8.124 -w 12,3% -c 14,5% -t 30) на сервере, который расположен в той же подсети (192.168.2.5/24) что и пингуемый хост (192.168.2.10/24), то вы получите то в сообщении от плагина - "System call sent warnings to stderr" (то что было описано выше, исходная ошибка). Но если этим же способом (с помощью check_ping) пингануть хост в другой подсети, то все ок.

Потом попробовали самим пингом(ping) пинговать, и заметили, что на пинг хоста, расположенного в той же подсети что и сервер, утилита ping говорит
# ping 192.168.8.124
ping: sendto: Host is down
ping: sendto: Host is down
ping: sendto: Host is down
--- 192.168.8.124 ping statistics ---
8 packets transmitted, 0 packets received, 100% packet loss


Но если пингануть самим пингом хост другой подсети
# ping 192.168.2.253
PING 192.168.2.253 (192.168.2.253): 56 data bytes
^C
--- 192.168.2.253 ping statistics ---
82 packets transmitted, 0 packets received, 100% packet loss

то сдесь утилита уже не выдает "ping: sendto: Host is down"

Покопав в сорцах плагина check_ping.c нашли, где описывается обработка всех сообщений от утилиты ping и увидели, что как раз сообщение "ping: sendto: Host is down" вообще не описано!
Вот ответ: правьте сорцы check_ping`а, описывая сообщение от утилиты ping - "Host is down"

Re: Проблемы с Nagios

Добавлено: 2008-10-22 12:43:14
Mox
Добавлю FreeBSD 6.3, nagios-plugins 1.4.13.
Пишу письмо разрабам =)