Страница 1 из 1
Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-18 13:16:42
Денис
Доброго времени суток. Сервер - FreeBSD 9.1-RELEASE #0: Fri Sep 27 01:29:26 MSK 2013.
Система стоит на двух RAID
Код: Выделить всё
Name Status Components
mirror/boot COMPLETE ada0p1 (ACTIVE)
ada1p1 (ACTIVE)
mirror/swap COMPLETE ada0p2 (ACTIVE)
ada1p2 (ACTIVE)
mirror/root COMPLETE ada0p3 (ACTIVE)
ada1p3 (ACTIVE)
mirror/web COMPLETE ada2p1 (ACTIVE)
ada3p1 (ACTIVE)
mirror/storage COMPLETE ada2p2 (ACTIVE)
ada3p2 (ACTIVE)
Раз в сутки требует перезагрузки, причем примерно через 24 часа после предыдущего. Безошибочный способ nslookup - не может найти сервер. В логах ничего найти не могу, что могло бы подсказать в каком направлении искать. На сервере "крутится" все и почта и вэб и MySQl.
Еще один момент определить, что сервер "встал" можно по звуку - винты делают такой еле слышный "дзынкь", после этого проверяю nslookup, все отзыва нет. Подскажите пожалуйста где можно поискать причину.
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-18 13:39:26
Bayerische
Статистику какую-нибудь поставьте, тот же Мунин.
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-18 14:20:36
snorlov
Как делаешь перезагрузку...
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-18 14:49:06
tom.cat
snorlov писал(а):Как делаешь перезагрузку...
Reset button ?
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-20 16:12:18
Neus
Что в консоли кажет когда виснет?
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-20 18:51:45
QweЯty
такс, в туже тему, тока разброс 3-5 суток, а бывает неделя...
перестает выдавать ip, отвечать по ssh, пинговаться... НО, судя по лампочкам работа продолжается...
в логах
all.log
Oct 20 02:10:10 radist04ka named[6408]: client 80.77.172.138#62034 (xn--80aaasphcburb2bjg5q.su): query (cache) 'xn--80aaasphcburb2bjg5q.su/SOA/IN' denied
Oct 20 02:11:00 radist04ka /usr/sbin/cron[17823]: (root) CMD (/usr/local/etc/rrd/base/mem_update.sh)
Oct 20 02:11:00 radist04ka /usr/sbin/cron[17828]: (root) CMD (/usr/local/etc/rrd/base/net_graph.sh)
Oct 20 02:11:00 radist04ka /usr/sbin/cron[17830]: (operator) CMD (/usr/libexec/save-entropy)
Oct 20 02:11:00 radist04ka /usr/sbin/cron[17829]: (root) CMD (/usr/local/etc/rrd/base/net_update.sh)
Oct 20 02:11:00 radist04ka /usr/sbin/cron[17831]: (root) CMD (/usr/local/etc/rrd/base/cpu_graph.sh)
Oct 20 02:11:00 radist04ka /usr/sbin/cron[17834]: (root) CMD (/usr/local/etc/rrd/base/cpu_update.sh)
Oct 20 18:42:00 radist04ka syslogd: restart
Oct 20 18:42:00 radist04ka syslogd: kernel boot file is /boot/kernel/kernel
Oct 20 18:42:00 radist04ka kernel: Copyright (c) 1992-2013 The FreeBSD Project.
Oct 20 18:42:00 radist04ka kernel: Copyright (c) 1979, 1980, 1983, 1986, 1988, 1989, 1991, 1992, 1993, 1994
Oct 20 18:42:00 radist04ka kernel: The Regents of the University of California. All rights reserved.
Oct 20 18:42:00 radist04ka kernel: FreeBSD is a registered trademark of The FreeBSD Foundation.
Oct 20 18:42:00 radist04ka kernel: FreeBSD 9.1-STABLE #0: Sun Jul 28 15:55:49 FET 2013
Oct 20 18:42:00 radist04ka kernel:
radist@radist04ka.localdoiman:/sys/i386/compile/RADIST.28.07.2013 i386
Oct 20 18:42:00 radist04ka kernel: gcc version 4.2.1 20070831 patched [FreeBSD]
Oct 20 18:42:00 radist04ka kernel: CPU: Intel(R) Pentium(R) 4 CPU 3.00GHz (3147.83-MHz 686-class CPU)
Oct 20 18:42:00 radist04ka kernel: Origin = "GenuineIntel" Id = 0xf34 Family = 0xf Model = 0x3 Stepping = 4
console.log
Oct 19 23:15:59 radist04ka kernel: Oct 19 23:15:59 radist04ka dhcpd: Dynamic and static leases present for 192.168.7.2.
Oct 19 23:15:59 radist04ka kernel: Oct 19 23:15:59 radist04ka dhcpd: Remove host declaration Loner-XP or remove 192.168.7.2
Oct 19 23:15:59 radist04ka kernel: Oct 19 23:15:59 radist04ka dhcpd: from the dynamic address pool for 192.168.7.0/24
Oct 19 23:45:59 radist04ka kernel: Oct 19 23:45:59 radist04ka dhcpd: Dynamic and static leases present for 192.168.7.2.
Oct 19 23:45:59 radist04ka kernel: Oct 19 23:45:59 radist04ka dhcpd: Remove host declaration Loner-XP or remove 192.168.7.2
Oct 19 23:45:59 radist04ka kernel: Oct 19 23:45:59 radist04ka dhcpd: from the dynamic address pool for 192.168.7.0/24
Oct 20 00:16:00 radist04ka kernel: Oct 20 00:16:00 radist04ka dhcpd: Dynamic and static leases present for 192.168.7.2.
Oct 20 00:16:00 radist04ka kernel: Oct 20 00:16:00 radist04ka dhcpd: Remove host declaration Loner-XP or remove 192.168.7.2
Oct 20 00:16:00 radist04ka kernel: Oct 20 00:16:00 radist04ka dhcpd: from the dynamic address pool for 192.168.7.0/24
Oct 20 18:42:00 radist04ka kernel: Setting hostuuid: 00020003-0004-0005-0006-000700080009.
Oct 20 18:42:00 radist04ka kernel: Setting hostid: 0x81f4ec68.
Oct 20 18:42:00 radist04ka kernel: Entropy harvesting: interrupts ethernet point_to_point kickstart.
Oct 20 18:42:00 radist04ka kernel: Starting file system checks:
Oct 20 18:42:00 radist04ka kernel: ** SU+J Recovering /dev/ada2p2
Oct 20 18:42:00 radist04ka kernel: ** Reading 33554432 byte journal from inode 4.
Oct 20 18:42:00 radist04ka kernel: ** Building recovery table.
dmesg.yesterday
(ada1:ata3:0:0:0): READ_DMA48. ACB: 25 00 bf 10 ff 40 73 00 00 00 00 01
(ada1:ata3:0:0:0): CAM status: ATA Status Error
(ada1:ata3:0:0:0): ATA status: 51 (DRDY SERV ERR), error: 84 (ICRC ABRT )
(ada1:ata3:0:0:0): RES: 51 84 bf 10 ff 73 73 00 00 ef 00
(ada1:ata3:0:0:0): Retrying command
(ada1:ata3:0:0:0): READ_DMA48. ACB: 25 00 3f 46 a4 40 3c 00 00 00 00 01
(ada1:ata3:0:0:0): CAM status: ATA Status Error
(ada1:ata3:0:0:0): ATA status: 51 (DRDY SERV ERR), error: 84 (ICRC ABRT )
(ada1:ata3:0:0:0): RES: 51 84 3f 46 a4 3c 3c 00 00 4f 00
(ada1:ata3:0:0:0): Retrying command
(ada1:ata3:0:0:0): READ_DMA48. ACB: 25 00 ff 5c c3 40 2b 00 00 00 00 01
(ada1:ata3:0:0:0): CAM status: ATA Status Error
(ada1:ata3:0:0:0): ATA status: 51 (DRDY SERV ERR), error: 84 (ICRC ABRT )
(ada1:ata3:0:0:0): RES: 51 84 ff 5c c3 2b 2b 00 00 1f 00
(ada1:ata3:0:0:0): Retrying command
rl0: link state changed to DOWN
(ada1:ata3:0:0:0): READ_DMA48. ACB: 25 00 7f c2 7c 40 2f 00 00 00 a0 00
(ada1:ata3:0:0:0): CAM status: ATA Status Error
(ada1:ata3:0:0:0): ATA status: 51 (DRDY SERV ERR), error: 84 (ICRC ABRT )
(ada1:ata3:0:0:0): RES: 51 84 7f c2 7c 2f 2f 00 00 0f 00
(ada1:ata3:0:0:0): Retrying command
потогает только отключение питания... рестарт буттон отключен в ядре)))
хм.... у меня что винт подыхает??????!!!!!!!!!!!!
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-20 19:27:41
Dominator
QweЯty писал(а):хм.... у меня что винт подыхает??????!!!!!!!!!!!!
Возможно, а CAM его добивает retry'ами. Я сразу на боевом севере (FreeBSD 9.1 amd64) CAM вырезал
Денис писал(а): Безошибочный способ nslookup - не может найти сервер.
/etc/rc.d/netif restart
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-20 20:12:41
QweЯty
Я сразу на боевом севере (FreeBSD 9.1 amd64) CAM вырезал
эм... а что это, что дает и как вырезать...
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-20 22:35:27
QweЯty
--------
#
# Areca 11xx and 12xx series of SATA II RAID controllers.
# CAM is required.
#
device arcmsr # Areca SATA II RAID
---------------------
#
# 3ware 9000 series PATA/SATA RAID controller driver and options.
# The driver is implemented as a SIM, and so, needs the CAM infrastructure.
#
options TWA_DEBUG # 0-10; 10 prints the most messages.
options TWA_FLASH_FIRMWARE # firmware image bundled when defined.
device twa # 3ware 9000 series PATA/SATA RAID
-------------
#
# Adaptec FSA RAID controllers, including integrated DELL controllers,
# the Dell PERC 2/QC and the HP NetRAID-4M
device aac
device aacp # SCSI Passthrough interface (optional, CAM required)
# The 'asr' driver provides support for current DPT/Adaptec SCSI RAID
# controllers (SmartRAID V and VI and later).
# These controllers require the CAM infrastructure.
#
device asr
4ре места где встречает cam в notes...
но что за что отвечает....
правда в генерик есть:
cat GENERIC | grep CAM
options ATA_CAM # Handle legacy controllers with CAM
device ctl # CAM Target Layer
device aacp # SCSI passthrough for aac (requires CAM)
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-21 8:19:14
snorlov
QweЯty писал(а):Я сразу на боевом севере (FreeBSD 9.1 amd64) CAM вырезал
эм... а что это, что дает и как вырезать...
Кабель еще поменяй...
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-21 22:13:28
QweЯty
менял кабель(((
многа раз...
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2013-10-29 19:20:50
QweЯty
в общем дело не в этом винте...
с 2013-10-21 23:13:28 +/- пара часов по сегодня работало без проблемного винта
в логах тоже тишина...
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2014-02-15 14:56:30
Dominator
QweЯty писал(а):Я сразу на боевом севере (FreeBSD 9.1 amd64) CAM вырезал
эм... а что это, что дает и как вырезать...
В конфигах ядра все упоминание про CAM убираешь, заместо этого вводишь что-то вроде
Точнее не помню - загляни в дефолтный конфиг FreeBSD 8.0
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2014-02-15 17:32:16
guest
Dominator писал(а):QweЯty писал(а):Я сразу на боевом севере (FreeBSD 9.1 amd64) CAM вырезал
эм... а что это, что дает и как вырезать...
В конфигах ядра все упоминание про CAM убираешь, заместо этого вводишь что-то вроде
Точнее не помню - загляни в дефолтный конфиг FreeBSD 8.0
бред, "cam" он вырезал...
"cam добивает диск ретраями" - видимо из лога, только слово retry поняли
CAM - Common Access Method, изначально разработан для SCSI устройств, но представляет из себя универсальный
метод доступа, новый ATA драйвер переписан с использованием CAM интерфейса
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2014-02-16 7:10:40
Dominator
guest писал(а):
бред, "cam" он вырезал...
Не знаю, как у кого, а у меня после этого намного меньше мусора стало в логах и бракованный винт смог отбекапировать. Так что, прежде чем бросаться громкими заявлениями, рекомендую проверить на тестовой машине сие действие.
P.S.
guest, я вижу лишь твои эмоции, но не аргументы
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2014-02-16 12:31:59
guest
Dominator писал(а):guest писал(а):
бред, "cam" он вырезал...
Не знаю, как у кого, а у меня после этого намного меньше мусора стало в логах и бракованный винт смог отбекапировать. Так что, прежде чем бросаться громкими заявлениями, рекомендую проверить на тестовой машине сие действие.
P.S.
guest, я вижу лишь твои эмоции, но не аргументы
какие эмоции и аргументы могут быть в ответ на бред.
Вы чисто для общего представления почитайте что есть CAM и подумайте как старый и новый ATA драйвера могут
влиять на HDD и портить их и меньше писать в логи.
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2014-02-16 19:35:43
Dominator
guest писал(а):Вы чисто для общего представления почитайте что есть CAM и подумайте как старый и новый ATA драйвера могут
влиять на HDD и портить их и меньше писать в логи.
Как бы это все красиво не было написано, без проверки в боевых условиях, это ничто. Я не привык верить написанному, пока сам не проверю. Такого засирания консоли я еще не видел, как это было с CAM.
После отката на старый драйвер, который был в восьмерке, было одно ругательное сообщение в консоли и всед за ним ругань mc, при помощи которого спасал то, что можно спасти. И самое главное, все было быстро, в отличие от cam, который после каждого битого блока "просирался" по 2-3 минуты
P.S. Я так сильно не ругался с 2009 года, когда дернул неотмонтированную флешку на 6.2 во время установки прог из портов и повредил конфигурацию оных. Поэтому, что бы там ни говорили, я с CAM больше не дружу - сразу под скальпель. Хотя признаюсь, у него есть удобные плюшки.
Re: Раз в сутки сервер требует перезагрузки
Добавлено: 2014-02-17 8:22:08
Neus
"старый конь борозды не портит"
