Код: Выделить всё
# uname -rm
7.0-STABLE amd64
Код: Выделить всё
ATA channel 2:
Master: ad4 <WDC WD5000AAKS-00UU3A0/01.03B01> Serial ATA II
Slave: no device present
ATA channel 3:
Master: ad6 <WDC WD4001ABYS-01YNA0/59.01D01> Serial ATA II
Slave: no device present
ATA channel 4:
Master: ad8 <WDC WD5000AAKS-00A7B2/01.03B01> Serial ATA II
Slave: no device present
периодически возникает проблема типа:
Код: Выделить всё
Jun 13 04:04:18 alpha kernel: ad6: WARNING - SETFEATURES SET TRANSFER MODE taskqueue timeout - completing request directly
Jun 13 04:05:09 alpha kernel: ad6: WARNING - SETFEATURES SET TRANSFER MODE taskqueue timeout - completing request directly
Jun 13 04:05:09 alpha kernel: ad6: WARNING - SETFEATURES ENABLE RCACHE taskqueue timeout - completing request directly
Jun 13 04:05:09 alpha kernel: ad6: WARNING - SETFEATURES ENABLE WCACHE taskqueue timeout - completing request directly
Jun 13 04:05:09 alpha kernel: ad6: WARNING - SET_MULTI taskqueue timeout - completing request directly
Jun 13 04:05:09 alpha kernel: ad6: TIMEOUT - READ_DMA48 retrying (1 retry left) LBA=554632875
Jun 13 04:05:09 alpha kernel: ad6: FAILURE - SETFEATURES SET TRANSFER MODE status=51<READY,DSC,ERROR> error=84<ICRC,ABORTED>
Jun 13 04:05:09 alpha kernel: ad6: TIMEOUT - READ_DMA48 retrying (1 retry left) LBA=560529099
- после сбоя ЭП, при загрузке начинает синхронизироваться райд (+стартуют 3 джайла) - на консоль сыпятся аналогичные ошибки, сервак зависает (не реагирует на клаву). ребут, однопольз.режим., fsck, синхронизация райда, нормальная загрузка.
- диск бэкапов по ночам начал сыпать такие ошибки. перенес бэкапы в другое место, проверил smart - погонял dd - проверил smart -- диск живой. переразбил диск, вернул бэкапы - полгода ошибок нет.
- датацентр переносил сервер в другую стойку. выключал я через shutdown, выключался и грузился он как-то так:
Код: Выделить всё
Jun 13 00:39:21 alpha shutdown: power-down by root:
Jun 13 00:39:54 alpha rc.shutdown: 30 second watchdog timeout expired. Shutdown terminated.
Jun 13 00:39:54 alpha syslogd: exiting on signal 15
Jun 13 03:09:26 alpha syslogd: kernel boot file is /boot/kernel/kernel
Jun 13 03:09:26 alpha kernel: ER=125 MODE=100700
Jun 13 03:09:27 alpha root: /etc/rc: WARNING: Dump directory does not exist. Savecore not run.
Jun 13 03:09:27 alpha kernel: em0: link state changed to UP
Jun 13 03:09:35 alpha ntpd[734]: ntpd 4.2.0-a Sun Jul 27 18:15:12 MSD 2008 (1)
Jun 13 03:09:35 alpha ntpd[734]: no IPv6 interfaces found
Jun 13 03:09:38 alpha kernel: pid 734 (ntpd), uid 0: exited on signal 11 (core dumped)
Jun 13 03:43:32 alpha syslogd: kernel boot file is /boot/kernel/kernel
Jun 13 03:43:32 alpha kernel: Copyright (c) 1992-2008 The FreeBSD Project.
Jun 13 03:43:32 alpha kernel: Copyright (c) 1979, 1980, 1983, 1986, 1988, 1989, 1991, 1992, 1993, 1994
Jun 13 03:43:32 alpha kernel: The Regents of the University of California. All rights reserved.
Jun 13 03:43:32 alpha kernel: FreeBSD is a registered trademark of The FreeBSD Foundation.
Jun 13 03:43:32 alpha kernel: FreeBSD 7.0-STABLE #0: Tue Sep 16 17:40:42 MSD 2008
Код: Выделить всё
rc.shutdown: 30 second watchdog timeout expired. Shutdown terminated.
в настоящий момент:
Код: Выделить всё
# uptime
17:54 up 2 days, 9:08, 2 users, load averages: 1,81 2,00 1,99
судя по смарту диске не сыпятся.
рабочие версии причины проблемы:
- "мандит контроллер" (но его вроде как меняли, но это неточно, было до меня)
- заменить sata-кабели
- заменить БП
- обновиться до 7.4 (в том числе обновится и драйвер контроллера)
кто что посоветует? какие еще варианты?
PS.
собственно
- заменить sata-кабели
- заменить БП
мог бы и не спрашивать, но сервер в Москве и туда спец. для этого поехать придется