Ругань в messages. Сыпется один из дисков ?
Добавлено: 2011-11-02 11:19:19
Приветствую всех
Машина с FreeBSD 8.2 amd64, в ДЦ стоит около года, конфиг:
2хXeon E5630 2.53GHz
48Gb RAM 1333 ECC Registered
LSI SAS контроллер
3 SAS 146Gb 10000 rpm
1 SAS 600Gb 10000 rpm
2 SAS 73Gb 15000 rpm
2 SATA 1Tb 5400 rpm
С неделю в логи посыпалось следующее:
da7 - это один из хардов:
Нагрузка на него приличная, он выделен под исключительно под картинки, файлов очень много а ресурсы на серваке стоят тяжелые по посещаемости.
То есть это все однозначно указывает что диск приказывает долго жить ?
Если да, какие варианты решения, поменять диск от греха или попытаться как-нить вылечить ?
Заранее спасибо
Машина с FreeBSD 8.2 amd64, в ДЦ стоит около года, конфиг:
2хXeon E5630 2.53GHz
48Gb RAM 1333 ECC Registered
LSI SAS контроллер
3 SAS 146Gb 10000 rpm
1 SAS 600Gb 10000 rpm
2 SAS 73Gb 15000 rpm
2 SATA 1Tb 5400 rpm
С неделю в логи посыпалось следующее:
Код: Выделить всё
Nov 2 01:21:13 srv kernel: mpt0: request 0xffffff8000b529e0:45460 timed out for ccb 0xffffff0220267000 (req->ccb 0xffffff0220267000)
Nov 2 01:21:13 srv kernel: mpt0: attempting to abort req 0xffffff8000b529e0:45460 function 0
Nov 2 01:21:14 srv kernel: mpt0: completing timedout/aborted req 0xffffff8000b529e0:45460
Nov 2 01:21:14 srv kernel: mpt0: abort of req 0xffffff8000b529e0:0 completed
Nov 2 01:21:43 srv kernel: (da7:mpt0:0:20:0): READ(10). CDB: 28 0 28 ac de df 0 1 0 0.
Nov 2 01:21:43 srv kernel: (da7:mpt0:0:20:0): CAM status: SCSI Status Error
Nov 2 01:21:43 srv kernel: (da7:mpt0:0:20:0): SCSI status: Check Condition
Nov 2 01:21:43 srv kernel: (da7:mpt0:0:20:0): SCSI sense: ABORTED COMMAND info:28acdf8e asc:11,1 (Read retries exhausted) sks:0x80,0
Nov 2 01:21:43 srv kernel: g_vfs_done():da7s1d[READ(offset=349397925888, length=131072)]error = 5
Nov 2 01:21:52 srv kernel: (da7:mpt0:0:20:0): READ(10). CDB: 28 0 28 ac db 7f 0 0 e0 0.
Nov 2 01:21:52 srv kernel: (da7:mpt0:0:20:0): CAM status: SCSI Status Error
Nov 2 01:21:52 srv kernel: (da7:mpt0:0:20:0): SCSI status: Check Condition
Nov 2 01:21:52 srv kernel: (da7:mpt0:0:20:0): SCSI sense: MEDIUM ERROR info:28acdba0 asc:11,1 (Read retries exhausted) actual retry count: 63
Nov 2 01:21:52 srv kernel: g_vfs_done():da7s1d[READ(offset=349397483520, length=114688)]error = 5
Nov 2 02:27:20 srv kernel: (da7:mpt0:0:20:0): READ(10). CDB: 28 0 28 b0 18 1f 0 1 0 0.
Nov 2 02:27:20 srv kernel: (da7:mpt0:0:20:0): CAM status: SCSI Status Error
Nov 2 02:27:20 srv kernel: (da7:mpt0:0:20:0): SCSI status: Check Condition
Nov 2 02:27:20 srv kernel: (da7:mpt0:0:20:0): SCSI sense: ABORTED COMMAND info:28b01914 asc:11,1 (Read retries exhausted) sks:0x80,0x4
Nov 2 10:15:22 srv kernel: (da7:mpt0:0:20:0): READ(10). CDB: 28 0 28 ac 72 7f 0 1 0 0.
Nov 2 10:15:22 srv kernel: (da7:mpt0:0:20:0): CAM status: SCSI Status Error
Nov 2 10:15:22 srv kernel: (da7:mpt0:0:20:0): SCSI status: Check Condition
Nov 2 10:15:22 srv kernel: (da7:mpt0:0:20:0): SCSI sense: ABORTED COMMAND info:28ac72e9 asc:11,1 (Read retries exhausted) sks:0x80,0
Nov 2 10:16:01 srv kernel: mpt0: request 0xffffff8000b58c50:9650 timed out for ccb 0xffffff0014259800 (req->ccb 0xffffff0014259800)
Nov 2 10:16:01 srv kernel: mpt0: attempting to abort req 0xffffff8000b58c50:9650 function 0
Nov 2 10:16:02 srv kernel: mpt0: completing timedout/aborted req 0xffffff8000b58c50:9650
Nov 2 10:16:02 srv kernel: mpt0: abort of req 0xffffff8000b58c50:0 completed
Nov 2 10:16:22 srv kernel: mpt0: request 0xffffff8000b50160:10102 timed out for ccb 0xffffff008dddd800 (req->ccb 0xffffff008dddd800)
Nov 2 10:16:22 srv kernel: mpt0: attempting to abort req 0xffffff8000b50160:10102 function 0
Nov 2 10:16:22 srv kernel: mpt0: request 0xffffff8000b48fc0:10103 timed out for ccb 0xffffff022026a800 (req->ccb 0xffffff022026a800)
Nov 2 10:16:22 srv kernel: mpt0: request 0xffffff8000b55ad0:10104 timed out for ccb 0xffffff00142b0000 (req->ccb 0xffffff00142b0000)
Nov 2 10:16:22 srv kernel: mpt0: request 0xffffff8000b4d2b0:10105 timed out for ccb 0xffffff00142b1000 (req->ccb 0xffffff00142b1000)
Nov 2 10:16:22 srv kernel: mpt0: request 0xffffff8000b48900:10106 timed out for ccb 0xffffff0220267000 (req->ccb 0xffffff0220267000)
Nov 2 10:16:22 srv kernel: mpt0: completing timedout/aborted req 0xffffff8000b48fc0:10103
Nov 2 10:16:22 srv kernel: mpt0: completing timedout/aborted req 0xffffff8000b55ad0:10104
Nov 2 10:16:22 srv kernel: mpt0: completing timedout/aborted req 0xffffff8000b4d2b0:10105
Nov 2 10:16:22 srv kernel: mpt0: completing timedout/aborted req 0xffffff8000b48900:10106
Nov 2 10:16:22 srv kernel: mpt0: completing timedout/aborted req 0xffffff8000b50160:10102
Nov 2 10:16:22 srv kernel: mpt0: abort of req 0xffffff8000b50160:0 completed
Nov 2 10:17:17 srv kernel: (da7:mpt0:0:20:0): READ(10). CDB: 28 0 28 ac 72 7f 0 1 0 0.
Nov 2 10:17:17 srv kernel: (da7:mpt0:0:20:0): CAM status: SCSI Status Error
Nov 2 10:17:17 srv kernel: (da7:mpt0:0:20:0): SCSI status: Check Condition
Nov 2 10:17:17 srv kernel: (da7:mpt0:0:20:0): SCSI sense: ABORTED COMMAND info:28ac7315 asc:11,1 (Read retries exhausted) sks:0x80,0
Nov 2 10:17:54 srv kernel: (da7:mpt0:0:20:0): READ(10). CDB: 28 0 28 ac 72 7f 0 1 0 0.
Nov 2 10:17:54 srv kernel: (da7:mpt0:0:20:0): CAM status: SCSI Status Error
Nov 2 10:17:54 srv kernel: (da7:mpt0:0:20:0): SCSI status: Check Condition
Nov 2 10:17:54 srv kernel: (da7:mpt0:0:20:0): SCSI sense: ABORTED COMMAND info:28ac7377 asc:11,1 (Read retries exhausted) sks:0x80,0x4
Код: Выделить всё
da7 at mpt0 bus 0 scbus0 target 20 lun 0
da7: <TOSHIBA MBF260LRC 6102> Fixed Direct Access SCSI-5 device
da7: 300.000MB/s transfers
da7: Command Queueing enabled
da7: 572325MB (1172123568 512 byte sectors: 255H 63S/T 72961C)
То есть это все однозначно указывает что диск приказывает долго жить ?
Если да, какие варианты решения, поменять диск от греха или попытаться как-нить вылечить ?
Заранее спасибо