Сыпятся ошибки FAILURE - READ_DMA, хотя диски в норме

Проблемы установки, настройки и работы Правильной Операционной Системы

Модератор: terminus

Правила форума
Убедительная просьба юзать теги [cоde] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
playnet
мл. сержант
Сообщения: 75
Зарегистрирован: 2009-07-02 15:33:24

Re: Сыпятся ошибки FAILURE - READ_DMA, хотя диски в норме

Непрочитанное сообщение playnet » 2009-12-03 19:56:54

Evgen_pnz писал(а):температура, правда это почти на холостом ходу
ad0: 58
ad1: 60
ad4: 60
ad6: 50
Странно, что оно хоть как-то живо, с такой-то температурой.
Evgen_pnz писал(а):чтобы определить потоки воздуха в машине, так видно что винты находятся в кармане где воздух почти тупо стоит, буду ставить доп. куллеры и менять направление потоков :roll:
Не "куллеры", а кулер на штатное место, скорее всего 80 или 92. Если места нет - менять корпус.
НИКАКИХ "пришлепков" снизу, их среднее время жизни примерно 3 месяца, потом они дохнут и получаем +5-10 градусов к температуре диска.
Evgen_pnz писал(а):А эту запустил под внутренние цели там где инфа не настолько ответственная,
Ужас какой. Какая "ответственная" инфа в таких недосерверах, где явно проблемы с бп будут уже через пол года (если корпус настолько остойный, что забор воздуха идет мимо дисков, что говорить об остальных компонентах)...
Никакого ноунейма. Не хотите брать вменяемые сервера, так хоть берите норм компоненты. Нормальные корпуса, именитые БП с запасом по мощности в 2+ раза, именитые диски, ИБП обязательно (это даже не обсуждается), причем смарт и не ниже иппонов, а лучше апс. Никаких паверкомов и памерманов и прочего трэша. Платы только с твердотельными электролитами. Причем у меня асус давно не в почете, тогда как гигабайты только с лучшей стороны себя показывают.
Корпус кстати хороший cooler master (моделей много), но их понт в том, что есть в 5.25" отсеки нормальные продуваемые корзины под 3.5 диски. Есть модель корпуса на 9-5.25 слотов, туда 3 корзины под 4 диска каждый... И бп 500+вт туда. Этого хватит надолго. А там может дорастете хотя бы до супермикр.
arkan писал(а):IDE винты благодаря своей кривизне имеют очень ненадежный разьем питания
тоесть возьми разиемы питания на блоке питания и просто сами металлические трубочки согни немного чтоб в жесткий диск они входили плотно
:Bravo: Просто супер ненадежный, ага-ага... У ненадежных бп за 300р.
А у всех нормальных бп коннектор слегка подпружинен и сидит крайне плотно. Их по 5 минут выковыривать можно, такие они "ненадежные".
Совет тут только 1 - заменить бп на нормальный. Ибо там не контакт плохой (если уж совсем не выпадает из разъема), а строение бп. И осциллограф там на выходе такое порой показывает, что волосы дыбом.

Ладно, сворачиваю флейм. По выбору корпусов, плат, бп, ибп и проч -- на хобот (forum.ixbt.com), там народ в большинстве своем шарит.

Хостинговая компания Host-Food.ru
Хостинг HostFood.ru
 

Услуги хостинговой компании Host-Food.ru

Хостинг HostFood.ru

Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/

Аватара пользователя
Evgen_pnz
рядовой
Сообщения: 46
Зарегистрирован: 2009-03-20 13:09:31
Откуда: Penza
Контактная информация:

Re: Сыпятся ошибки FAILURE - READ_DMA, хотя диски в норме

Непрочитанное сообщение Evgen_pnz » 2009-12-03 20:20:46

playnet писал(а): Странно, что оно хоть как-то живо, с такой-то температурой.
Я тоже в шоке что они 4 года проюзались причём на нормальной нагрузке.
playnet писал(а): Ужас какой. Какая "ответственная" инфа в таких недосерверах, где явно проблемы с бп будут уже через пол года (если корпус настолько остойный, что забор воздуха идет мимо дисков, что говорить об остальных компонентах)...
Этой машине >4 когда я туда пришёл она там уже трудилась. Тогда как то и не задумывались они о достойных серваках.
playnet писал(а):Никакого ноунейма. Не хотите брать вменяемые сервера, так хоть берите норм компоненты.
Я смотрю вы тему просто не внимательно прочитали, я же сказал что мы давно работаем на нормальных машинах в стойках, а эти так сказать "последние из могикан".
playnet писал(а):Ладно, сворачиваю флейм. По выбору корпусов, плат, бп, ибп и проч -- на хобот (forum.ixbt.com), там народ в большинстве своем шарит.
Да просто этой теме не дают спокойно умереть, я же сказал что машину снял с работы, и поставил так сказать для экспериментов. Я давно уже и забыл бы про эту тему, но всё равно спасибо и Вам за советы и всем кто откликнулся. На днях ждём системы хранения на 32 тб. будем перестраивать кластер, так что если что надеюсь мне также не откажут в помощи, хотя думаю там проблем не будет, но как говориться не говори гоп...!
Не знаю кто писал мою жизнь, но чувствую я себя бета-тестером...

Аватара пользователя
acd
проходил мимо
Сообщения: 5
Зарегистрирован: 2009-09-07 1:07:04

Re: Сыпятся ошибки FAILURE - READ_DMA

Непрочитанное сообщение acd » 2009-12-06 23:10:48

Решил написать сюды, чтобы не открывать нового thread'а. У меня была аналогичная проблема, лечил - MHDD с опцией remap для битых блоков. Исправил. Повторная проверка ничего не показала. :smile: Но теперь другая проблема, с-ма не грузится из-за поправок в FS:
fsck_ufs: cannot alloc ... bytes for inoinfo
Кто-нить что-то толковое может толкнуть? Тока не предлагать newfs, раздел /.

playnet
мл. сержант
Сообщения: 75
Зарегистрирован: 2009-07-02 15:33:24

Re: Сыпятся ошибки FAILURE - READ_DMA

Непрочитанное сообщение playnet » 2009-12-08 15:52:17

acd писал(а):Решил написать сюды, чтобы не открывать нового thread'а. У меня была аналогичная проблема, лечил - MHDD с опцией remap для битых блоков. Исправил. Повторная проверка ничего не показала. :smile: Но теперь другая проблема, с-ма не грузится из-за поправок в FS:
fsck_ufs: cannot alloc ... bytes for inoinfo
Кто-нить что-то толковое может толкнуть? Тока не предлагать newfs, раздел /.
Ну если разбито грамотно, это как раз не проблема. Только с ливсд делать надо. Сразу и пересоздать данные /
Вообще, ошибка странная. тут вряд ли помогут, лучше сразу в ru_root в жж стукнись.

Аватара пользователя
Hikari
мл. сержант
Сообщения: 84
Зарегистрирован: 2009-02-19 5:26:08
Контактная информация:

Re: Сыпятся ошибки FAILURE - READ_DMA, хотя диски в норме

Непрочитанное сообщение Hikari » 2013-04-28 18:42:58

Эта ошибка чуть более, чем всегда, лезет, если на винте появился сбойный сектор. fsck НЕ показывает эти ошибки и НЕ умеет это ремонтировать!
manefesto писал(а):
[3:34]|root@server.manefesto| manefesto/>grep -e fsck /etc/defaults/rc.conf
fsck_y_enable="NO" # Set to YES to do fsck -y if the initial preen fails.
fsck_y_flags="" # Additional flags for fsck -y
background_fsck="YES" # Attempt to run fsck in the background where possible.
background_fsck_delay="60" # Time to wait (seconds) before starting the fsck.
Это наилучший метод удрочить вконец умирающий винт и потерять инфу.
ИМХО никогда никаких бекграудных и вообще автоматических fsck делать категорически нельзя!
что будет, если винт будет упорно прочесть сбойный сектор? - правильно, увалит головку.

fsck не умеет ремапить битые сектора, поэтому нужно использовать другой инструментарий!

Идем сюда, берем подходящий образ MHDD (или ищем в закромах reanimator CD). При свежем харде большого объема все же лучше слить свежий образ.
- Грузимся с него, запускаем мхдд.
- выбираем порт с винтом
- жмем F4, !!!!НИЧЕГО НЕ МЕНЯЕМ!!!!!! (никаких ремапов и т д) и еще раз F4 - то есть запускаем в режиме просто сканирования.
- смотрим в монитор, большинство секторов пролетают на ура, а мы ждем, пока выскочит ошибка. При этом пикает, номер битого сектора выскакивает справа снизу красным шрифтом
- жмем esc, останавливаем сканирование.
- вводим команду erase. она спрашивает, какие сектора тереть - начальный, затем конечный.
- задаем начальным сбойный сектор, конечный - следующий. секунда - и битые сектора стерты.
- опять запускаем сканирование (F4, еще раз F4). убеждаемся, что сбойных больше нет.
- при большом количестве сбойных секторов можно один раз оттестировать, выписать на бумажку сбойные и потереть все сразу как описано выше(чтобы не сканировать после каждого стирания), это ускорит процесс.
- после последнего контрольного сканирования, когда оно пройдет чисто - грузим фрю в однопользовательский и запускаем fsck. после завершения перегружаемся, ремонтируем битые базы и быстренько ищем новый винт, пока этот хоть как-то дышит. на новый переезжаем удобным методом (рекомендую акронис)

Частично избежать подобных ситуаций помогает принудительное охлаждение винта. Не жлобитесь на дополнительный кулер!
__________________________________________________________
Чем ленивее человек, тем больше его труд напоминает подвиг.

ptor
проходил мимо
Сообщения: 1
Зарегистрирован: 2013-04-29 1:57:35

Re: Сыпятся ошибки FAILURE - READ_DMA, хотя диски в норме

Непрочитанное сообщение ptor » 2013-04-29 1:58:41

hikari Отличным гайд, мне помог очень

Аватара пользователя
Hikari
мл. сержант
Сообщения: 84
Зарегистрирован: 2009-02-19 5:26:08
Контактная информация:

Re: Сыпятся ошибки FAILURE - READ_DMA, хотя диски в норме

Непрочитанное сообщение Hikari » 2013-04-29 8:00:33

Сенк, самому вчера пришлось угробить 4 часа на спасение веника с инфой
__________________________________________________________
Чем ленивее человек, тем больше его труд напоминает подвиг.