Страница 1 из 1
налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-08-26 19:40:43
Syward
Третий день воюю с такой бедой:
таз на debian lenny с двумя сетевками натит локалку в инет
Код: Выделить всё
01:05.0 Ethernet controller: Marvell Technology Group Ltd. 88E8001 Gigabit Ethernet Controller (rev 13) инет
03:00.0 Ethernet controller: Intel Corporation 82573V Gigabit Ethernet Controller (Copper) (rev 03) локалка
как только на eth0 поднимается нагрузка (~120-130 мбит/с) - получаю wathdog timeout на eth0.
в логи сыплется такое:
Код: Выделить всё
Aug 26 18:20:23 nsr kernel: [ 7589.000118] NETDEV WATCHDOG: eth0: transmit timed out
Aug 26 18:20:26 nsr kernel: [ 7591.900959] eth0: Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
Aug 26 18:32:26 nsr kernel: [ 8312.000088] NETDEV WATCHDOG: eth0: transmit timed out
Aug 26 18:32:29 nsr kernel: [ 8314.848939] eth0: Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
Aug 26 18:56:34 nsr kernel: [ 9760.000068] NETDEV WATCHDOG: eth0: transmit timed out
Aug 26 18:56:37 nsr kernel: [ 9762.856903] eth0: Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
Aug 26 19:03:05 nsr kernel: [10151.000261] eth0: Detected Tx Unit Hang:
Aug 26 19:03:05 nsr kernel: [10151.000263] TDH <30>
Aug 26 19:03:05 nsr kernel: [10151.000264] TDT <1c>
Aug 26 19:03:05 nsr kernel: [10151.000265] next_to_use <1c>
Aug 26 19:03:05 nsr kernel: [10151.000267] next_to_clean <30>
Aug 26 19:03:05 nsr kernel: [10151.000268] buffer_info[next_to_clean]:
Aug 26 19:03:05 nsr kernel: [10151.000269] time_stamp <258ed1>
Aug 26 19:03:05 nsr kernel: [10151.000270] next_to_watch <30>
Aug 26 19:03:05 nsr kernel: [10151.000271] jiffies <25941e>
Aug 26 19:03:05 nsr kernel: [10151.000272] next_to_watch.status <0>
Aug 26 19:03:07 nsr kernel: [10153.000040] NETDEV WATCHDOG: eth0: transmit timed out
Aug 26 19:03:10 nsr kernel: [10155.852890] eth0: Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
Aug 26 19:30:50 nsr kernel: [11816.000055] NETDEV WATCHDOG: eth0: transmit timed out
Aug 26 19:30:53 nsr kernel: [11818.848933] eth0: Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
дрова:
Код: Выделить всё
# ethtool -i eth0
driver: e1000e
version: 0.3.3.3-k2
firmware-version: 0.15-1
bus-info: 0000:03:00.0
ядро:
гугел посоветовал пропатчить дрова на интел и пересобрать ядро,пропатчил, пересобрал, толку - ноль
TSO, SGO выключал c pci=noacpi грузился, биос на предмет "acpi level" рыл и просто acpi отключал...
Причем марвел, если его на локалку перевесить, нормально прокачивает трафик.
У меня идеи кончились

. Может кто лечил? Или все-таки сетевку менять?
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-08-26 21:39:38
NiTr0
Для начала собрать дрова от вендора... После - плясать с бубном :/
Сам недавно столкнулся с глюками 82540EM - 2 месяца работала идеально, пока не ребутнули машину, после чего - просто вдруг решила, что выше 15-20 кппс она прокачивать не будет. Пляски с бубном в виде изменения параметров модуля не помогли, обновление ядра установка свежего вендор драйвера - тоже.
Сейчас поставили марвелл pсi-e - тоже периодически выделывается :/ На секунды 3 линк гасит - типа MAC подвис.
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-08-27 10:30:55
paix
Syward писал(а):Причем марвел, если его на локалку перевесить, нормально прокачивает трафик.
на интел мало когда жаловались...дрова там прямые.
У меня как раз марвел чаще глючил. Особенно под фрей.
если марвел в локалку работает, то почему бы так и не оставить?
кроме того, я бы поменял кабель, поменял свич в локалку, и если есть попробовал бы на другой сетевухе, можно тоже интел.
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-08-27 13:32:41
Syward
paix писал(а):на интел мало когда жаловались...дрова там прямые.
Насколько я понял, это бага с этой конкретной сетевой.
paix писал(а):если марвел в локалку работает, то почему бы так и не оставить?
Потому, что тогда интел начинает глючить на инете
paix писал(а):кроме того, я бы поменял кабель, поменял свич в локалку, и если есть попробовал бы на другой сетевухе, можно тоже интел.
Кабель менял, свич... wgsw 24010 крайне не хотелось бы менять, ибо замены такой железке нет

, сетевку попробую другую сегодня.
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-09 19:54:43
Syward
Замена сетевки помогла.
Пакетики периодически поддропывает на локальном интерфейсе, но это мы вылечим

Кстати: никто не озадачивался высоко нагруженным натом на фре? А то пришлось переезжать потому, что фря под нагрузкой ребутилась раз в сутки (трафик ~150-170мбит)

. Использовался ipnat.
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-09 23:24:36
Alex_hha
Используй Linux и забудь про FreeBSD
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 16:55:37
Alex Keda
Alex_hha писал(а):Используй Linux и забудь про FreeBSD
он уже успешно переехал

)
налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
таз на debian lenny
ставьте под вендой. дальше уже некуда

Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 19:23:55
Syward
Чую, запахло холиваром
lissyara писал(а):он уже успешно переехал

)
вынужденно переехал, ибо фряха под таким трафиком обваливается пару раз в сутки, а этот тянет.
lissyara писал(а):
налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
таз на debian lenny
ставьте под вендой. дальше уже некуда
Поставил то, что лучше знаю. Центось во мне будит жажду крови своей кривостью и прекрасной поддержкой железа. В генте нет ни времени ни желания разбираться. Альты и прочие бубунты по релириозным соображениям ставить не хочу.
Если есть решение на фряхе - ткните носом в ссылку, буду весьма признателен.
Выше уже писал: ipnat не катит, валится.
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 19:48:32
_Andy
Syward писал(а):Выше уже писал: ipnat не катит, валится.
pf валится?
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 19:52:46
paradox
pf щас вроде обновили с опенбсд
но вот в какой версии бсд 7 8 или курренте не помню
ipnat кривоват и применителен токо для малого количества пользователей
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 20:00:02
Alex_hha
Чую, запахло холиваром
ну тут есть красноглазые фанаты одной ОС, не будем показывать пальцем.
Т.е. у тебя сейчас на Debian работает стабильно?
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 20:02:17
paradox
наскоко я помню у пингвинов глаза красные
не?
зы надо будет погуглить насчет фоток
я в темах линуха никогда не флужу
лиш информирую топик стартера что, как, и почему
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 20:16:30
Alex_hha
та я вообще не про тебя говорил, вот опять ты все на свой счет принимаешь

Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 20:17:11
Syward
_Andy писал(а):Syward писал(а):Выше уже писал: ipnat не катит, валится.
pf валится?
У них у обоих общая проблема: пухнет nat map. Только ipnat, когда в память перестает влезать, роняет систему, а pf начинает отбрасывать пакеты, если не может справиться с трафиком. Можно попробовать восьмерку поднять, у нее по слухам получше с натом.
Alex_hha писал(а):Т.е. у тебя сейчас на Debian работает стабильно?
Вижу небольшой дроп при высокой нагрузке, у юзеров это видно как зависание примерно на секунду, но это уже вопрос настройки, я мыслю.
Придется, наверное, вторую машину с натом поднимать и распаралеливать как-то трафик

Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 20:21:59
paradox
у народа нормально исползуеться фряха для натинга с таким потоком
но какой именно нат они используют нужно узнавать или читать
это все на форум наг ру
только ipnat, когда в память перестает влезать, роняет систему, а pf начинает отбрасывать пакеты, если не может справиться с трафиком. Можно попробовать восьмерку поднять, у нее по слухам получше с натом
pf можно увиличивать размер таблиц
вроде где то мелькал коммит - опять же не помню в какую версию бсд
что вроде менять можно размер таблицы
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 20:23:48
paradox
Alex_hha писал(а):та я вообще не про тебя говорил, вот опять ты все на свой счет принимаешь

на свой счет нет
я это воспринимаю разве что насчет бсд
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-10 20:35:12
_Andy
Syward писал(а):У них у обоих общая проблема: пухнет nat map. Только ipnat, когда в память перестает влезать, роняет систему, а pf начинает отбрасывать пакеты, если не может справиться с трафиком. Можно попробовать восьмерку поднять, у нее по слухам получше с натом.
polling на карте
включен?
Syward писал(а):Вижу небольшой дроп при высокой нагрузке, у юзеров это видно как зависание примерно на секунду, но это уже вопрос настройки, я мыслю.
Возможно надо тюнить ядро Фришное.
Syward писал(а):Придется, наверное, вторую машину с натом поднимать и распаралеливать как-то трафик

Погляди у pf был load balanced, но там с двумя адресами вроде. Точно не уверен.
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-14 12:50:34
Alex Keda
энди, он про линух писал...
==========
тов. линуксоиды, читайте всю тему и вникайте чё пишут. а не так чтоб тока отписаться...
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-14 13:09:53
Syward
_Andy писал(а):
polling на карте
включен?
На фряхе был включен, без поллинга серверу через полчаса плохело. На линухе оно само походу рулит.
_Andy писал(а):
Возможно надо тюнить ядро Фришное.
дропает на линухе.
_Andy писал(а):
Погляди у pf был load balanced, но там с двумя адресами вроде. Точно не уверен.
это погляжу, спасибо)
ЗЫ: своими глазами видел ipnat map 200k+ на нате, но что товарищщ с ним сделал странного - так и не признался.
ЗЗЫ:
lissyara, мыло с уведомлениями об ответах через раз приходит

Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-14 13:15:00
Alex Keda
приходит одно уведомление, пока не просомтришь больше не приходит.
и не сразу - они в очереь ставляться, внутри форума. бывает совсем не сразу... там ещё крон внутри со своим расписанием

))
в течение суток точно придёт.
это форум - тут не подразумевается быстрых сообщений.
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-14 21:25:19
_Andy
lissyara писал(а):энди, он про линух писал...
Он про бсд писал

Сегодня вроде все рассольник ели.
lissyara писал(а):
==========
тов. линуксоиды, читайте всю тему и вникайте чё пишут. а не так чтоб тока отписаться...
Re: налетел на кикоз NETDEV WATCHDOG: eth0: transmit timed out
Добавлено: 2009-09-15 10:18:20
Alex Keda
завязывай с грибами...
я про вторую и третью цитату писал...