FreeBSD softrouter (netstat errs input) + непонятный трафик

Простые/общие вопросы по UNIX системам. Спросите здесь, если вы новичок

Модераторы: vadim64, terminus

Правила форума
Убедительная просьба юзать теги [cоde] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
nerik
рядовой
Сообщения: 12
Зарегистрирован: 2010-01-19 13:58:48

FreeBSD softrouter (netstat errs input) + непонятный трафик

Непрочитанное сообщение nerik » 2010-12-10 9:22:19

Всем доброго дня.
Коллеги прошу помощи в советах. Не могу понять кто валит наш шлюз, либо физик какой-то, либо странность в сети.
Имеются два шлюза IBM для ната, перед ними есть bras в роли циски ASR1002.
Оба шлюза под управлением FreeBSD 7.3 с yandex драйверами 1.36.2.17 (сетевые Intel® PRO/1000, хорошие сетевые, с трафиком не подводили). Работают они отлично и уже очень длительное время.
После bras default-маршрут идет на первый шлюз, а на второй мы скинули 16 сетей (Для балансировки входящего в нашу сеть трафика, знаю что криво, но работает). Оба шлюза физически подключены в разные места (в разные коммутаторы), поэтому проблема точно не в физике (т.к. при переносе всего трафика на один из шлюзов, проблема повторяется).
Теперь о самой проблеме.
Вчера первый шлюз стал загибаться, процессы rx_kthread стали взлетать до 100%, тем самым съедать весь процессор.
При выводе команды netstat -hw 1 (данные пока не сохранил) увидел, что копятся errs на input, при этом количество пакетов начинает падать (например с 60K до 3-4K, а ошибки возрастают до 6-7K). Суть в том, что длится это не долго, было вчера 3 раза и каждый такой сбой был от 3 до 10 минут.
Bras (ASR1002) не загибается. Колбасит при этом первый шлюз очень даже не дурно. А вот со вторым шлюзом все нормально. Я думал, что это сам шлюз глючит, но когда я весь трафик перекинул на второй, второй стал тоже загибаться с такими же симптомами.

tcpdump не выявил ничего плохого.

Посмотрел дебаг сетевух:

Код: Выделить всё

sysctl dev.em.2.stats=1

Dec 10 08:48:41 gwibm kernel: em2: Excessive collisions = 0
Dec 10 08:48:41 gwibm kernel: em2: Sequence errors = 0
Dec 10 08:48:41 gwibm kernel: em2: Defer count = 0
Dec 10 08:48:41 gwibm kernel: em2: Missed Packets = 7216624
Dec 10 08:48:41 gwibm kernel: em2: Receive No Buffers = 1084060
Dec 10 08:48:41 gwibm kernel: em2: Receive Length Errors = 0
Dec 10 08:48:41 gwibm kernel: em2: Receive errors = 0
Dec 10 08:48:41 gwibm kernel: em2: Crc errors = 0
Dec 10 08:48:41 gwibm kernel: em2: Alignment errors = 0
Dec 10 08:48:41 gwibm kernel: em2: Collision/Carrier extension errors = 0
Dec 10 08:48:41 gwibm kernel: em2: RX overruns = 101
Dec 10 08:48:41 gwibm kernel: em2: watchdog timeouts = 0
Dec 10 08:48:41 gwibm kernel: em2: RX MSIX IRQ = 0 TX MSIX IRQ = 0 LINK MSIX IRQ = 0
Dec 10 08:48:41 gwibm kernel: em2: XON Rcvd = 0
Dec 10 08:48:41 gwibm kernel: em2: XON Xmtd = 61562
Dec 10 08:48:41 gwibm kernel: em2: XOFF Rcvd = 0
Dec 10 08:48:41 gwibm kernel: em2: XOFF Xmtd = 7275240
Dec 10 08:48:41 gwibm kernel: em2: Good Packets Rcvd = 1779196668
Dec 10 08:48:41 gwibm kernel: em2: Good Packets Xmtd = 1735225671
Dec 10 08:48:41 gwibm kernel: em2: TSO Contexts Xmtd = 0
Dec 10 08:48:41 gwibm kernel: em2: TSO Contexts Failed = 0


sysctl dev.em.2.debug=1

Dec 10 08:49:21 gwibm kernel: em2: Adapter hardware address = 0xc566a218
Dec 10 08:49:21 gwibm kernel: em2: CTRL = 0x581c0241 RCTL = 0x8002
Dec 10 08:49:21 gwibm kernel: em2: Packet buffer = Tx=16k Rx=32k
Dec 10 08:49:21 gwibm kernel: em2: Flow control watermarks high = 30720 low = 29220
Dec 10 08:49:21 gwibm kernel: em2: tx_int_delay = 100, tx_abs_int_delay = 195
Dec 10 08:49:21 gwibm kernel: em2: rx_int_delay = 0, rx_abs_int_delay = 200
Dec 10 08:49:21 gwibm kernel: em2: fifo workaround = 0, fifo_reset_count = 0
Dec 10 08:49:21 gwibm kernel: em2: hw tdh = 1090, hw tdt = 1090
Dec 10 08:49:21 gwibm kernel: em2: hw rdh = 3104, hw rdt = 3103, next_rx_desc_to_check = 3104
Dec 10 08:49:21 gwibm kernel: em2: Num Tx descriptors avail = 4068
Dec 10 08:49:21 gwibm kernel: em2: Tx Descriptors not avail1 = 0
Dec 10 08:49:21 gwibm kernel: em2: Tx Descriptors not avail2 = 0
Dec 10 08:49:21 gwibm kernel: em2: Std mbuf failed = 0
Dec 10 08:49:21 gwibm kernel: em2: Std mbuf cluster failed = 0
Dec 10 08:49:21 gwibm kernel: em2: Driver dropped packets = 0
Dec 10 08:49:21 gwibm kernel: em2: Driver tx dma failure in encap = 0
Dec 10 08:49:21 gwibm kernel: em2: Packets pended due to reorder = 0
Dec 10 08:49:21 gwibm kernel: em2: RX interrupts has been masked = 99250334
Dec 10 08:49:21 gwibm kernel: em2: TX interrupts has been generated = 0
Единственное что я крутил у сетевух так это

Код: Выделить всё

dev.em.2.rx_int_delay=100
dev.em.2.tx_int_delay=100
dev.em.2.rx_abs_int_delay=200
dev.em.2.tx_abs_int_delay=200
dev.em.2.rx_kthreads=4
Коллеги помогите, пожалуйста. Подскажите, что за трафик такой может спровоцировать ошибки на сетевой при входе? Спасибо.

P.S. Раньше когда трафика было много и шлюз был один, то при перегрузке ошибки появлялись на интерфейсе, но количество пакетов так сильно не падало (ну может на 2-3K, но не на 40K же). Когда появляется вышеописанная проблема, взлет трафика нет, по количеству пакетов сказать пока сложно, но вроде тоже не возрастает.
Последний раз редактировалось f_andrey 2010-12-10 11:09:08, всего редактировалось 1 раз.
Причина: Автору, выбирайте пожалуйста раздел соответствуюший тематике вашего сообщения, и оформляйте его по человечески.

Хостинговая компания Host-Food.ru
Хостинг HostFood.ru
 

Услуги хостинговой компании Host-Food.ru

Хостинг HostFood.ru

Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/

Гость
проходил мимо

Re: FreeBSD softrouter (netstat errs input) + непонятный тра

Непрочитанное сообщение Гость » 2010-12-10 9:29:36

из быстрых советов
могу посоветовать помедитировать над этой темой
может мысли какие появятся
http://forum.nag.ru/forum/lofiversion/i ... 60663.html

nerik
рядовой
Сообщения: 12
Зарегистрирован: 2010-01-19 13:58:48

Re: FreeBSD softrouter (netstat errs input) + непонятный тра

Непрочитанное сообщение nerik » 2010-12-10 10:00:54

Гость писал(а):из быстрых советов
могу посоветовать помедитировать над этой темой
может мысли какие появятся
http://forum.nag.ru/forum/lofiversion/i ... 60663.html
На сервере стоят яндекс драйвера, сервер работал стабильно. Проблема появлялась вчера 3 раза за день, до этого все было нормально, трафик в количестве и интенсивности в сети не менялся. Подозреваю что кто то генерирует плохой трафик, который переполняет буфер сетевой карты на входе.

Код: Выделить всё

em2: Missed Packets = 7216624
em2: Receive No Buffers = 1084060
Сегодня проблем не было. Вот и хочу понять что может такое губить сетевую карту.

Гость
проходил мимо

Re: FreeBSD softrouter (netstat errs input) + непонятный тра

Непрочитанное сообщение Гость » 2010-12-10 10:07:56

статистика по трафику есть? вот и стравните
герерит кто то или нет
в крайнем случае сгенерите трафик сами
и все проверте

по ссылке что я вам дал вы не ходили, понятно

nerik
рядовой
Сообщения: 12
Зарегистрирован: 2010-01-19 13:58:48

Re: FreeBSD softrouter (netstat errs input) + непонятный тра

Непрочитанное сообщение nerik » 2010-12-10 10:25:06

Гость писал(а):статистика по трафику есть? вот и стравните
герерит кто то или нет
в крайнем случае сгенерите трафик сами
и все проверте

по ссылке что я вам дал вы не ходили, понятно
Статистику я сравнивал, ничем не отличается, сервер может молотить и больше (проверенно при отключении второго, более 500 Мегбаит прогоняет, проблема была при 300-400 Мегабит). Сейчас все же нормально.

P.S.
По ссылке ходил, там обсуждалось загрузка процессов swi1: net и kthread, у меня же в данный момент загрузка одного kthread не более 25%. Нет перегрузки. И уже год никаких аномалий.
Вопрос заключался в том, что за пакеты такие существуют которые могу валить сетевую карту. Ведь проходит проблема сама спустя 5-10 минут. Вчера было раза 3 такое, сегодня все тихо.

Гость
проходил мимо

Re: FreeBSD softrouter (netstat errs input) + непонятный тра

Непрочитанное сообщение Гость » 2010-12-10 10:37:31

у вас десять пятниц на неделю
вы описывали
Вчера первый шлюз стал загибаться, процессы rx_kthread стали взлетать до 100%, тем самым съедать весь процессор.
сечас рассказываете что все нормально

кто мешает сечас взять и прогрузить сетевки? благо дело утилит полно
и в том топике тоже есть
прогрузить одно
прогрузить другое
проверить, промерить
растюнить, затюнить
и вывести логику
причина найдена

нет ничего проще

потому что операции лучше проводить в клинике
а не через интернет консультруясь где резать и что делать дальше

намёк надеюсь понят

nerik
рядовой
Сообщения: 12
Зарегистрирован: 2010-01-19 13:58:48

Re: FreeBSD softrouter (netstat errs input) + непонятный тра

Непрочитанное сообщение nerik » 2010-12-10 10:47:51

Отключил)

Код: Выделить всё

       72K     0        48M        69K     0        47M     0
       67K     0        44M        64K     0        44M     0
       66K     0        43M        64K     0        42M     0
       70K     0        45M        68K     0        45M     0
       91K     0        57M        89K     0        56M     0
      100K     0        64M        97K     0        64M     0
      100K     0        66M        99K     0        65M     0
      100K     0        65M        98K     0        65M     0
      107K     0        71M       105K     0        71M     0
      109K     0        74M       107K     0        74M     0
      111K     0        75M       109K     0        75M     0
      111K     0        74M       109K     0        74M     0
Как видно, сервер может грузить в два раза больше трафика и более. kthread стали есть с 25 до 84%. Ошибок нет. Вчера же была аномалия при 70K пакетах.

nerik
рядовой
Сообщения: 12
Зарегистрирован: 2010-01-19 13:58:48

Re: FreeBSD softrouter (netstat errs input) + непонятный тра

Непрочитанное сообщение nerik » 2010-12-10 10:48:43

137K 0 97M 135K 0 97M 0
137K 0 97M 135K 0 96M 0
132K 0 92M 130K 0 92M 0

В данный момент.

nerik
рядовой
Сообщения: 12
Зарегистрирован: 2010-01-19 13:58:48

Re: FreeBSD softrouter (netstat errs input) + непонятный тра

Непрочитанное сообщение nerik » 2010-12-10 10:55:39

Вернул обратно второй шлюз и возвращаюсь к моему вопросу. Что же может грузануть сетевки, чтобы процесс kthread взлетел до 100% и были большие ошибки с падением большого количества пакетов? Спасибо.

Гость
проходил мимо

Re: FreeBSD softrouter (netstat errs input) + непонятный тра

Непрочитанное сообщение Гость » 2010-12-10 11:12:46

самый большой дуговой разряд на солнце был вчера
сегодня помоему уже разрядился и движется магнитная буря

то о чем я говорил вы так и не уловили, жаль
ну тогда сидите и мониторте когда у вас опять сетевки загнутся

вот у человеков иногда болит голова
может раз за всю жизнь, может два
и медицина безсильна
само проходит

nerik
рядовой
Сообщения: 12
Зарегистрирован: 2010-01-19 13:58:48

Re: FreeBSD softrouter (netstat errs input) + непонятный тра

Непрочитанное сообщение nerik » 2010-12-10 12:01:39

Ладно спасибо и на этом.
То что вы говорили я уловил, и если бы сам нашел ответ, то не писал бы тут.
Да и меня вы не понимаете, говорите одно, когда речь идет о другом.