Страница 1 из 1

Panic и ... thunderbird

Добавлено: 2017-02-21 6:32:12
als
Мое почтение, коллегам.
Столкнулся с одной ситуацией. Решил описать, может кому пригодится.

Стоит Freebsd. Так как ситуация длится уже достаточно давно, то была 10 версия, сейчас 11.
Сервер небольшой компании - контролер домена Samba, файловое хранилища, почтовый сервер. В качестве почтового протокола используется IMAP.
На клиентах в качестве почтового клиента используется thunderbird. Папка хранения профиля на сервере.
Периодически, когда-то чаще, когда-то раз в месяц, сервере перегружается. Пока это было раз в месяц, это терпели. Стало чаще, стал думать, что же найти.
Настроил сборку информации crash.
Насобирал причины. Она одна - Panic String: ffs_blkfree_cg: freeing free block
В системе работает рейд массив на intel и два жестких диска на sata.
Сделал smart - выяснил, что одному диску не очень хорошо. Заменил - перегрузки прошли. Порадовался :)
Через какое-то время снова начались.
Пока не нарастало, особо поймать не мог. А неделю назад наросло. Причем каждый полчаса началось. Естественно, после загрузки делал fsck :)

Стал ловить. В качестве причины стала попадаться запись "Panic String: ufs_dirbad: /hdd2: bad dir ino 11959070 at offset 3584: mangled entry"
А это как раз диск почтовых профилей thunderbird.
Перенес почтовые профили на другой диск - этот диск стал высвечиваться в ошибках. Я понимаю, идет аварийное выключение сервера, почта у пользователей открыта. Но как-то странно, на мой взгляд появление этого диска в причинах. Никакого другого, а именно диска с почтой.

Почтовый каталог IMAP у thunderbird выглядит более, чем странно. Меня от таких названий папок и файлов оторопь берет. Например, &BBAEPQQzBDsEOAQ5BEEEOgQ4BDk- &BE8ENwRLBDo- &BDd1d0c9ed
Жутко выглядит :)
Но ведь работает :)

В итоге принял решение перенести каталоги IMAP пользователей с сервера на локальные машины. Прошелся по компам, настроил. И в одном профиле обнаружил, что есть две папки Удалить. Ссылаются они (через свойства папки - адрес) как будто на разные места.
Пока работал с этим профилем - сервер ушел в перезагрузку :shock:

В итоге перенес папки IMAP на локальные каталоги, перегрузки ушли.

Panic и ... thunderbird

Добавлено: 2017-05-12 7:37:42
als
Продолжаю наблюдать, как thunderbird валит сервер :)

На самбе остались почтовые профиля. Раз в месяц сервер бросается на перегрузку. Наловчился лечить так. После поднятия быстренько отключаю раздел с профилями (у меня лежит на отдельном разделе). Если быстро не сделать, скорее всего снова уйдет в перегрузку.
Делаю ему fsck
После этого подключаю и снова работает какое-то время :)

Чего же он там такого делает?

Panic и ... thunderbird

Добавлено: 2017-05-12 13:29:15
guest
als писал(а):Продолжаю наблюдать, как thunderbird валит сервер :)

На самбе остались почтовые профиля. Раз в месяц сервер бросается на перегрузку. Наловчился лечить так. После поднятия быстренько отключаю раздел с профилями (у меня лежит на отдельном разделе). Если быстро не сделать, скорее всего снова уйдет в перегрузку.
Делаю ему fsck
После этого подключаю и снова работает какое-то время :)

Чего же он там такого делает?
много чего делает.

/hdd2 - это у Вас имя файловой системы?
как она создана: что показывает mount и dumpfs -m

FS побилась, и продолжает убиваться, битые иноды - о чем и сообщается, отсюда и вопросы:
- как создана FS (в каком релизе создавалась)?
- что показывает df?
- хранилище для thunderbird на рейде? если да что за рейд?
- smartctl short/long как проходят?
- dd на чтение как проходит?
- наличие backplane?

прим: Вы на данное железо изначально какой релиз ставили? Затем пошли проблемы с FS, затем апгрейдили...
профукали сбои HDD в рейде и тд и тп.

Panic и ... thunderbird

Добавлено: 2017-05-19 7:05:07
als
undefined писал(а): /hdd2 - это у Вас имя файловой системы?
Это имя точки монтирование.
Сам диск /dev/ada0p5
undefined писал(а): как она создана: что показывает mount и dumpfs -m
mount

Код: Выделить всё

/dev/ada0p5 on /hdd2 (ufs, local, journaled soft-updates, nfsv4acls)
dumpfs -m

Код: Выделить всё

newfs -O 2 -a 4 -b 32768 -d 32768 -e 4096 -f 4096 -g 16384 -h 64 -i 8192 -k 6408 -m 8 -o time -s 976252264 /dev/ada0p5
Вчера был очередной приступ падения.
Решил отключить soft-updates на этом разделе
Теперь mount

Код: Выделить всё

/dev/ada0p5 on /hdd2 (ufs, local, nfsv4acls)
Отправлено спустя 7 минут 49 секунд:
undefined писал(а): как создана FS (в каком релизе создавалась)?
Создавалась достаточно давно. Релиз уже и не скажу. Наверное 9.
undefined писал(а): хранилище для thunderbird на рейде? если да что за рейд?
Нет, это партиция на SATA диске.
Пробовал переносить каталог почты (который только и лежит на этой партиции) на рейд. Рейд уровня 10, intel.
Падения не исчезали. Почему и сделал вывод, что что-то сам Thunderbird делает с каталогом такое, что вызывает падение.
undefined писал(а): smartctl short/long как проходят?
Проходит штатно. Ничего подозрительно не замечено.
Делаю тест регулярно, раз в пару месяцев.
undefined писал(а): dd на чтение как проходит?
Не пробовал.
undefined писал(а): наличие backplane?
Отсутствует.
undefined писал(а): Вы на данное железо изначально какой релиз ставили?
Сам сервер старый, 2007г. выпуска. Какой тогда релиз был? Вроде 4 должна была быть. Все эти годы релизы ОС на нем менялись. Проблемный раздел появился примерно два года назад.

Panic и ... thunderbird

Добавлено: 2017-05-19 8:38:43
guest
als писал(а):
undefined писал(а): /hdd2 - это у Вас имя файловой системы?
Это имя точки монтирование.
Сам диск /dev/ada0p5
undefined писал(а): как она создана: что показывает mount и dumpfs -m
mount

Код: Выделить всё

/dev/ada0p5 on /hdd2 (ufs, local, journaled soft-updates, nfsv4acls)
выше SUJ
dumpfs -m

Код: Выделить всё

newfs -O 2 -a 4 -b 32768 -d 32768 -e 4096 -f 4096 -g 16384 -h 64 -i 8192 -k 6408 -m 8 -o time -s 976252264 /dev/ada0p5
а тут отсутствуют -U и -j

Кто-то врет?
Вчера был очередной приступ падения.
Решил отключить soft-updates на этом разделе
Теперь mount

Код: Выделить всё

/dev/ada0p5 on /hdd2 (ufs, local, nfsv4acls)
Возможно, с SU проблем быть не должно, а вот с журналом "-j" - проблемы возможны.

Я бы пересоздал FS: newfs

Panic и ... thunderbird

Добавлено: 2017-05-19 16:42:13
als
Возможно возникла путаница.

До вчерашнего дня диск был с SUJ. Вчера вечером это отключил.

Создавал так. Сначала newfs, потом через tunefs включал SUJ
Может в этом проблема?

Попробую пересоздать fs без журнала.

Panic и ... thunderbird

Добавлено: 2017-05-19 18:45:02
guest
als писал(а):Возможно возникла путаница.

До вчерашнего дня диск был с SUJ. Вчера вечером это отключил.

Создавал так. Сначала newfs, потом через tunefs включал SUJ
Может в этом проблема?
нет, в этом проблемы нет, вопрос был для ориентации в каком релизе?

Между 9.2 и 9.3, если память не изменяет, для журнала в UFS2 была
вставлена большая коллекция патчей, из-за SUJ нельзя использовать
dump на живую и недавно в рассылке был задан вопрос:
"будут ли подвижки в этом плане"
Ответ неутешительный - нет, дальнейшего развития UFS2 не будет, и тем более с SUJ
ZFS - основная FS.

Соответственно в случае SUJ про dump -L - забыть.
Попробую пересоздать fs без журнала.
смысл в том, что у Вас плывет FS и влезают битые иноды, которые нужно clri'ить
битые иноды: fsdb и fsck не всегда помогает.

Проще сделать backup: tar,pax,rsync,cpio... но не dump/restore
и создать FS заново: newfs/tunefs, но без -j. SU(softupdates) по идее не должен
так влиять и затем из бекапа восстановить данные.

Panic и ... thunderbird

Добавлено: 2017-05-19 19:20:09
Neus
А перейти на ZFS никак нельзя?

Panic и ... thunderbird

Добавлено: 2017-05-19 20:09:19
snorlov
Можно еще попытаться заюзать gjournal, но zfs конечно лучше...

Panic и ... thunderbird

Добавлено: 2017-05-28 9:57:51
als
Neus, перейти можно. Это не основное раздел. Его вполне можно перекидывать.

Почитаю по ZFS. Видимо туда надо будет двигать. То, что теперь не падает и ошибки не лезут еще не говорит, что проблема решена.

Panic и ... thunderbird

Добавлено: 2017-05-28 19:39:36
snorlov
als писал(а):Neus, перейти можно. Это не основное раздел. Его вполне можно перекидывать.
Почитаю по ZFS. Видимо туда надо будет двигать. То, что теперь не падает и ошибки не лезут еще не говорит, что проблема решена.
баг мог быть в самом клиенте...

Panic и ... thunderbird

Добавлено: 2017-06-09 21:01:03
als
snorlov писал(а): баг мог быть в самом клиенте...
Это вряд ли. Падение наблюдается уже много месяцев. Сменилось много клиентов.