drbd и потерянные диски

Есть и такой ОС.

Модератор: weec

Правила форума
Убедительная просьба юзать теги [cоde] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
Аватара пользователя
Sun
прапорщик
Сообщения: 496
Зарегистрирован: 2008-07-14 18:27:14
Откуда: Красноярск
Контактная информация:

drbd и потерянные диски

Непрочитанное сообщение Sun » 2013-01-21 9:00:00

Доброго всем. Есть 2 сервера, на них настроено drbd, хозяйство досталось по наследству.

Код: Выделить всё

# uname -a
Linux node01 2.6.32-12-pve #1 SMP Tue May 15 06:02:20 CEST 2012 x86_64 GNU/Linux
Настройки DRBD.

Код: Выделить всё

# cat /etc/drbd.d/global_common.conf
global { usage-count no; }
common { syncer { rate 30M; } }
Насройка блочных устройств.

Код: Выделить всё

# cat /etc/drbd.d/r0.res
resource r0 {
     protocol C;
     startup {
             wfc-timeout 0; # non-zero might be dangerous
             degr-wfc-timeout 60;
             become-primary-on both;
     }
     net {
             cram-hmac-alg sha1;
             shared-secret "secretkey";
             allow-two-primaries;
             after-sb-0pri discard-zero-changes;
             after-sb-1pri discard-secondary;
             after-sb-2pri disconnect;
     }
     on node01 {
             device /dev/drbd0;
             disk /dev/sdb1;
             address 10.0.0.1:7788;
             meta-disk internal;
     }
     on node02 {
             device /dev/drbd0;
             disk /dev/sdb1;
             address 10.0.0.2:7788;
             meta-disk internal;
     }
}

# cat /etc/drbd.d/r1.res
resource r1 {
     protocol C;
     startup {
             wfc-timeout 0; # non-zero might be dangerous
             degr-wfc-timeout 60;
             become-primary-on both;
     }
     net {
             cram-hmac-alg sha1;
             shared-secret "sekretkey";
             allow-two-primaries;
             after-sb-0pri discard-zero-changes;
             after-sb-1pri discard-secondary;
             after-sb-2pri disconnect;
     }
     on node01 {
             device /dev/drbd1;
             disk /dev/sdb2;
             address 10.0.0.1:7789;
             meta-disk internal;
     }
     on node02 {
             device /dev/drbd1;
             disk /dev/sdb2;
             address 10.0.0.2:7789;
             meta-disk internal;
     }
}

# cat /etc/drbd.d/r2.res
resource r2 {
     protocol C;
     startup {
             wfc-timeout 0; # non-zero might be dangerous
             degr-wfc-timeout 60;
             become-primary-on both;
     }
     net {
             cram-hmac-alg sha1;
             shared-secret "secretkey";
             allow-two-primaries;
             after-sb-0pri discard-zero-changes;
             after-sb-1pri discard-secondary;
             after-sb-2pri disconnect;
     }
     on node01 {
             device /dev/drbd2;
             disk /dev/sdb3;
             address 10.0.0.1:7790;
             meta-disk internal;
     }
     on node02 {
             device /dev/drbd2;
             disk /dev/sdb3;
             address 10.0.0.2:7790;
             meta-disk internal;
     }
}

# cat /etc/drbd.d/r4.res
resource r4 {
        protocol        C;

        startup {
                degr-wfc-timeout        60;
                become-primary-on       both;
        }

        net {
                allow-two-primaries;
                cram-hmac-alg   sha1;
                shared-secret   secretkey;
                after-sb-0pri   discard-zero-changes;
                after-sb-1pri   discard-secondary;
        }

        on node01 {
                device          /dev/drbd4;
                disk            /dev/sdb5;
                flexible-meta-disk      internal;
                address         10.0.0.1:7792;
        }
        on node02 {
                device          /dev/drbd4;
                disk            /dev/sdb5;
                flexible-meta-disk      internal;
                address         10.0.0.2:7792;
        }
}

# cat /etc/drbd.d/r5.res
resource r5 {
        protocol        C;

        startup {
                degr-wfc-timeout        60;
                become-primary-on       both;
        }

        net {
                allow-two-primaries;
                cram-hmac-alg   sha1;
                shared-secret   secretkey;
                after-sb-0pri   discard-zero-changes;
                after-sb-1pri   discard-secondary;
        }

        on node01 {
                device          /dev/drbd5;
                disk            /dev/sdb6;
                flexible-meta-disk      internal;
                address         10.0.0.1:7793;
        }
        on node02 {
                device          /dev/drbd5;
                disk            /dev/sdb6;
                flexible-meta-disk      internal;
                address         10.0.0.2:7793;
        }
}
Нода1:
Статусы drbd на первой ноде.

Код: Выделить всё

# cat /proc/drbd
version: 8.3.10 (api:88/proto:86-96)
GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by phil@fat-tyre, 2011-01-28 12:17:35
 0: cs:Connected ro:Primary/Primary ds:UpToDate/UpToDate C r-----
    ns:0 nr:594181789 dw:594181789 dr:1220 al:0 bm:9 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
 1: cs:WFConnection ro:Secondary/Unknown ds:Diskless/DUnknown C r-----
    ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
 2: cs:WFConnection ro:Secondary/Unknown ds:Diskless/DUnknown C r-----
    ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0

 4: cs:WFConnection ro:Secondary/Unknown ds:Diskless/DUnknown C r-----
    ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
 5: cs:Connected ro:Secondary/Primary ds:Diskless/UpToDate C r-----
    ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
Смотрим физические тома на первой ноде.

Код: Выделить всё

# lvmdiskscan
  /dev/drbd0 [      15.01 GiB] LVM physical volume
  /dev/sda1  [     511.00 MiB]
  /dev/sda2  [     278.38 GiB] LVM physical volume
  /dev/sdb5  [      90.01 GiB] LVM physical volume
  /dev/sdb6  [      32.01 GiB] LVM physical volume
  0 disks
  1 partition
  0 LVM physical volume whole disks
  4 LVM physical volumes
Нода2:
Статусы drbd на второй ноде.

Код: Выделить всё

# cat /proc/drbd
version: 8.3.10 (api:88/proto:86-96)
GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by phil@fat-tyre, 2011-01-28 12:17:35
 0: cs:Connected ro:Primary/Primary ds:UpToDate/UpToDate C r-----
    ns:599812394 nr:520200 dw:599815154 dr:71878857 al:133189 bm:169 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
 1: cs:StandAlone ro:Primary/Unknown ds:Diskless/DUnknown   r-----
    ns:0 nr:5680272 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
 2: cs:StandAlone ro:Primary/Unknown ds:Diskless/DUnknown   r-----
    ns:0 nr:5680284 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0

 4: cs:StandAlone ro:Primary/Unknown ds:Diskless/DUnknown   r-----
    ns:0 nr:5680272 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
 5: cs:Connected ro:Primary/Secondary ds:UpToDate/Diskless C r-----
    ns:5752220 nr:0 dw:36709712 dr:46502429 al:13357 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:11022116
Физические тома на второй ноде:

Код: Выделить всё

# lvmdiskscan
  /dev/drbd1: read failed after 0 of 4096 at 42959175680: Input/output error
  /dev/drbd1: read failed after 0 of 4096 at 42959273984: Input/output error
  /dev/drbd1: read failed after 0 of 4096 at 0: Input/output error
  /dev/drbd1: read failed after 0 of 4096 at 4096: Input/output error
  /dev/drbd2: read failed after 0 of 4096 at 42959175680: Input/output error
  /dev/drbd2: read failed after 0 of 4096 at 42959273984: Input/output error
  /dev/drbd2: read failed after 0 of 4096 at 0: Input/output error
  /dev/drbd2: read failed after 0 of 4096 at 4096: Input/output error
  /dev/drbd4: read failed after 0 of 4096 at 96643907584: Input/output error
  /dev/drbd4: read failed after 0 of 4096 at 96644005888: Input/output error
  /dev/drbd4: read failed after 0 of 4096 at 0: Input/output error
  /dev/drbd4: read failed after 0 of 4096 at 4096: Input/output error
  /dev/drbd0 [      15.01 GiB] LVM physical volume
  /dev/sda1  [     511.00 MiB]
  /dev/sda2  [     278.38 GiB] LVM physical volume
  /dev/drbd5 [      32.00 GiB] LVM physical volume
  /dev/sdb2  [      40.01 GiB] LVM physical volume
  /dev/sdb3  [      40.01 GiB] LVM physical volume
  /dev/sdb5  [      90.01 GiB] LVM physical volume
  /dev/sdb6  [      32.01 GiB]
  0 disks
  2 partitions
  0 LVM physical volume whole disks
  6 LVM physical volumes
Со слов моего предшественника, все произошло из за отключения света. Ковыряния логов и гугла показывают что проблема находится на второй ноде. Ошибка diskless если верить вики связана с:
Если локальное устройство выходит из строя и включена маскировка ошибок, то устройство /dev/drbdX продолжает работать, получая данные через сеть. Этот режим называется Diskless.
Стоит вопрос как восстановить локальные устройства хранения данных, нашел подобный рецепт:
1. На активной ноде отмонтируем раздел:

Код: Выделить всё

# umount /opt
2. На пассивной ноде
2.1 Отключаем ресурс:

Код: Выделить всё

# drbdadm down r0
2.2. Создаем заново блок мета-данных

Код: Выделить всё

drbdadm create-md r0
2.3. Включаем ресурс:

Код: Выделить всё

# drbdadm up r0
он начинает синхронизироваться
Источник: http://ostail.ru/forum/viewtopic.php?f=7&t=105
Пробовать пока боюсь :) Сервера живые.
Комрады подскажите пожалуйста как побороть недуг, буду рад и благодарен любым советам, наводкам и подсказкам.

PS: с кластеризацией столкнулся первый раз, если что то недопонимаю пока, сильно не пинайте :)

Хостинговая компания Host-Food.ru
Хостинг HostFood.ru
 

Услуги хостинговой компании Host-Food.ru

Хостинг HostFood.ru

Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/

Аватара пользователя
Alex Keda
стреляли...
Сообщения: 35462
Зарегистрирован: 2004-10-18 14:25:19
Откуда: Made in USSR
Контактная информация:

Re: drbd и потерянные диски

Непрочитанное сообщение Alex Keda » 2013-06-17 9:48:01

это всё кривые линуксы =)
Убей их всех! Бог потом рассортирует...