Код: Выделить всё
# uname -a
Linux node01 2.6.32-12-pve #1 SMP Tue May 15 06:02:20 CEST 2012 x86_64 GNU/Linux
Код: Выделить всё
# cat /etc/drbd.d/global_common.conf
global { usage-count no; }
common { syncer { rate 30M; } }
Код: Выделить всё
# cat /etc/drbd.d/r0.res
resource r0 {
protocol C;
startup {
wfc-timeout 0; # non-zero might be dangerous
degr-wfc-timeout 60;
become-primary-on both;
}
net {
cram-hmac-alg sha1;
shared-secret "secretkey";
allow-two-primaries;
after-sb-0pri discard-zero-changes;
after-sb-1pri discard-secondary;
after-sb-2pri disconnect;
}
on node01 {
device /dev/drbd0;
disk /dev/sdb1;
address 10.0.0.1:7788;
meta-disk internal;
}
on node02 {
device /dev/drbd0;
disk /dev/sdb1;
address 10.0.0.2:7788;
meta-disk internal;
}
}
# cat /etc/drbd.d/r1.res
resource r1 {
protocol C;
startup {
wfc-timeout 0; # non-zero might be dangerous
degr-wfc-timeout 60;
become-primary-on both;
}
net {
cram-hmac-alg sha1;
shared-secret "sekretkey";
allow-two-primaries;
after-sb-0pri discard-zero-changes;
after-sb-1pri discard-secondary;
after-sb-2pri disconnect;
}
on node01 {
device /dev/drbd1;
disk /dev/sdb2;
address 10.0.0.1:7789;
meta-disk internal;
}
on node02 {
device /dev/drbd1;
disk /dev/sdb2;
address 10.0.0.2:7789;
meta-disk internal;
}
}
# cat /etc/drbd.d/r2.res
resource r2 {
protocol C;
startup {
wfc-timeout 0; # non-zero might be dangerous
degr-wfc-timeout 60;
become-primary-on both;
}
net {
cram-hmac-alg sha1;
shared-secret "secretkey";
allow-two-primaries;
after-sb-0pri discard-zero-changes;
after-sb-1pri discard-secondary;
after-sb-2pri disconnect;
}
on node01 {
device /dev/drbd2;
disk /dev/sdb3;
address 10.0.0.1:7790;
meta-disk internal;
}
on node02 {
device /dev/drbd2;
disk /dev/sdb3;
address 10.0.0.2:7790;
meta-disk internal;
}
}
# cat /etc/drbd.d/r4.res
resource r4 {
protocol C;
startup {
degr-wfc-timeout 60;
become-primary-on both;
}
net {
allow-two-primaries;
cram-hmac-alg sha1;
shared-secret secretkey;
after-sb-0pri discard-zero-changes;
after-sb-1pri discard-secondary;
}
on node01 {
device /dev/drbd4;
disk /dev/sdb5;
flexible-meta-disk internal;
address 10.0.0.1:7792;
}
on node02 {
device /dev/drbd4;
disk /dev/sdb5;
flexible-meta-disk internal;
address 10.0.0.2:7792;
}
}
# cat /etc/drbd.d/r5.res
resource r5 {
protocol C;
startup {
degr-wfc-timeout 60;
become-primary-on both;
}
net {
allow-two-primaries;
cram-hmac-alg sha1;
shared-secret secretkey;
after-sb-0pri discard-zero-changes;
after-sb-1pri discard-secondary;
}
on node01 {
device /dev/drbd5;
disk /dev/sdb6;
flexible-meta-disk internal;
address 10.0.0.1:7793;
}
on node02 {
device /dev/drbd5;
disk /dev/sdb6;
flexible-meta-disk internal;
address 10.0.0.2:7793;
}
}
Статусы drbd на первой ноде.
Код: Выделить всё
# cat /proc/drbd
version: 8.3.10 (api:88/proto:86-96)
GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by phil@fat-tyre, 2011-01-28 12:17:35
0: cs:Connected ro:Primary/Primary ds:UpToDate/UpToDate C r-----
ns:0 nr:594181789 dw:594181789 dr:1220 al:0 bm:9 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
1: cs:WFConnection ro:Secondary/Unknown ds:Diskless/DUnknown C r-----
ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
2: cs:WFConnection ro:Secondary/Unknown ds:Diskless/DUnknown C r-----
ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
4: cs:WFConnection ro:Secondary/Unknown ds:Diskless/DUnknown C r-----
ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
5: cs:Connected ro:Secondary/Primary ds:Diskless/UpToDate C r-----
ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
Код: Выделить всё
# lvmdiskscan
/dev/drbd0 [ 15.01 GiB] LVM physical volume
/dev/sda1 [ 511.00 MiB]
/dev/sda2 [ 278.38 GiB] LVM physical volume
/dev/sdb5 [ 90.01 GiB] LVM physical volume
/dev/sdb6 [ 32.01 GiB] LVM physical volume
0 disks
1 partition
0 LVM physical volume whole disks
4 LVM physical volumes
Статусы drbd на второй ноде.
Код: Выделить всё
# cat /proc/drbd
version: 8.3.10 (api:88/proto:86-96)
GIT-hash: 5c0b0469666682443d4785d90a2c603378f9017b build by phil@fat-tyre, 2011-01-28 12:17:35
0: cs:Connected ro:Primary/Primary ds:UpToDate/UpToDate C r-----
ns:599812394 nr:520200 dw:599815154 dr:71878857 al:133189 bm:169 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
1: cs:StandAlone ro:Primary/Unknown ds:Diskless/DUnknown r-----
ns:0 nr:5680272 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
2: cs:StandAlone ro:Primary/Unknown ds:Diskless/DUnknown r-----
ns:0 nr:5680284 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
4: cs:StandAlone ro:Primary/Unknown ds:Diskless/DUnknown r-----
ns:0 nr:5680272 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
5: cs:Connected ro:Primary/Secondary ds:UpToDate/Diskless C r-----
ns:5752220 nr:0 dw:36709712 dr:46502429 al:13357 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:11022116
Код: Выделить всё
# lvmdiskscan
/dev/drbd1: read failed after 0 of 4096 at 42959175680: Input/output error
/dev/drbd1: read failed after 0 of 4096 at 42959273984: Input/output error
/dev/drbd1: read failed after 0 of 4096 at 0: Input/output error
/dev/drbd1: read failed after 0 of 4096 at 4096: Input/output error
/dev/drbd2: read failed after 0 of 4096 at 42959175680: Input/output error
/dev/drbd2: read failed after 0 of 4096 at 42959273984: Input/output error
/dev/drbd2: read failed after 0 of 4096 at 0: Input/output error
/dev/drbd2: read failed after 0 of 4096 at 4096: Input/output error
/dev/drbd4: read failed after 0 of 4096 at 96643907584: Input/output error
/dev/drbd4: read failed after 0 of 4096 at 96644005888: Input/output error
/dev/drbd4: read failed after 0 of 4096 at 0: Input/output error
/dev/drbd4: read failed after 0 of 4096 at 4096: Input/output error
/dev/drbd0 [ 15.01 GiB] LVM physical volume
/dev/sda1 [ 511.00 MiB]
/dev/sda2 [ 278.38 GiB] LVM physical volume
/dev/drbd5 [ 32.00 GiB] LVM physical volume
/dev/sdb2 [ 40.01 GiB] LVM physical volume
/dev/sdb3 [ 40.01 GiB] LVM physical volume
/dev/sdb5 [ 90.01 GiB] LVM physical volume
/dev/sdb6 [ 32.01 GiB]
0 disks
2 partitions
0 LVM physical volume whole disks
6 LVM physical volumes
Стоит вопрос как восстановить локальные устройства хранения данных, нашел подобный рецепт:Если локальное устройство выходит из строя и включена маскировка ошибок, то устройство /dev/drbdX продолжает работать, получая данные через сеть. Этот режим называется Diskless.
Источник: http://ostail.ru/forum/viewtopic.php?f=7&t=1051. На активной ноде отмонтируем раздел:2. На пассивной нодеКод: Выделить всё
# umount /opt
2.1 Отключаем ресурс:2.2. Создаем заново блок мета-данныхКод: Выделить всё
# drbdadm down r0
2.3. Включаем ресурс:Код: Выделить всё
drbdadm create-md r0
он начинает синхронизироватьсяКод: Выделить всё
# drbdadm up r0
Пробовать пока боюсь Сервера живые.
Комрады подскажите пожалуйста как побороть недуг, буду рад и благодарен любым советам, наводкам и подсказкам.
PS: с кластеризацией столкнулся первый раз, если что то недопонимаю пока, сильно не пинайте