|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Andre Sidko 2:4641/77 11 Apr 2007 11:20:20 To : Oleg Drokin Subject : Re: lustre --------------------------------------------------------------------------------
Hello Oleg.
*** 10 Apr 07, Oleg Drokin wrote to Andre Sidko:
*** snipping off
AS>> Процесс монтирования зависает на n-ое время до (manualy break), в
AS>> это время в messages node2 (mds) вот что:
OD>
OD> Это у тебя SELinux не дает люстровому акцептору по сети пообщаться,
OD> вот и не выходит ничего.
Привет.
selinux я на всех машинах остановил. добавив в grub.conf
elevator=deadline selinux=0 (на счет elevator прочитал в документации они
советуют использовать deadline Правильно?)
Провпгрейдился до версии 1.4.10 (думал, что может быть это баг версии 1.4.9.1),
но все равно процесс монтирования "вешается" на стадии:
*** snipping off
[root@node3 src]# lconf --node node3 /etc/lustre/config.xml
MDC: MDC_node3_mds1_MNT_node3 7b06e_MNT_node3_c07f6c8069 mds1_UUID
MDC: MDC_node3_mds1_MNT_node3 7b06e_MNT_node3_c07f6c8069
MTPT: MNT_node3 MNT_node3_UUID /mnt/node mds1_UUID lov1_UUID
В это время в messages на клиенте пишется вот что:
*** snipping off
Apr 11 12:14:23 node3 kernel: LustreError:
4199:0:(client.c:947:ptlrpc_expire_one_request()) @@@ timeout (sent at
1176282858, 5s ago) req@ced4f200 x24/t0 o38->mds1_UUID@node2_UUID:12 lens
240/272 ref 1 fl Rpc:/0/0 rc 0/0
Apr 11 12:14:23 node3 kernel: LustreError:
4199:0:(client.c:947:ptlrpc_expire_one_request()) Skipped 2 previous similar
messages
А там же но на mds
вот что:
*** snipping off
Apr 11 12:01:42 node2 kernel: SCSI device sdc: 419430 512-byte hdwr sectors
(215 MB)
Apr 11 12:01:42 node2 kernel: sdc: asking for cache data failed
Apr 11 12:01:42 node2 kernel: sdc: assuming drive cache: write through
Apr 11 12:01:42 node2 kernel: sdc:
Apr 11 12:01:44 node2 kernel: SCSI device sdc: 419430 512-byte hdwr sectors
(215 MB)
Apr 11 12:01:44 node2 kernel: sdc: asking for cache data failed
Apr 11 12:01:44 node2 kernel: sdc: assuming drive cache: write through
Apr 11 12:01:44 node2 kernel: sdc:
Apr 11 12:03:27 node2 kernel: Lustre: Acceptor stopping
Apr 11 12:03:29 node2 kernel: Lustre: Removed LNI 192.168.232.130@tcp
Apr 11 12:04:58 node2 kernel: Lustre:
5265:0:(module.c:382:init_libcfs_module()) maximum lustre stack 8192
Apr 11 12:04:59 node2 kernel: Lustre: OBD class driver Build Version:
1.4.10-19691231170000-PRISTINE-.testsuite.tmp.lbuild-boulder.lbuild-v1_4_10_RC2-
2.6-rhel4-i686.lbuild.BU
ILD.lustre-kernel-2.6.9.lustre.linux-2.6.9-42.0.10.EL_lustre.1.4.10smp,
info@clusterfs.com
Apr 11 12:05:00 node2 kernel: Lustre: Added LNI 192.168.232.130@tcp [8/256]
Apr 11 12:05:00 node2 kernel: Lustre: Accept secure, port 988
Apr 11 12:08:51 node2 kernel: Lustre: Binding irq 185 to CPU 1 with cmd: echo 2
> /proc/irq/185/smp_affinity
Apr 11 12:08:51 node2 kernel: Lustre: 5328:0:(lib-move.c:1644:lnet_parse_put())
Dropping PUT from 12345-192.168.232.132@tcp portal 12 match 11 offset 0 length
240: 2
Apr 11 12:09:25 node2 kernel: Lustre: 5328:0:(lib-move.c:1644:lnet_parse_put())
Dropping PUT from 12345-192.168.232.132@tcp portal 12 match 13 offset 0 length
240: 2
Apr 11 12:09:51 node2 kernel: Lustre: 5328:0:(lib-move.c:1644:lnet_parse_put())
Dropping PUT from 12345-192.168.232.132@tcp portal 12 match 14 offset 0 length
240: 2
Apr 11 12:09:56 node2 dhclient: DHCPREQUEST on eth0 to 192.168.232.254 port 67
Apr 11 12:09:57 node2 dhclient: DHCPACK from 192.168.232.254
Apr 11 12:09:59 node2 dhclient: bound to 192.168.232.130 -- renewal in 797
seconds.
Apr 11 12:10:01 node2 crond(pam_unix)[5413]: session opened for user root by
(uid=0)
Apr 11 12:10:08 node2 crond(pam_unix)[5413]: session closed for user root
Apr 11 12:10:18 node2 kernel: Lustre: 5328:0:(lib-move.c:1644:lnet_parse_put())
Dropping PUT from 12345-192.168.232.132@tcp portal 12 match 15 offset 0 length
240: 2
Apr 11 12:10:41 node2 kernel: Lustre: 5328:0:(lib-move.c:1644:lnet_parse_put())
Dropping PUT from 12345-192.168.232.132@tcp portal 12 match 21 offset 0 length
240: 2
............. etc
Объясни, please, что означают следующие строки:
Apr 11 12:01:42 node2 kernel: SCSI device sdc: 419430 512-byte hdwr sectors
(215 MB)
>Apr 11 12:01:42 node2 kernel: sdc: asking for cache data failed
Каким образом я могу включить кеш?
Apr 11 12:01:42 node2 kernel: sdc: assuming drive cache: write through
Apr 11 12:01:42 node2 kernel: sdc:
Apr 11 12:01:44 node2 kernel: SCSI device sdc: 419430 512-byte hdwr sectors
(215 MB)
Apr 11 12:01:44 node2 kernel: sdc: asking for cache data failed
Apr 11 12:01:44 node2 kernel: sdc: assuming drive cache: write through
Apr 11 12:01:44 node2 kernel: sdc:
>Apr 11 12:03:27 node2 kernel: Lustre: Acceptor stopping
А вот это как я понимаю, если акцептор остановлен, то соотвественно никакие
запросы просто не обрабатываются.
>Apr 11 12:03:29 node2 kernel: Lustre: Removed LNI 192.168.232.130@tcp
Что это означает? Что такое LNI?
>Apr 11 12:04:58 node2 kernel: Lustre:
>5265:0:(module.c:382:init_libcfs_module()) maximum lustre stack 8192
А вот такая запись мне выводится при старте oss тоже.
Apr 11 12:04:59 node2 kernel: Lustre: OBD class driver Build Version:
1.4.10-19691231170000-PRISTINE-.testsuite.tmp.lbuild-boulder.lbuild-v1_4_10_RC2-
2.6-rhel4-i686.lbuild.BU
ILD.lustre-kernel-2.6.9.lustre.linux-2.6.9-42.0.10.EL_lustre.1.4.10smp,
info@clusterfs.com
Apr 11 12:05:00 node2 kernel: Lustre: Added LNI 192.168.232.130@tcp [8/256]
>Apr 11 12:05:00 node2 kernel: Lustre: Accept secure, port 988
И вот здесь немного не понятно. Если 'Acceptor stopping' то тогда каким
образом открывается 988 порт и ожидает secure конекты (ssl)?
Apr 11 12:08:51 node2 kernel: Lustre: Binding irq 185 to CPU 1 with cmd: echo 2
>
/proc/irq/185/smp_affinity
Причем selinux я остановил, но тот же результат.
Registered Linux User #347376
UIN 21089807
truly your, Andre.
--- GoldED+/LNX 1.1.5-31012
* Origin: Andre M. Sidko (2:4641/77)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/1884461caeb0.html, оценка из 5, голосов 10
|