Главная страница


ru.linux

 
 - RU.LINUX ---------------------------------------------------------------------
 From : Andre Sidko                          2:4641/77      11 Apr 2007  11:20:20
 To : Oleg Drokin
 Subject : Re: lustre
 -------------------------------------------------------------------------------- 
 
                                  Hello Oleg.
 
 *** 10 Apr 07, Oleg Drokin wrote to Andre Sidko:
 
 *** snipping off
 
  AS>> Процесс монтирования зависает на n-ое время до (manualy break), в
  AS>> это время в messages node2 (mds) вот что:
  OD>
  OD> Это у тебя SELinux не дает люстровому акцептору по сети пообщаться,
  OD> вот и не выходит ничего.
 
     Привет.
 
 selinux я на всех машинах остановил. добавив в grub.conf
 
 elevator=deadline selinux=0 (на счет elevator прочитал в документации они
 советуют использовать deadline Правильно?)
 
 Провпгрейдился до версии 1.4.10 (думал, что может быть это баг версии 1.4.9.1),
 но все равно процесс монтирования "вешается" на стадии:
 
 *** snipping off
 [root@node3 src]# lconf --node node3 /etc/lustre/config.xml
 MDC: MDC_node3_mds1_MNT_node3 7b06e_MNT_node3_c07f6c8069 mds1_UUID
 MDC: MDC_node3_mds1_MNT_node3 7b06e_MNT_node3_c07f6c8069
 MTPT: MNT_node3 MNT_node3_UUID /mnt/node mds1_UUID lov1_UUID
 
 В это время в messages на клиенте пишется вот что:
 
 *** snipping off
 Apr 11 12:14:23 node3 kernel: LustreError:
 4199:0:(client.c:947:ptlrpc_expire_one_request()) @@@ timeout (sent at
 1176282858, 5s ago)  req@ced4f200 x24/t0 o38->mds1_UUID@node2_UUID:12 lens
 240/272 ref 1 fl Rpc:/0/0 rc 0/0
 Apr 11 12:14:23 node3 kernel: LustreError:
 4199:0:(client.c:947:ptlrpc_expire_one_request()) Skipped 2 previous similar
 messages
 
 А там же но на mds
 вот что:
 
 *** snipping off
 Apr 11 12:01:42 node2 kernel: SCSI device sdc: 419430 512-byte hdwr sectors
 (215 MB)
 Apr 11 12:01:42 node2 kernel: sdc: asking for cache data failed
 Apr 11 12:01:42 node2 kernel: sdc: assuming drive cache: write through
 Apr 11 12:01:42 node2 kernel:  sdc:
 Apr 11 12:01:44 node2 kernel: SCSI device sdc: 419430 512-byte hdwr sectors
 (215 MB)
 Apr 11 12:01:44 node2 kernel: sdc: asking for cache data failed
 Apr 11 12:01:44 node2 kernel: sdc: assuming drive cache: write through
 Apr 11 12:01:44 node2 kernel:  sdc:
 Apr 11 12:03:27 node2 kernel: Lustre: Acceptor stopping
 Apr 11 12:03:29 node2 kernel: Lustre: Removed LNI 192.168.232.130@tcp
 Apr 11 12:04:58 node2 kernel: Lustre:
 5265:0:(module.c:382:init_libcfs_module()) maximum lustre stack 8192
 Apr 11 12:04:59 node2 kernel: Lustre: OBD class driver Build Version:
 1.4.10-19691231170000-PRISTINE-.testsuite.tmp.lbuild-boulder.lbuild-v1_4_10_RC2-
 2.6-rhel4-i686.lbuild.BU
 ILD.lustre-kernel-2.6.9.lustre.linux-2.6.9-42.0.10.EL_lustre.1.4.10smp,
 info@clusterfs.com
 Apr 11 12:05:00 node2 kernel: Lustre: Added LNI 192.168.232.130@tcp [8/256]
 Apr 11 12:05:00 node2 kernel: Lustre: Accept secure, port 988
 Apr 11 12:08:51 node2 kernel: Lustre: Binding irq 185 to CPU 1 with cmd: echo 2
 
 > /proc/irq/185/smp_affinity
 
 Apr 11 12:08:51 node2 kernel: Lustre: 5328:0:(lib-move.c:1644:lnet_parse_put())
 Dropping PUT from 12345-192.168.232.132@tcp portal 12 match 11 offset 0 length
 240: 2
 Apr 11 12:09:25 node2 kernel: Lustre: 5328:0:(lib-move.c:1644:lnet_parse_put())
 Dropping PUT from 12345-192.168.232.132@tcp portal 12 match 13 offset 0 length
 240: 2
 Apr 11 12:09:51 node2 kernel: Lustre: 5328:0:(lib-move.c:1644:lnet_parse_put())
 Dropping PUT from 12345-192.168.232.132@tcp portal 12 match 14 offset 0 length
 240: 2
 Apr 11 12:09:56 node2 dhclient: DHCPREQUEST on eth0 to 192.168.232.254 port 67
 Apr 11 12:09:57 node2 dhclient: DHCPACK from 192.168.232.254
 Apr 11 12:09:59 node2 dhclient: bound to 192.168.232.130 -- renewal in 797
 seconds.
 Apr 11 12:10:01 node2 crond(pam_unix)[5413]: session opened for user root by
 (uid=0)
 Apr 11 12:10:08 node2 crond(pam_unix)[5413]: session closed for user root
 Apr 11 12:10:18 node2 kernel: Lustre: 5328:0:(lib-move.c:1644:lnet_parse_put())
 Dropping PUT from 12345-192.168.232.132@tcp portal 12 match 15 offset 0 length
 240: 2
 Apr 11 12:10:41 node2 kernel: Lustre: 5328:0:(lib-move.c:1644:lnet_parse_put())
 Dropping PUT from 12345-192.168.232.132@tcp portal 12 match 21 offset 0 length
 240: 2
 ............. etc
     Объясни, please, что означают следующие строки:
 Apr 11 12:01:42 node2 kernel: SCSI device sdc: 419430 512-byte hdwr sectors
 (215 MB)
 
 >Apr 11 12:01:42 node2 kernel: sdc: asking for cache data failed
 
 Каким образом я могу включить кеш?
 
 Apr 11 12:01:42 node2 kernel: sdc: assuming drive cache: write through
 Apr 11 12:01:42 node2 kernel:  sdc:
 Apr 11 12:01:44 node2 kernel: SCSI device sdc: 419430 512-byte hdwr sectors
 (215 MB)
 Apr 11 12:01:44 node2 kernel: sdc: asking for cache data failed
 Apr 11 12:01:44 node2 kernel: sdc: assuming drive cache: write through
 Apr 11 12:01:44 node2 kernel:  sdc:
 
 >Apr 11 12:03:27 node2 kernel: Lustre: Acceptor stopping
 
     А вот это как я понимаю, если акцептор остановлен, то соотвественно никакие
 запросы просто не обрабатываются.
 
 >Apr 11 12:03:29 node2 kernel: Lustre: Removed LNI 192.168.232.130@tcp
 
 Что это означает? Что такое LNI?
 
 >Apr 11 12:04:58 node2 kernel: Lustre:
 >5265:0:(module.c:382:init_libcfs_module()) maximum lustre stack 8192
 
     А вот такая запись мне выводится при старте oss тоже.
 
 Apr 11 12:04:59 node2 kernel: Lustre: OBD class driver Build Version:
 1.4.10-19691231170000-PRISTINE-.testsuite.tmp.lbuild-boulder.lbuild-v1_4_10_RC2-
 2.6-rhel4-i686.lbuild.BU
 ILD.lustre-kernel-2.6.9.lustre.linux-2.6.9-42.0.10.EL_lustre.1.4.10smp,
 info@clusterfs.com
 Apr 11 12:05:00 node2 kernel: Lustre: Added LNI 192.168.232.130@tcp [8/256]
 
 >Apr 11 12:05:00 node2 kernel: Lustre: Accept secure, port 988
 
     И вот здесь немного не понятно. Если 'Acceptor stopping' то тогда каким
 образом открывается 988 порт и ожидает secure конекты (ssl)?
 
 Apr 11 12:08:51 node2 kernel: Lustre: Binding irq 185 to CPU 1 with cmd: echo 2
 
 >
 
 /proc/irq/185/smp_affinity
 
     Причем selinux я остановил, но тот же результат.
   Registered Linux User #347376
   UIN 21089807
                                                         truly your, Andre.
 --- GoldED+/LNX 1.1.5-31012
  * Origin: Andre M. Sidko (2:4641/77)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 lustre   Andre Sidko   03 Apr 2007 12:36:40 
 Re: lustre   Oleg Drokin   04 Apr 2007 11:48:57 
 Re: lustre   Andre Sidko   06 Apr 2007 09:23:54 
 Re: lustre   Oleg Drokin   06 Apr 2007 15:48:38 
 Re: lustre   Andre Sidko   07 Apr 2007 21:05:04 
 Re: lustre   Oleg Drokin   08 Apr 2007 02:17:07 
 Re: lustre   Andre Sidko   08 Apr 2007 22:25:50 
 Re: lustre   Oleg Drokin   09 Apr 2007 11:07:50 
 Re: lustre   Andre Sidko   09 Apr 2007 12:20:14 
 Re: lustre   Oleg Drokin   09 Apr 2007 19:14:04 
 Re: lustre   Andre Sidko   10 Apr 2007 08:59:44 
 Re: lustre   Andre Sidko   09 Apr 2007 18:42:50 
 Re: lustre   Oleg Drokin   10 Apr 2007 16:49:08 
 Re: lustre   Alex Korchmar   10 Apr 2007 21:34:02 
 Re: lustre   Oleg Drokin   10 Apr 2007 23:48:40 
 Re: lustre   Alex Korchmar   11 Apr 2007 14:43:34 
 Re: lustre   Andre Sidko   11 Apr 2007 14:55:00 
 Re: lustre   Alex Korchmar   11 Apr 2007 20:25:45 
 Re: lustre   Andre Sidko   11 Apr 2007 11:20:20 
 Re: lustre   Oleg Drokin   14 Apr 2007 01:36:07 
Архивное /ru.linux/1884461caeb0.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional