|
|
ru.unix.bsd- RU.UNIX.BSD ------------------------------------------------------------------ From : Victor Sudakov 2:5020/400 07 Dec 2007 07:39:31 To : Eugene Grosbein Subject : Re: спонтанные перезагрузки -------------------------------------------------------------------------------- Eugene Grosbein wrote: > VS>>> Что посоветуете? О чем могут свидетельствовать SIGBUS и SIGSEGV? > >>> Собственно, проблемы с железом. > VS>> Проблем с железом не найдено. Смотрел опытный железячник. > >> Hе гарантия. > VS> Понятно что не гарантия, но и формулировка "проблемы с железом" - не > VS> ответ. > Это направление поисков. Усиленных. Усиленные поиски ничего не дали. Осталась только по очереди заменять всё железо, надеясь что поможет. > >>> Ты не упомянул крешдампы - включены? Создаются? > VS>> Hекуда. Там 128 метров свопа при 512 метрах ОЗУ. > VS>> Есть ли смысл втыкать доп. винт для крешдампов - ведь ничего похожего > VS>> на kernel panic мы не наблюдаем. > >> Может, просто не успеваешь. > VS> Что не успеваю? Я пишу лог с serial console падающей машины на > VS> соседнюю машину, фрагмент такого лога и показал. > KDB/KDB_TRACE/KDB_UNATTENDED в ядре есть? Последнее, кстати, > можно и выкинуть, если простой ради выяснения допустИм. Hет. Hо после одной из перезагрузок удалось таки увидеть панику: Dec 7 03:30:03 techno /kernel: pid 11057 (traf), uid 1007: exited on signal 11 (core dumped) Dec 7 05:00:00 syslogd: /var/log/console.log: No such file or directory Fatal double fault: eip = 0xc02485a8 esp = 0xd709b000 ebp = 0xd709b02c panic: double fault syncing disks... 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 giving up on 21 buffers > >> Минидампы попробуй. > VS> ман что? > sysctl debug.minidump=1, в семерке по дефолту. это 4.11, там такого нет. > Откуда должно быть известно, какие способы тебе доступны :-) > Может, доступно только посмотреть на корпус, а может > прозванивали дорожки на платах. Как бы там ни было, советы открыть корпус и поискать вздувшиеся конденсаторы - это несколько не тот уровень. > VS>> Я думаю, имеет место нечто менее очевидное. > >> Возможно, но пока подозрение именно на железо, > >> поскольку ты ничего не говорил об изменениях > >> в системном/прикладном софте и в нагрузке - предполагаю, > >> что ничего этого не было - значит таки железо. > VS> По логике так, а на деле что делать - непонятно. > VS> Кроме замены всего сервера целиком. > VS> Всё-таки SIGBUS и SIGSEGV в совершенно безобидных процессах говорят > VS> нам о чём-то? > Говорит о железных проблемах, в первую очередь про память. Память сегодня утром заменили, посмотрим что получится. -- Victor Sudakov, VAS4-RIPE, VAS47-RIPN 2:5005/49@fidonet http://vas.tomsk.ru/ --- ifmail v.2.15dev5.4 * Origin: AO "Svyaztransneft", SibPTUS (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.unix.bsd/314183d6672f0.html, оценка из 5, голосов 10
|