Главная страница


ru.unix.bsd

 
 - RU.UNIX.BSD ------------------------------------------------------------------
 From : Victor Sudakov                       2:5020/400     07 Dec 2007  07:39:31
 To : Eugene Grosbein
 Subject : Re: спонтанные перезагрузки
 -------------------------------------------------------------------------------- 
 
 Eugene Grosbein wrote:
 
 >  VS>>> Что посоветуете? О чем могут свидетельствовать SIGBUS и SIGSEGV?
 >  >>> Собственно, проблемы с железом.
 >  VS>> Проблем с железом не найдено. Смотрел опытный железячник.
 >  >> Hе гарантия.
 >  VS> Понятно что не гарантия, но и формулировка "проблемы с железом" - не
 >  VS> ответ.
 
 > Это направление поисков. Усиленных.
 
 Усиленные поиски ничего не дали. Осталась только по очереди заменять всё
 железо, надеясь что поможет.
 
 >  >>> Ты не упомянул крешдампы - включены? Создаются?
 >  VS>> Hекуда. Там 128 метров свопа при 512 метрах ОЗУ.
 >  VS>> Есть ли смысл втыкать доп. винт для крешдампов - ведь ничего похожего
 >  VS>> на kernel panic мы не наблюдаем.
 >  >> Может, просто не успеваешь. 
 >  VS> Что не успеваю? Я пишу лог с serial console падающей машины на
 >  VS> соседнюю машину, фрагмент такого лога и показал.
 
 > KDB/KDB_TRACE/KDB_UNATTENDED в ядре есть? Последнее, кстати,
 > можно и выкинуть, если простой ради выяснения допустИм.
 
 Hет. 
 
 Hо после одной из перезагрузок удалось таки увидеть панику:
 Dec  7 03:30:03 techno /kernel: pid 11057 (traf), uid 1007: exited on signal 11 
 (core dumped)
 Dec  7 05:00:00  syslogd: /var/log/console.log: No such file or directory
 
 Fatal double fault:
 eip = 0xc02485a8
 esp = 0xd709b000
 ebp = 0xd709b02c
 panic: double fault
 
 syncing disks... 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 
 giving up on 21 buffers
 >  >> Минидампы попробуй.
 >  VS> ман что?
 
 > sysctl debug.minidump=1, в семерке по дефолту.
 
 это 4.11, там такого нет.
 
 > Откуда должно быть известно, какие способы тебе доступны :-)
 > Может, доступно только посмотреть на корпус, а может
 > прозванивали дорожки на платах.
 
 Как бы там ни было, советы открыть корпус и поискать вздувшиеся
 конденсаторы - это несколько не тот уровень.
 
 >  VS>> Я думаю, имеет место нечто менее очевидное.
 >  >> Возможно, но пока подозрение именно на железо,
 >  >> поскольку ты ничего не говорил об изменениях
 >  >> в системном/прикладном софте и в нагрузке - предполагаю,
 >  >> что ничего этого не было - значит таки железо.
 >  VS> По логике так, а на деле что делать - непонятно.
 >  VS> Кроме замены всего сервера целиком.
 >  VS> Всё-таки SIGBUS и SIGSEGV в совершенно безобидных процессах говорят
 >  VS> нам о чём-то?
 
 > Говорит о железных проблемах, в первую очередь про память.
 
 Память сегодня утром заменили, посмотрим что получится.
 
 -- 
 Victor Sudakov,  VAS4-RIPE, VAS47-RIPN
 2:5005/49@fidonet http://vas.tomsk.ru/
 --- ifmail v.2.15dev5.4
  * Origin: AO "Svyaztransneft", SibPTUS (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re: спонтанные перезагрузки   Eugene Grosbein   07 Dec 2007 01:19:49 
 Re: спонтанные перезагрузки   Victor Sudakov   07 Dec 2007 07:39:31 
 спонтанные перезагрузки   Slawa Olhovchenkov   07 Dec 2007 11:19:40 
 Re: спонтанные перезагрузки   Victor Sudakov   07 Dec 2007 13:35:41 
Архивное /ru.unix.bsd/314183d6672f0.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional