Главная страница


ru.linux

 
 - RU.LINUX ---------------------------------------------------------------------
 From : Ivan Kuznetsov                       2:5020/400     02 Mar 2005  16:44:38
 To : Dmitry Davletbaev
 Subject : Re: Вопрос по RAID
 -------------------------------------------------------------------------------- 
 
   Привет, Дмитрий!
 
 Dmitry Davletbaev wrote:
 
  >>Аварию моделировал путем выдергивания одного диска (диски - в hot swap
  >>корзине) на нагруженном сервере. Привело к массивной ругани в syslog и
  >>подтормаживанию массива (начался Rebuild на резервный диск); сервер
  >>продолжал работать.
  > Я тоже так проверял. Hаши Promis-ы так же себя ведут. Так что подобная
  > проверка - ещё не факт высокой отказоустойчивости.
 
 Давай попробуем придумать возможные типы отказов дисков:
 
 1. "Полный п@%&#ц" - диск перестал обнаруживаться после очередной 
 перезагрузки. Отказ служебных зон поверхности, шпинделя, головок 
 чтения-записи или электроники. Модельный вариант, IMHO проверили :)
 
 2. Повисание диска во время работы. См. п.1
 
 3. "Бэды" - появились нечитаемые сектора. Обычно диск выдает ошибку 
 чтения (Uncorrectable CRC error). Обнаруживаемо и обрабатываемо 
 контроллером. Hе проверял сам (жалко диск убивать), но уверен, что 
 проверялось Intel'ом. Скорее всего, контроллер выдаст тревогу при 
 натыкании на плохой сектор или при периодической проверке (если 
 включена). LSI MegaRAID именно так себя и ведет.
 
 По моей практике, >90% отказов дисков укладываются в эти варианты. Если 
 одновременно портится только один диск, то RAID5 продолжает работать. 
 Если сисадмин - расп$%^&й, не обращает внимания на ругань контроллера, 
 не имеет диска горячего резерва и доводит дело до отказа второго диска 
 (и массива в целом), то это к врачу... Если сисадмин включает на 
 контроллере кэш записи, при этом батарейка кэша села, а ИБП отсутствует, 
 то это тоже к врачу
 
 Если бояться отказа самого контроллера, то нужно думать о кластере 
 серверов или применении SAN'а.
 
 --
 WBR, Иван Кузнецов
 
 --- ifmail v.2.15dev5.3
  * Origin: SOLVO ltd (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 =?koi8-r?Q?=F7=CF=D0=D2=CF=D3_=D0=CF?= RAID   Dmitry Davletbaev   24 Feb 2005 13:11:26 
 Re: Вопрос по RAID   Sergey_Afonin   24 Feb 2005 12:08:24 
 Re: =?koi8-r?Q?=F7=CF=D0=D2=CF=D3_=D0=CF?= RAID   Dmitry Davletbaev   24 Feb 2005 16:15:09 
 Re: Вопрос по RAID   Ivan Kuznetsov   25 Feb 2005 20:03:11 
 Re: =?koi8-r?Q?=F7=CF=D0=D2=CF=D3_=D0=CF?= RAID   Dmitry Davletbaev   01 Mar 2005 11:11:06 
 Re: Вопрос по RAID   Ivan Kuznetsov   01 Mar 2005 14:51:38 
 Re: =?koi8-r?Q?=F7=CF=D0=D2=CF=D3_=D0=CF?= RAID   Dmitry Davletbaev   02 Mar 2005 10:36:19 
 Re: Вопрос по RAID   Ivan Kuznetsov   02 Mar 2005 16:44:38 
 Re: Вопрос по RAID   Peter V. Chernikoff   26 Feb 2005 11:05:14 
 Re: Вопрос по RAID   Aleksey Barabanov   24 Feb 2005 13:57:49 
 Re: =?koi8-r?Q?=F7=CF=D0=D2=CF=D3_=D0=CF?= RAID   Dmitry Davletbaev   25 Feb 2005 14:15:38 
 Re: Вопрос по RAID   Aleksey Barabanov   25 Feb 2005 14:28:06 
 Re: Вопрос по RAID   Alex Korchmar   27 Feb 2005 13:51:17 
Архивное /ru.linux/2858682524ed.html, оценка 3 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional