|
|
ru.networks- RU.NETWORKS ------------------------------------------------------------------ From : Vadim Guchenko 2:5020/400 05 Oct 2004 18:06:46 To : All Subject : Лавинообразное подвисание свичей -------------------------------------------------------------------------------- Hello, All! Кампусная сеть строится на простых неуправляемых 8-16 портовых свичах 100 мегабит. Свичи могут глючить по следующим причинам: 1. При скачках напряжения, когда напряжение на доли секунды пропадает, а затем снова появляется, в результате чего свич не успевает корректно перезагрузиться. 2. При разрядах молнии вблизи свича или входящих в него медных кабелей. 3. При получении определенных ethernet-пакетов (глючного трафика) на одном или нескольких портах. 4. Свич частично неисправен (например, часть портов выбило прошедшей ранее грозой, оставшаяся часть работает с глюками). По времени действия глюки свичей можно разделить на: 1. Временные глюки. Могут возникнуть по любой причине, перечисленной выше (кроме пункта 4): скачки напряжения, разряды молнии, получение глючного трафика. Перезагрузка свича и устранение источника глючного трафика полностью устраняет глюки. 2. Постоянные глюки. Возникают в результате аппаратной поломки свича, например в результате грозы, когда часть портов выгорает. Другая часть портов работает с глюками. Перезагрузка свича не помогает, свич нужно заменять. Виды глюков могут быть следующими: 1. Свич полностью завис и не форвардит через себя никакой трафик. При этом он никак не мешает другим свичам в сети. 2. Свич частично завис. При этом часть или все порты форвардят трафик, но с потерями пакетов. Свич никак не мешает другим свичам в сети. 3. Свич становится источником глючного трафика. В результате начинают глючить другие свичи в сети. Если с первыми двумя пунктами все ясно, то для третьего у меня нет логического объяснения. Рассмотрим один ethernet-сегмент на неуправляемых свичах второго уровня. Предположим на краю сегмента заглючил свич - через него пакеты идут с потерями. Однако в это же самое время потери пакетов наблюдаются по всех других свичах во всем сегменте, даже на тех, которые расположены в другом конце сети. Т.е. глюк каким-то образом распространяется по всему сегменту по цепочке свичей. Бывают и более тяжелые ситуации. Hапример, свич заглючил с одного края сети. При этом вся сеть легла, т.к. глюк распространился по всему сегменту и подвесил _каждый_ свич в сегменте. В зависимости от модели (а перепробовали уйму всяких), свичи либо зависают совсем, либо временно подвисают. В любом случае лампочки на свичах перестают мигать (обычно просто горят непрерывно и изредко синхронно перемигивают) и трафик через свичи не проходит. Если отключить от сети свич, который является источником помех, то все оставшиеся свичи (за исключением клинических моделей) тут же сами развисают и начинают форвардить трафик. Подключаем снова глючный свич к сети - весь сегмент снова ложится. Hа клиентских компьютерах это выглядит так, что в сети кроме самого этого компьютера больше никого нет. И шлюз по умолчанию не доступен. Hепонятно что именно за трафик передается по цепочке и подвешивает все свичи. Если это некорректные ethernet-пакеты, свич должен их отбросить после получения из порта. Если пакеты корректные, то свич должен отфорвардить их в нужные выходные порты. В любом случае он же не должен подвисать? Hу максимум - должен заблокироваться порт, через который этот глючный трафик поступает. Hо другие-то порты причем? Или тут какую-то роль играет не содержимое пакетов, а pps? Идем далее. Для того, чтобы сократить масштабы распространения глюка в случае его возникновения, в сети в центре звезды был установлен управляемый 24-портовый 100-мегабитный свич второго уровня Allied Telesyn AT-8024. В нем было создано несколько Port-based VLAN'ов. Каждый влан подключен к отдельному ethernet-сегменту. В каждый влан приходят несколько клиентских линий и выходит одна линия к роутеру. Планировалось, что свич будет фильтровать глюк на любом из своих портов и не пропускать его в другие порты этого же сегмента/влана. А на деле оказалась все еще хуже: мало того, что глюк распространяется в другие порты, принадлежащие тому же самому влану, так он затрагивает _все_ вланы на свиче. При этом 24-й портовый свич _целиком_ подвисает со всеми своими вланами. И все его лампочки замирают. Стоит выдернуть из него линию с источником помех, свич сразу же оживает и начинает форвардить пакеты. Кто-нибудь сталкивался с таким и возможно исследовал проблему? Меня интересуют две вещи: что реально происходит в сети и вызывает такой лавинообразный глюк свичей и что можно поставить в качестве барьера этого глюка, чтобы прекратить его распространение от порта к порту и максимально уменьшить пострадавший участок сети? Может просто мне модель управляемого свича неудачная попалась, а свичи других фирм так себя не ведут? Или тут в чем-то другом дело? With best regards, Vadim Guchenko. E-mail: s0lver@kraslan.ru -- Отправлено через сервер Форумы@mail.ru - http://talk.mail.ru --- ifmail v.2.15dev5.3 * Origin: Talk.Mail.Ru (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.networks/64888a0a8c4c.html, оценка из 5, голосов 10
|