- Увеличение надежности систем оптической связи
- ЛИНЕЙНОЕ РЕЗЕРВИРОВАНИЕ
- Риски ЦОД: резервирование инженерных систем
- Отказоустойчивость и резервирование: что говорит мировой опыт?
- Неиссякаемая энергия
- Пути миграции тока
- Стало жарко
- ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Курец Д.С. — презентация
- Похожие презентации
- Презентация на тему: » ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Курец Д.С.» — Транскрипт:
Увеличение надежности систем оптической связи
Высокий уровень надежности современных сетей оптической связи обеспечивается реализацией комплекса различных мер.
Высокий уровень надежности современных сетей оптической связи обеспечивается реализацией комплекса различных мер, среди них одной из ключевых являются средства полного или хотя бы частичного восстановления связи в аварийных ситуациях. Традиционно для этого применялось резервирование — целенаправленное введение в систему определенной избыточности с целью увеличения степени связности отдельных ее узлов, то есть количества независимых путей передачи информации. В современных условиях доступны и другие подходы.
Волоконная оптика и оптоэлектроника находят широкое применение при построении всех уровней сетей электросвязи: магистральных линий междугородной и городской связи, сетей доступа и структурированных кабельных систем. Ввиду важности задач, решаемых с их помощью, к надежности предъявляются очень высокие требования. При этом под надежностью понимается способность поддерживать передачу информации с заданной скоростью и с заданной достоверностью в течение требуемого промежутка времени. Рассматриваемые далее варианты повышения надежности сети с привлечением резервирования неизбежно связаны с дополнительными затратами. Поскольку эта процедура может быть выполнена с помощью различных подходов, выбор наиболее эффективного способа — как с технической, так и с экономической точек зрения — приобретает исключительно важное прикладное значение.
ЛИНЕЙНОЕ РЕЗЕРВИРОВАНИЕ
Аварийные ситуации в линейной части сети в большинстве случаев возникают из-за механических повреждений (обрывов) оптического волокна, поэтому очевидным решением этой проблемы является увеличение количества доступных физических трактов передачи, на которые будет осуществляться переключение при возникновении неисправности. Технически это достигается наращиванием числа световодов свыше минимально необходимого значения. Данный прием получил название линейного резервирования.
В простейшем случае резервные волокна выделяются в том же кабеле, что и основные. Общая надежность сети существенно возрастает, если волокна основного и дополнительного трактов находятся в различных кабелях. Кроме того, эти кабели прокладываются по различным маршрутам для минимизации риска одновременного выхода из строя. Такое улучшение технических характеристик сети приводит к увеличению затрат на ее реализацию.
Линейное резервирование может быть организовано по схемам 1+1 и 1:1. При использовании первой схемы информация передается одновременно по основному и резервному трактам. На принимающей стороне выбирается сигнал с наилучшими качественными показателями. Обычно таковым считается тот из них, который имеет более высокий уровень, так как выбор между двумя сигналами с различной мощностью не представляет каких-либо технических проблем.
При обращении к схеме 1:1 (см. Рисунок 1) дополнительные цепи не несут полезной информации, но всегда готовы взять на себя ее передачу, то есть находятся в режиме горячего резерва. В качестве основного тракта обычно задействуется кратчайший маршрут или тракт с минимальным затуханием. Переключение на резерв осуществляется по аварийному сигналу, который система управления подает при полной потере связи или превышении предопределенного предела частоты появления битовых ошибок. Длительность переключения для сетей SDH не должна превышать 50 мс.
Рисунок 1. Схема работы участка сети с линейным резервированием по схеме 1:1: а) нормальный режим; б) режим использования резерва. |
После завершения ремонта поврежденного участка в большинстве случаев восстанавливается первоначальная конфигурация сети.
Кроме применения схемы 1:1 (100-процентное резервирование), допустима организация резервирования по схеме m:N, когда на N основных цепей передачи приходится m резервных. В случае m —>
Поделитесь материалом с коллегами и друзьями
Источник
Риски ЦОД: резервирование инженерных систем
Начинать чинить надо, пока не сломалось — сломанное поддаётся ремонту гораздо неохотней.
Юрий Татаркин После того как обеспечены надежные стены и крыша над головой для ЦОД (статья «Риски ЦОД: выбираем месторасположение»), следующим шагом на пути обеспечения его отказоустойчивости должно стать резервирование инженерных систем. Строя дата-центры более 10 лет, мы убедились, что не все заказчики в полной мере осознают важность дублирования основных коммуникаций. Космические корабли и те падают, а оборудование в ЦОД в идеале должно работать 365 дней в году и 24 часа в сутки. Любая вышедшая из строя или нуждающаяся в профилактике деталь должна быть заменена без остановки работы всех критичных сервисов.
Как справедливо отметили наши читатели, далеко не всем компаниям нужен надежный ЦОД. Для некоторых его бесперебойная работа не предмет переживаний, а многие предпочтут хранить свои данные в публичном облаке. Данный паблик предназначен в большей степени для тех, кто по тем или иным соображениям безопасности или проходимости каналов связи сделал свой выбор в пользу собственного дата-центра и работы сервисов с уровнем доступности не менее трех девяток (простоя не более 1,6 часов в год).
Отказоустойчивость и резервирование: что говорит мировой опыт?
Согласно стандартам Uptime Institute выделяют четыре уровня отказоустойчивости инфраструктуры ЦОДа:
Использование классификации Tier подразумевает, что все инженерные системы и компоненты ЦОД, вплоть до запаса топлива для дизель-генератора, воспринимаются как единое целое. Наличие хотя бы одного нерезервированного компонента приводит к снижению уровня отказоустойчивости и увеличению возможных часов простоя ЦОД. Количество таких компонентов, а также статистика по плановым и внеплановым отказам дата-центров в год влияют на допустимое время простоя. Например, для ЦОД уровня Tier I характерно внеплановое отключение 1,2 раза в год. Плюс, из-за отсутствия резервных систем дата-центр не будет работать еще два раза по двенадцать часов во время планового обслуживания. В итоге суммарное время простоя будет рассчитываться как: 12+12+4х1,2=28,8 часов.
Для расчета уровня отказоустойчивости в процентах нужно: ((t работы — t простоя )×100%)/ t работы, где
t работы – максимальное количество часов работы ЦОД в год (24 часа в сутки 365 дней в году).
t простоя – это время планового простоя ЦОД в год.
Классифицируя способы резервирования, принято выделять следующие схемы: N+1, 2N и 2(N+1). Применение схем N+1 и N+2 по сравнению с 2N дают значительную экономию бюджета и при неплохом уровне отказоустойчивости (разом все элементы системы вряд ли выйдут из строя). Однако, нужно помнить, что с ростом числа рабочих единиц (N), согласно теории вероятности, доступность системы ухудшается. В ситуации большого количества элементов (большого N, например, источников бесперебойного питания) уместнее использовать схему 2N, когда каждый компонент системы полностью задублирован. Это позволит в разы увеличить отказоустойчивость и снизить время простоя. В то же время, ни N+1, ни 2N не резервируют систему в целом, а потому не исключают опасность аварии на участке между зарезервированными элементами системы. Поэтому Tier IV рекомендует использовать 2 независимые схемы, каждая из которой полностью задублирована, 2(N+1).
Неиссякаемая энергия
Основой надежной работы ЦОД является электроснабжение: бесперебойное (источники бесперебойного питания – ИБП) и гарантированное (дизель-генераторные установки – ДГУ). В момент исчезновения напряжения городской сети ИБП должны поддержать питание оборудования до полного запуска ДГУ, который сможет обеспечить электроэнергией весь ЦОД.
Для того чтобы ЦОД не встал в отсутствии электроснабжения, крайне важно, во-первых, зарезервировать ИБП, а, во-вторых, проводить регулярные сервисные работы.
К каким рискам может привести наличие только одного ИБП – в целом понятно. В лучшем случае мы не сможем провести тестирование источника, в худшем – получим простой ЦОД. Но порой даже наличие нескольких ИБП не дает свободу действий. Так в одной организации источников в ЦОДе было два, но каждый питал только свою группу серверов, а не служил резервом друг для друга. При проведении технического обслуживания у сервис-инженера прихватило спину. Падая, он каким-то образом умудрился обесточить выход ИБП. И, по закону подлости, выключившийся в разгар рабочего дня источник обесточил группу серверов с наиболее критичными приложениями.
«Боевой» запуск дизель-генератора (ПБ) – проверка возможности запуска дизель-генератора в автоматическом режиме при пропадании внешней сети. Производится с помощью имитации полного отключения внешнего питания ЦОД. Время от отключения питания до запуска дизель-генератора серверное оборудование работает от батарей ИБП (обычно 1-3 минуты).
Запуск дизель-генератора под нагрузкой (ПН) – проверка способности дизель-генератора поддерживать питание подключенного к нему оборудования. Производится ручным переключением нагрузки на генератор (с помощью панели управления) после его запуска и выхода на нормальную работу. На время переключения АВР серверное оборудование работает от батарей ИБП (около 0,3-1 сек.). Кстати, для переключения нагрузки на ДГУ лучше использовать мотор-приводы, они хоть и работают медленнее, но срок службы и надежность у них выше.
Для предотвращения нежелательных простоев нужны регулярные комплексные сервисные работы. В одном из ЦОД проверки проводились только в отношении ДГУ. ИБП исправно показывал 10 минут автономии, но его никто не обслуживал. Возраст батарей к тому времени перевалил за 5 лет, и во время одного из боевых запусков они смогли проработать лишь 29 секунд. В то время как ДГУ завелась и смогла принять на себя нагрузку спустя только 33 секунды. Ко всему прочему, все оборудование было запитано от одного ИБП (от второго было решено отказаться еще на этапе реализации из-за бюджетных ограничений). В итоге – падение ЦОД. Полное восстановление всех вычислительных систем заняло около 12 часов.
Основные ошибки:
• Отказ на стадии реализации от второго ИБП. Трудные времена закончились, но второй ИБП так и не был приобретен.
• Отсутствие комплексного обслуживания всех инженерных систем ЦОД. При регулярном сервисном обслуживании ИБП об их неудовлетворительном состоянии стало бы известно заранее.
• Отсутствие регламентов планового обслуживания ЦОД и хаос при его эксплуатации.
Пути миграции тока
Ваши ИБП зарезервированы и вы регулярно их обслуживаете? Молодцы, но не вздумайте на этом останавливаться! Зарезервируйте еще и кабельные линии электроснабжения ЦОД, и установите 2 АВР, которые полностью резервируют друг друга. В идеале, они должны быть подключены к разным независимым электрощитам. В крайнем случае можно протянуть две линии и от одной щитовой, чтобы не получилось ситуации, как у одного из наших заказчиков.
При внедрении системы диспетчеризации в небольшой, но значимый ЦОД необходимо было поставить трансформаторы тока на основной ввод. Проблема была в том, что ввод был только один, а обесточить дата-центр было нельзя. После всех подготовительных работ питание было отключено. Пока оборудование ЦОД работало от батарей, монтажники трудились не покладая рук, а инженер, вытирая пот со лба, считал минуты на дисплее ИБП.
Основные ошибки:
• Система диспетчеризации была незаслуженно забыта при проектировании.
• Линия питания ЦОД не была зарезервирована.
Стало жарко
Система «чиллер-фанкойл» – система кондиционирования воздуха, в которой теплоносителем между центральной холодильной машиной (чиллером) и локальными теплообменниками (фанкойлами) служит охлажденная жидкость, циркулирующая под относительно низким давлением – обыкновенная вода (в тропическом климате) или водный раствор этиленгликоля (в умеренном и холодном климате).
Не стоит забывать и о резервировании систем кондиционирования. За последние два месяца довелось увидеть два проекта охлаждения ЦОД с использованием системы чиллер-фанкойл без резервирования трассы между чиллерами и сухими охладителями. Использование данного решения в реальной жизни с высокой долей вероятности приводит к простою ЦОД. В случае замены теплоносителя (что не редкость), только резервная трасса может сохранить работоспособность системы охлаждения, а значит и всего дата-центра.
Еще очень важный момент – разделение внешнего и внутреннего контуров охлаждения. Так в одном проекте на кровле седьмого этажа предлагалось установить два двухтонных чиллера, бак аккумулятор холода, мощную подкачивающую насосную станцию. Подача и обратка длиной двести метров была запланирована напрямую с крыши до блоков охлаждения в ЦОД, который находился в цоколе. В итоге, при даже небольшом прорыве трубы или неплотных соединениях внутренних блоков охлаждения все десять тонн этиленгликоля под давлением могли затопить ЦОД и электрощитовую заказчика.
Не забывайте о резервировании не только вычислительного оборудования, но и основных инженерных систем, и пусть ваш ЦОД работает вечно!
Источник
ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Курец Д.С. — презентация
Презентация была опубликована 6 лет назад пользователемРимма Выродова
Похожие презентации
Презентация на тему: » ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Курец Д.С.» — Транскрипт:
1 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Курец Д.С.
2 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Резервирование в технике связи в общем случае применяется в целях увеличения надежности функционирования сети. Наличие резервных трактов передачи информации дополнительно увеличивает гибкость кабельной системы. Резервирование всего комплекса технических средств структурированной проводки предусмотрено на уровне основных нормативных документов (стандарт ISO/IEC 11801:2002). 1
3 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Способы и системы переключения на резерв. Разработаны различные системы переключения на резерв для кабельных, волноводных и радиорелейных линий связи, отличающиеся функциональными особенностями, скоростью переключения и т.п. Системы переключения по способу резервирования подразделяются: — на системы переключения на резервный тракт; — системы переключения на обходные пути. 2
4 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ При создании сетей в ряде случаев применяют оба способа одновременно. Использование особенностей обеих систем переключения, взаимно дополняющих друг друга, способствует повышению надежности сетей передачи. Переключение на обходные пути применяется в том случае, когда возникает необходимость устранения повреждений нескольких линейных трактов, возникающих, например, из-за полного повреждения всех пар кабеля. 3
5 КЛАССИФИКАЦИЯ РЕГЛАМЕНТОВ ТЕХНИЧЕСКИХ ОСМОТРОВ При этом функции поврежденных ветвей сети и линейных трактов принимают на себя другие ветви сети и другие линейные тракты. Если применять переключение на обходные пути, то после завершения создания разветвленных сетей можно, пользуясь переключением на обходные пути, осуществлять управление загрузкой сети для усреднения трафика по обходным путям и по видам загрузки. 4
6 КЛАССИФИКАЦИЯ РЕГЛАМЕНТОВ ТЕХНИЧЕСКИХ ОСМОТРОВ На практике применяют три вида переключений: 1) автоматическое вышедший из строя рабочий тракт автоматически переключается на резервный; 2) ручное выполняется с пульта управления при выполнении технических проверок; 3) экспериментальное выполняется при проверке резервных трактов; 5
7 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ По результатам проведения исследований и проверок резервных трактов могут быть сделаны следующие выводы: 1) переключения на резерв следует выполнять в следующем порядке: автоматическое, ручное, экспериментальное ; 2) целесообразно производить переключение на резерв одновременно трактов прямого и обратного направления, даже если повреждение обнаружено только в одном из них; 6
8 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ 3) в целях уменьшения времени переключения собственно переключение необходимо начинать с параллельной передачи информации по рабочему и резервному трактам на передающем конце; 7
9 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Резервирование кабельных систем. Стандарт ISO/IEC : 2002 в явном виде допускает прокладку резервных кабелей в области магистральных подсистем только между техническими помещениями одного уровня. Какие-либо запреты на подключение к техническим помещениям более высокого уровня в этом и других нормативных документах отсутствуют, 8
10 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ поэтому задача увеличения надежности кабельной системы и сети в целом может быть решена двумя способами, каждый из которых может иметь два основных варианта, показанных на рис
11 КЛАССИФИКАЦИЯ РЕГЛАМЕНТОВ ТЕХНИЧЕСКИХ ОСМОТРОВ Первый способ не предполагает прохождения линейных кабелей через другие технические помещения (ТП). Это может быть как прямое увеличение емкости кабелей, соединяющих два различных технических помещения, так и прокладка резервных кабелей по пространственно-удаленным трассам, как показано на рис 2.2, а, б. 10
12 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ 11 Характерным отличительным признаком второго способа является ввод линейных кабелей, образующих тракт передачи сигнала, в одно или несколько дополнительных технических помещений. Варианты реализации в этом случае появляются из-за того, что резервный тракт может организовываться через техническое помещение того же уровня, что и один из связываемых узлов, или не заходить в него (рис. 2.2, в, г).
13 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Резервирование систем оптической связи. Высокий уровень надежности современных сетей оптической связи обеспечивается реализацией комплекса различных мер, среди которых ключевыми являются средства полного или частичного восстановления связи в аварийных ситуациях. 12
14 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Этим целям эффективно служит резервирование целенаправленное введение в систему определенной избыточности в целях увеличения степени связности отдельных ее узлов, т.е. количества независимых путей передачи информации. 13
15 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ Волоконная оптика и оптоэлектроника находят широкое применение при построении всех уровней сетей электросвязи: магистральных линий междугородной и городской связи, сетей доступа и структурированных кабельных систем. В связи с важностью задач, решаемых с их помощью, к надежности предъявляются очень высокие требования. 14
16 ПРОВЕДЕНИЕ РЕЗЕРВИРОВАНИЯ И ОБСЛУЖИВАНИЕ СЕТЕЙ При этом под надежностью понимается способность поддерживать передачу информации с заданной скоростью и заданной достоверностью в течение требуемого промежутка времени. Варианты повышения надежности сети с привлечением резервирования неизбежно связаны с дополнительными материальными затратами. Поэтому выбор наиболее эффективного варианта резервирования имеет важное прикладное значение. 15
17 ВОПРОСЫ К ПРОВЕРОЧНОЙ 1. На какие системы по способу резервирования подразделяются системы переключения? 2. В каком случае применяют переключения на обходные пути? 3. Распишите 3 вида переключений 16
18 ВОПРОСЫ К ПРОВЕРОЧНОЙ 4. Какие выводы могут быть сделаны из результатов проведения исследования и проверок резервных трактов? 5. Распишите подробно 2 способа которые решают задачу увеличения надёжности кабельной системы и сети в целом. 6. Что такое резервирование? 17
Источник