Table of Contents

Существующие механизмы обеспечения максимальной доступности в решениях ведущих производителей СХД

Москва 2016


Введение

Современные информационные системы размещают информацию на системах хранения данных (СХД). Консолидация сервисов по хранению данных на специализированном оборудовании дает возможность разгрузить процессоры вычислительной подсистемы от непрофильной нагрузки, обеспечить параллельный доступ к данным от множества подсистем, эффективно использовать ресурсы хранения. С другой стороны, СХД становится единой точкой отказа, и ее сбой может привести к остановке всех ИТ-сервисов.

Одним из основных параметров информационных систем, определяющим возможность их бесперебойной работы, является доступность. Доступность определяется как процент времени эффективной работы системы. Например, доступность 99,999% говорит о том, что система выполняет полезную нагрузку с суммарным простоем не более 5 минут и 15 секунд за год. Доступность системы в целом определяется доступностью отдельных ее компонент. Таким образом, немаловажную роль играет доступность СХД.

Какими средствами и методами повышается доступность?

В первую очередь необходимо сказать о резервировании. Все функциональные элементы должны иметь резерв, чтобы система не имела единой точки отказа (SPOF – single point of failure).

Следующим шагом является автоматизация процедур переключения на резервные элементы (failover) и восстановления исходного состояния после ремонта (failback). Для особо критичных элементов, например, блоков питания и контроллеров, создаются отказоустойчивые схемы, которые позволяют переключаться на резерв без прерывания работы остальных компонент.

Применение технологий самолечения позволяет еще более повысить доступность СХД. К таким технологиям можно отнести предиктивный вывод из строя сбойных компонент, новые способы защиты от сбоев дисков с быстрым перестроением RAID, минимизация времени синхронизации данных между СХД после обрыва связи и др.

Высокая доступность может обеспечиваться на разных уровнях:

Обеспечение доступности в рамках одной СХД

Как говорилось выше, консолидация дисковых ресурсов остро ставит вопрос о надежности решения. Поэтому во всех современных системах хранения продуктивных данных применяется обязательное резервирование компонент, отвечающих за предоставление дискового ресурса.

Традиционно на рынке СХД общего назначения основную нишу занимают системы традиционного дизайна со спаренными контроллерными модулями и их вариации. Отличительными особенностями архитектуры данных систем можно назвать следующие решения:

Немного по-другому обстоят дела с системами уровня предприятия (Enterprise Storage). Массивы среднего уровня стремительно догоняют старшие линейки по функционалу, емкости и производительности, а системы высшего класса упрощают свою архитектуру становясь более похожими на СХД общего назначения. Но не смотря на эти тенденции легко выделить отличительные черты систем высшего уровня:

Несмотря на успешное применение в прошлом описанных выше механизмов обеспечения доступности, большинство из них разработаны еще на заре создания систем хранения данных, когда размеры накопителей исчислялись гигабайтами. Рост объемов жестких дисков до нескольких Тбайт и скоростей передачи традиционная архитектура продолжает стареть:

Высокая доступность СХД в одном ЦОД или здании

В случаях, когда надежности одной СХД недостаточно, и требуется создать систему устойчивую к любым аппаратным сбоям, стоит рассмотреть подсистему хранения данных, основанную на двух зеркалируемых системах хранения данных в одном ЦОД или кампусе.

На текущий момент технологии, обеспечивающие зеркалирование данных в одном ЦОД или кампусе, можно разделить на следующие категории:

Технологии виртуализации СХД. Данный класс систем основывается на механизмах подключения СХД к системе виртуализации, которая является дополнительным слоем абстракции между сервером и дисковым массивом. Виртуализатор расширяет функционал СХД, и снимает ограничения на модель используемых дисковых массивов. Это позволяет проводить зеркалирование и миграцию данных между СХД различных линеек и производителей. Как пример можно привести следующие успешные решения:

Стоит отметить следующие преимущества применения данной технологии:

Зеркало на стороне сервера. Не является частью системы хранения данных, но с некоторыми ограничениями позволяют решить поставленную задачу защиты от выхода из строя одной СХД. Такая защита может быть реализована следующими способами:

Но не стоит забывать о накладываемых такими решениями ограничениях:

Расширение функционала репликации данных. Традиционное использование функционала репликации данных подразумевает приостановку доступа к данным при переключении на резервный массив. Причем ограничение на доступ к данным возникает независимо от того произошел ли сбой основной СХД или переключение осуществляется по команде администратора. Для ряда современных СХД были разработаны технологии, позволяющие осуществить переключение на резервный массив без остановки доступа к данным, т.е. сделать процесс переключения минимальным по времени и не требующим переключения серверов на работу с «новой» СХД. Приведем примеры подобных решений:

Высокая доступность сервисов хранения для распределенных систем

С целью повышения доступности данных при наступлении возможных катастрофических событий, которые могут приводить к выходу из строя или повреждению целой площадки, используются технологии распределенного хранения данных.

На сегодняшний день, в качестве резервной площадки могут использоваться как собственные удаленные ЦОДы, так и ресурсы, предоставляемые провайдерами облачных сервисов. Во втором случае, интерес представляют решения производителей СХД, которые позволяют реплицировать данные между собственными системами хранения и виртуальными СХД, предоставляемыми провайдерами услуг.

При копировании данных на большие расстояния значительно возрастают задержки, связанные с тем, что скорость распространения световых и электромагнитных волн конечна. На расстояниях, превышающих 100 км, как правило, применяется асинхронная репликация данных. Асинхронная репликация, с одной стороны, позволяет работать без существенных задержек на основной площадке независимо от удаления резервной, а, с другой стороны, выдвигает дополнительные требования к механизму определения и передачи изменившихся блоков данных. Это связано с необходимостью обеспечить crash-consistent состояние данных на резервной СХД при сбое на основной площадке. Рассмотрим основные способы определения изменений, используемые в территориально-распределенных решениях:

В связи с популяризацией публичного облака и со снижением стоимости аренды - многие компании рассматривают решения по построению гибридного облака.

Заключение

Консолидация сервисов по хранению данных на специализированном оборудовании обладает неоспоримыми преимуществами и позволяет высвободить ресурсы сервера, обеспечить параллельный доступ к данным и повысить эффективность хранения. Но несмотря на все преимущества данные решения стоит внедрять «с умом», рассматривая все возможные категории рисков и адекватно принимать решения по их сокращению.

В данной статье нами были рассмотрены основные подходы к резервированию бизнес-критичных данных с использованием различных по цене, сложности и надежности подходов.

Из основных подходов были выделены решения нацеленные на устранение возможности отказа системы в случае выхода единичных компонент, защиты от неконтролируемого повреждения информации.

Был рассмотрен портфель решений призванный оградить заказчиков от последствий потери системы хранения данных целиком в случае серьёзного аппаратного сбоя или ошибки администрирования.

Приведены подходы построения территориально распределенных систем хранения, обеспечивающих наивысшую степень надежности и используемых в подходах обеспечения непрерывности ИТ сервисов.

На основе предоставленной информации нельзя однозначно рекомендовать для любых систем использование конкретной практики. Каждое внедрение требует тщательной проработки и выбора соответствующего подхода основываясь на компромиссе между стоимостью, надежностью и простотой использования. На текущий момент, к сожалению еще не существует практики подходящей всем, но инфраструктура систем хранения не стоит на месте и постоянно совершенствуется, как совершенствуются и подходы к повышению доступности.