Table of Contents

Методология

Серверы

Проблема Описание Рекомендация
Большое разнообразие серверов Используется оборудование четырёх разных производителей. Каждый производитель старается сделать свой продукт уникальным, у каждого своя длительная история, Поэтому администрирование нескольких разных платформ занимает существенно больше времени чем одной и требует более широких навыков что ведёт к необходимости содержания большого штата сотрудников. Рекомендуется разработать стандарт в области производителя оборудования и придерживаться данного стандарта.
Выключенное оборудование В стойку смонтировано выведенное из эксплуатации оборудование. Система занимает место в шкафу, это так же может привести к путанице и к панике в процессе восстановления после аварии.
Диск для данных - SATA В серверах данного типа используются диски с интерфейсом SATA. Данный интерфейс одним преимуществом – низкой стоимостью комплектующих. Накопители подключенные по данному интерфейсу работают медленнее и менее надёжно по сравнению с интерфейсом SAS. Когда невозможно использовать централизованную систему хранения данных - рекомендуется использовать накопители с интерфейсом SAS для хранения продуктивной нагрузки.
Диск для данных - без резервирования Диск для хранения данных сервера не зарезервирован. Установить второй аналогичный по характеристикам диск и настроить отказоустойчивую группу RAID для предотвращения потери данных
Загрузочный диск - SD карта В серверах данного типа используются SD карты для установки операционной системы гипервизора. Данный подход более не поддерживается никакими современными гипервизорами в виду того, что карты памяти часто выходят из строя что приводит к внезапной остановке гипервзиора и всех запущенных на нём виртуальных машин. Вместо SD карт рекомендуется использовать специализированные недорогие устройства называемые BOSS (dell) или OS Boot Device (HPE) выполненные в виде RAID контроллера со слотами для установки двух твердотельных накопителей форм-фактора M2. Такой подход уже используется в некоторых более современных серверах площадки.
Загрузочный диск - без резервирования Загрузочный диск сервера не защищен от выхода из строя зеркалированием. Установить второй загрузочный диск и настроить зеркалирование между устройствами. Или установить специализированное загрузочное устройство (BOSS Card, OS Boot Device)
Используются аппаратные и виртуальные серверы В инфраструктуре заказчика используются аппаратные и виртуальные серверы без четкого обоснования данной стратегии. В большинстве случаев подсистема виртуализации позволяет достичь большей гибкости, отказоустойчивости и надежности системы в целом, при этом потеря производительности за счет виртуализации является незначительной.
Локальное хранилище В сервер установлено избыточное количество накопителей. Для установки гипервизора при наличии подключения к системе хранения данных достаточно двух накопителей. Рекомендуется использовать дисковые ресурсы системы хранения данных и при разработке проектов по внедрению новых ИТ сервисов учитывать наличие выделенной системы хранения данных, дисковую емкость для ИТ сервисов закладывать в существующую СХД.
Локальное хранилище В сервер установлено избыточное количество накопителей. Для установки гипервизора при наличии подключения к системе хранения данных достаточно двух накопителей. Рекомендуется использовать дисковые ресурсы системы хранения данных и при разработке проектов по внедрению новых ИТ сервисов учитывать наличие выделенной системы хранения данных, дисковую емкость для ИТ сервисов закладывать в существующую СХД.
Мало оперативной памяти Серверы данного типа оснащены очень маленьким объемом оперативной памяти, что не позволяет эффективно использовать ресурсы процессора. Серверы данной конфигурации могут быть использованы для выполнения специализированных задач, не требовательных к оперативной памяти, хотя большинство производственных задач такими не являются. Более детально проанализировать нагрузку сервера и дооснастить при необходимости оперативной памятью платформу. Или вывести серверы данного типа из работы, что позволит достичь экономии на обслуживании инфраструктуры.
Неверная маркировка Маркировка оборудования в шкафах не соответствует логическому имени оборудования и названию в системе мониторинга
Неучтённое оборудование В стойках смонтировано неучтённое в системе мониторинга оборудование.
Слишком разные серверы виртуальной фермы Серверы, используемые под виртуализацию, значительно отличаются друг от друга. Платформа виртуализации позволяет абстрагироваться от аппаратного уровня и использовать практически любое оборудование для запуска виртуальных машин. При этом рекомендуется чтобы поколения процессоров были одинаковыми.
Для простоты администрирования рекомендуется использование серверов идентичной конфигурации.

СХД

Проблема Описание Рекомендация
Выключенное оборудование В стойку смонтировано выведенное из эксплуатации оборудование. Система занимает место в шкафу, это так же может привести к путанице и к панике в процессе восстановления после аварии.
Высокопроизводительные СХД Используются неподходящие по параметрам СХД слишком высокого класса. Для текущей нагрузки более оптимально использовать СХД более низкого уровня. Современные СХД начального сегмента обладают всем необходимым функционалом, а часто даже имеют единую платформу с системами среднего и высокого ценового диапазона. При этом предлагают более эффективные условия хранения данных.
Для дисков NL_SAS используется RAID5 Для дисков большого объема используется уровень RAID с защитой от выхода из строя одного накопителя. На дисках NL_SAS для защиты от «тихого повреждения данных» и повторного сбоя во время восстановления первого диска рекомендуется использовать RAID6
Для дисков SSD используется RAID6 На твердотельных накопителях используется уровень RAID с защитой от выхода из строя двух дисков одновременно. Твердотельные накопители слабо подвержены внезапным сбоям в отличие от накопителей на вращающихся дисках. Выход из строя SSD происходит либо из за заводского брака либо при естественном износе. Необходимости в защите от одновременно двух сбоев при использовании SSD дисков обычно нет. Рекомендуется использовать RAID5 для защиты от выхода из строя SSD дисков.
Мало свободного места в пуле Дисковая емкость пула более чем на 80% Рекомендуется не размечать полностью всю емкость пула и оставлять свободный процент дискового пространства в каждом пуле. Это поможет повысить стабильность отклика системы и избежать «просадки» производительности.
Микрокод не обновлялся Микрокод на данной системе давно не обновлялся. Рекомендуется периодически обновлять микрокод для устранения найденных ошибок и уязвимостей системы безопасности. Если система на поддержке у производителя необходимо обратиться в сервисную поддержку.
Много пулов На системе хранения данных создано избыточное количество дисковых пулов, что возможно приводит к неэффективному использованию дискового пространства для хранения чётности, отсутствию гибкости в распределении дисковой емкости, снижению производительности. Производительность пула напрямую зависит от количества дисков, которые он объединяет. При создании трёх пулов уровня RAID6 и одного пула уровня RAID6 система обладает одинаковым уровнем защиты от выхода из строя только двух любых дисков.
Много СХД Слишком большое разнообразие систем хранения данных в сравнении с объемом вычислительных ресурсов. В ландшафте присутствует 6 серверов виртуализации, имеющих возможность подключения к СХД и 5 систем хранения данных. Рекомендуется придерживаться консолидационного подхода с меньшим разнообразием маленьких изолированных систем различных производителей в пользу единой системы хранения данных и единой системы хранения резервных копий.
Наличие сбойных дисков Накопители на системе помечены как сбойные и больше не могут использоваться для хранения данных, так как могут внезапно выйти из строя. Рекомендуется продлить сервисный контракт на систему или приобрести и заменить накопители самостоятельно.
Неэффективная защита данных Используемые системы хранения данных обладают современным функционалом позволяющим существенно упростить и сократить время резервного копирования таким как – мгновенные снимки, клоны томов и удалённая репликация. Весь перечень современного ПО резервного копирования поддерживает технологии зашиты данных, встроенные в системы хранения данных.
Рекомендуется использовать мгновенные снимки для защиты данных от изменения, так как это существенно сокращает время резервного копирования.
Неэффективная защита данных Используемые системы хранения данных обладают современным функционалом позволяющим существенно упростить и сократить время резервного копирования таким как – мгновенные снимки, клоны томов и удалённая репликация. Весь перечень современного ПО резервного копирования поддерживает технологии зашиты данных, встроенные в системы хранения данных.
Один контроллер Используемые файловые серверы не обеспечивают высокой надежности так как обладают только одним контроллером. Рекомендуется держать локальный ЗИП или хранить данные на двух одноконтроллерных СХД одновременно.
Соотношение SSD к HDD очень маленькое Объем дисков FASTCache по отношению к объему жестких дисков очень маленький. Кэш назначен на все пулы системы. Рекомендуется использовать FASTCache только для критичных систем, где требуется высокая производительность во избежание выталкивания из кэша важных данных медленными.
СХД без поддержки Системы Synology не обладают расширенной поддержкой от производителя и использование их в продуктивных средах не рекомендуется. Производитель Synology не может обеспечить круглосуточный превентивный сервис для этих систем на территории России, поэтому в случае поломки восстановление данных и доступности сервиса может затянуться на неопределенный срок от нескольких дней до месяцев.
При том что гарантия на накопители не распространяется.
В случае использования оборудования без поддержки производителя рекомендуется держать локальный ЗИП.
В качестве системы хранения резервных копий с минимальной стоимостью хранения рекомендуется использовать ленточные накопители.