Руководство по аварийному восстановлению работоспособности СХД HDS AMS2100/AMS2300
Данный материал подготовлен для компании ЛАНИТ
Процедура обнаружения аварии и первоначальные ответные действия
Сразу после того, как авария произошла, персонал ИС, находящийся на рабочих местах, обязан зафиксировать её характерные признаки и сопутствующие ей обстоятельства и немедленно поставить в известность главное подразделение ИТ посредством телефона, факса, электронной почты, личного обращения, либо через дежурные диспетчерские службы должен сообщить о ней соответствующим аварийным службам. По окончании первоочередных действий сотрудники приступают к ликвидации последствий аварии.
Оценка ситуации. Уведомление ответственных лиц
Не критичный ущерб | Система функционирует в аварийном режиме. Все сервисы предоставляются полностью или в частично ограниченном объеме. Полное отключение системы не планируется. |
Серьёзный ущерб | Функционирование может быть запущено снова за короткое время и без привлечения дополнительного персонала. Ожидаемое время отключения менее одного дня. Ущерб может быть причинен оборудованию, программному обеспечению, электрическим и механическим устройствам, зданию. |
Значительный ущерб | Выбираются службы, которые надо привлечь, чтобы добиться запуска нормальной работы в серверном помещении после аварии или в других серверных помещениях. Примерное время отключения от двух до шести дней. Главные повреждения нанесены аппаратуре или зданию. |
Уведомление ответственных лиц
Если возникшая аварийная ситуация связана с обеспечением функционирования серверных, таким как энергоснабжение, водоснабжение, перегрев, переохлаждение, влажность, то необходимо связаться со следующими ответственными сотрудниками:
mailto: впишите сюда email
mailto: впишите сюда email
После того, как удалось связаться с кем-нибудь из указанных выше сотрудников, нужно принять решение о том, кого необходимо поставить в известность, в зависимости о сложившейся ситуации:
mailto: впишите сюда email
mailto: впишите сюда email
Первоначальные действия по предотвращению или уменьшению возможного ущерба
Ниже описаны процедуры, которые позволят уменьшить риск дополнительных потерь из-за того, что обслуживающий персонал не предпринял необходимых действий. Эти процедуры предназначены для критических ситуаций, связанных с нарушением кондиционирования воздуха, пожарами, сбоями в энерго- или водоснабжении.
Действия в случае сбоев в системе кондиционирования воздуха
В случае выхода из строя системы мониторинга серверных, необходимо проверять температуру по показаниям термометров. Мониторингом занимается дежурный охранник в ночное время или персонал ИС в дневное.
Нормальная температура для компьютерного зала - от 16° С до 24.4° С. Если температура превысит 24.4° C, нужно предпринять следующие меры предосторожности:
Сообщить в службу эксплуатации здания, что температура вышла за верхний передел допустимого рабочего диапазона.
Если администратор решит выключить ИС, или же система отключится сама, из-за перегрева, то ее нельзя вновь включать до полого восстановления требуемых параметров окружающей среды в серверной.
Действия в случае пожарной тревоги
В случае если в компьютерном зале обнаружено возгорание или задымление необходимо выполнить следующие действия:
Сообщить в службу эксплуатации здания
Сообщить в ИТ отдел
Немедленно отключить компоненты ИС
Попытаться сбить пламя при помощи ручного огнетушителя.
Если сбить пламя не удается:
Включить пожарную сигнализацию или позвонить в пожарную охрану.
Сообщить администрации здания для принятия соответствующих мер.
Сообщить охране.
Покинуть помещение
Если запас времени позволяет: Перенести рабочие магнитные ленты и другие мобильные носители информации с компьютера в безопасное место
Сообщить группе управления в аварийной ситуации (руководителю группы или его заместителю).
Действия в случае аварии энергоснабжения
В том случае, если в серверном помещении произошла авария электропитания, то необходимо предпринять следующие шаги:
Немедленно сообщить в службу эксплуатации здания
Сообщить в ИТ отдел
В зависимости от указаний ответственного сотрудника ИТ отдела отключить компоненты ИС, или продолжить работу в аварийном режиме.
Действия в случае затопления
Ущерб от воды может быть вызван включением или протечками дождевальных систем, прорванными трубами, затоплением ванных комнат, потоком воды в компьютерный зал из других частей здания вследствие пожара и т.д. Если началось поступление воды то надо выполнить следующие действия:
Отключить компоненты ИС, если это еще не было сделано ранее.
Немедленно сообщить службу эксплуатации здания
Сообщить в ИТ отдел
Действия в случае выхода из строя компонентов системы
Выход из строя оборудования может быть вызван не соответствием условий эксплуатации с требуемыми производителем, производственным браком или нормальным износом компонентов системы. В случае обнаружения отказа одного или нескольких компонентов системы необходимо выполнить следующие действия:
Сообщить в ИТ отдел, вызвать дежурного администратора;
Дальнейшие действия по ликвидации последствий сбоя должен производить квалифицированный специалист;
При наличии ЗИП попытаться заменить вышедший из строя компонент своими силами, руководствуюсь инструкцией по замене компонентов из Приложения «А», данного документа;
Связаться с сервисным центром производителя оборудования;
Открыть заявку на обслуживание;
Следовать указаниям сервисного специалиста;
Приложение «А» Руководство по замене вышедших из строя компонентов ИС
А1- Инструкция по замене компонентов дискового массива
Обнаружение вышедшего из строя компонента массива
Запустить ПО управления Storage Navigator 2
Перейти в панели “Explorer” и выбрать пункт “Resources > Arrays”
В окне списка массивов определить сбойный массив, если такой присутствует, выберите пункт Components > Trays
В окне “Alerts” выберите пункт меню “Details” для уточнения списка сбойных компонентов;
Ознакомьтесь с детальной информацией о сбойных компонентах;
Порядок замены вышедшего из строя компонента массива
Наименование | Режим функционирования системы | Соответствующий раздел руководства |
С I/O | Без I/O |
ВКЛ | ВКЛ | ВЫКЛ |
Жесткий диск | O | O | X | 1. Процедура замены жесткого диска массива HDS AMS 2100 и 2300 |
Резервная батарея кэш-памяти | O | O | O | 2.Замена батареи резервирования кэш-памяти |
Блок питания | O | O | O | 3.Замена блока питания |
Контроллерный модуль | O | O | O | 4.Замена контроллерного модуля |
Передняя панель | O | O | O | 5.Снятие и установка передней панели |
Процедура замены жесткого диска массива HDS AMS 2100 и 2300
Ограничения
Перед выполнением процедуры добавления или замены компонентов массива, обеспечьте выполнение следующих условий:
В процессе добавления или замены жесткого диска при включенном массиве, удостоверьтесь, что операция будет выполнена в течение 10 минут после извлечения жесткого диска или заглушки. Открытый слот массива нарушает процесс циркуляции холодного воздуха, что может повлечь за собой перегрев и отключение массива.
Перед добавлением, удалением или заменой частей массива прочти весь порядок действий до конца. Если у вас возникли вопросы касательно необходимых процедур, свяжитесь, пожалуйста, с сервисным центром Hitachi Data Systems перед началом процедур. Избежать проблем легче чем исправлять их последствия.
В процессе добавления дополнительных компонентов, используйте по управления массивом Navigator 2 для настойки параметров.
Указатель состояния готовности массива. Не производите никаких действий с компонентами массива, когда указатель состояния готовности массива на передней панели (Ready LED) быстро мигает зеленым светом. Быстрое мигание означает выполнение процесса обновления прошивки. В зависимости от типа и скорости соединения
LAN эта процедура может занимать от 30 до 50 минут. Подождите как минимум 30 секунд после того как указатель станет светиться непрерывно, перед выполнением любых действий с оборудованием массива.
Указатель состояния «Внимание» Не добавляйте и не заменяйте компоненты массива пока оранжевый указатель «Внимание» (Warning LED) быстро мигает на передней панели массива. Быстрое мигание означает процесс обновления микрокода ENC. Этот процесс может занять от 30 до 85 минут. Подождите как минимум 30 секунд после того как указатель станет светиться непрерывно, перед выполнением любых действий с оборудованием массива.
Нумерация и поиск жёсткого диска
Как показано на рисунке 2, в массиве диски нумеруются по порядку от #0 до #14 слева на право, если смотреть спереди. 1) Контроллер массива. 2) Дисковая полка массива.
Замена жесткого диска
Для установки жесткого диска необходимо выполнить следующие шаги. Не пропускайте никакие этапы.
Внимание: Относитесь бережно к жестким дискам. Не бросайте, не допускайте воздействия вибраций или статического напряжения. Используйте заземление. Если вы меняете сразу несколько жестких дисков, вынимайте существующие или заглушки только по одной. Не допускайте отверстия размером больше одного диска.
Когда устанавливаете жесткий диск или любой другой компонент массива, оденьте заземляющий браслет на свое запястье, или снимите статическое напряжение, коснувшись металлической рамы жёсткого диска.
Заземляющий браслет
Жесткий диск
Коснитесь металлической рамы жесткого диска
Снимите декоративную переднюю панель массива.
Если вы еще не надели антистатический браслет, сделайте это сейчас.
Распакуйте новы диск и положите его на антистатический коврик.
Выполните следующий шаг в течение 10 минут, во избежание перегрева системы из-за открытого слота диска.
Снимите заглушку отсека диска или жёсткий диск на место, которого вы планируете установить новый диск.
Разблокируйте защелку, как показано на рисунке 4
Защелка
Шасси
Плавно задвиньте диск в открытый слот защелкой вверх.
Закройте защелку. Как только вы это сделаете, диск зафиксируется в разъеме и контакты соединятся.
Удостоверьтесь, что диск раскрутился после того, как вы полностью вставили его в систему.
Если вы заменяете вышедший из строя диск, после ввода в действие система начнет копирование информации на новый диск. Операция будет завершена примерно, через одну минуту тридцать секунд для каждого нового диска.
Установите фронтальную панель на прежнее место.
Замена батареи резервирования кэш-памяти
Ограничения
Перед выполнением процедуры добавления или замены компонентов массива, обеспечьте выполнение следующих условий:
Если произошло отключение питания во время замены батареи, данные пользователей, находящиеся в кэш памяти на момент отключения, которые не были записаны на диск будут потеряны;
В процессе добавления или замены модуля при включенном массиве, удостоверьтесь, что операция будет выполнена в течение 10 минут после извлечения модуля или заглушки. Открытый слот массива нарушает процесс циркуляции холодного воздуха, что может повлечь за собой перегрев и отключение массива.
Если при включенной системе заменяются обе батареи сразу, режим кэширования будет переведен в «Write-Through», что повлечет заметное снижение производительности массива, поэтому постарайтесь выполнить замену как можно быстрее.
Указатель состояния готовности массива. Не производите никаких действий с компонентами массива, когда указатель состояния готовности массива на передней панели (Ready LED) быстро мигает зеленым светом. Быстрое мигание означает выполнение процесса обновления прошивки. В зависимости от типа и скорости соединения
LAN эта процедура может занимать от 30 до 50 минут. Подождите как минимум 30 секунд после того как указатель станет светиться непрерывно, перед выполнением любых действий с оборудованием массива.
Указатель состояния «Внимание» Не добавляйте и не заменяйте компоненты массива пока оранжевый указатель «Внимание» (Warning LED) быстро мигает на передней панели массива. Быстрое мигание означает процесс обновления микрокода ENC. Этот процесс может занять от 30 до 85 минут. Подождите как минимум 30 секунд после того как указатель станет светиться непрерывно, перед выполнением любых действий с оборудованием массива.
Порядок действий
Снимите переднюю панель
Определите модуль, нуждающийся в замене по горящему красным индикатору ALM LED;
Откройте защелку блокировки батареи и выньте модуль, будьте внимательны вес батареи достигает порядка 2 кг.
Подождите 20 секунд, перед установкой новой батареи;
Откройте защелку блокировки на новой батарее;
Установите батарею, как показано на рисунке.
Плавно задвиньте батарею до упора
Закройте защелку.
Замена блока питания
Ограничения
Перед выполнением процедуры добавления или замены компонентов массива, обеспечьте выполнение следующих условий:
В процессе добавления или замены модуля при включенном массиве, удостоверьтесь, что операция будет выполнена в течение 10 минут после извлечения модуля. Открытый слот массива нарушает процесс циркуляции холодного воздуха, что может повлечь за собой перегрев и отключение массива.
Указатель состояния готовности массива. Не производите никаких действий с компонентами массива, когда указатель состояния готовности массива на передней панели (Ready LED) быстро мигает зеленым светом. Быстрое мигание означает выполнение процесса обновления прошивки. В зависимости от типа и скорости соединения
LAN эта процедура может занимать от 30 до 50 минут. Подождите как минимум 30 секунд после того как указатель станет светиться непрерывно, перед выполнением любых действий с оборудованием массива.
Указатель состояния «Внимание» Не добавляйте и не заменяйте компоненты массива пока оранжевый указатель «Внимание» (Warning LED) быстро мигает на передней панели массива. Быстрое мигание означает процесс обновления микрокода ENC. Этот процесс может занять от 30 до 85 минут. Подождите как минимум 30 секунд после того как указатель станет светиться непрерывно, перед выполнением любых действий с оборудованием массива.
Если оба блока питания требуют замены. Заменяйте блоки питания по очереди, во избежание полного отключения питания системы. Или производите операцию на выключенном массиве.
Порядок действий
Определите модуль, нуждающийся в замене по горящему красным индикатору ALM LED
Отключите кабели питания, идущие к модулю;
Откройте защелки блокировки, потяните на себя и выньте блок, держа его обеими руками;
Подождите 20 секунд, перед установкой нового блока;
Откройте защелки блокировки на новом блоке;
Установите модуль блока питания, как показано на рисунке
Закройте защелки;
Подключите провода к блоку питания, аналогично подключению сбойного блока;
Замена контроллерного модуля
Ограничения
Перед выполнением процедуры добавления или замены компонентов массива, обеспечьте выполнение следующих условий:
В процессе добавления или замены модуля при включенном массиве, удостоверьтесь, что операция будет выполнена в течение 10 минут после извлечения модуля или заглушки. Открытый слот массива нарушает процесс циркуляции холодного воздуха, что может повлечь за собой перегрев и отключение массива.
Производите замену модуля, только после его блокировки;
Если при включенной системе заменяются обе батареи сразу, режим кэширования будет переведен в «Write-Through», что повлечет заметное снижение производительности массива, поэтому постарайтесь выполнить замену как можно быстрее.
Указатель состояния готовности массива. Не производите никаких действий с компонентами массива, когда указатель состояния готовности массива на передней панели (Ready LED) быстро мигает зеленым светом. Быстрое мигание означает выполнение процесса обновления прошивки. В зависимости от типа и скорости соединения
LAN эта процедура может занимать от 30 до 50 минут. Подождите как минимум 30 секунд после того как указатель станет светиться непрерывно, перед выполнением любых действий с оборудованием массива.
Указатель состояния «Внимание» Не добавляйте и не заменяйте компоненты массива пока оранжевый указатель «Внимание» (Warning LED) быстро мигает на передней панели массива. Быстрое мигание означает процесс обновления микрокода ENC. Этот процесс может занять от 30 до 85 минут. Подождите как минимум 30 секунд после того как указатель станет светиться непрерывно, перед выполнением любых действий с оборудованием массива.
Замена контроллерного модуля массива
Определите контроллерный модуль, нуждающийся в замене. Определите, что на нем горят указатели ALM LED (красный) или RST LED (оранжевый) \
Откройте защелку блокировки;
Отключите интерфейсные провода, идущие к модулю;
Выньте контроллерный модуль;
Подключите провода соединяющие дисковые полки к модулю, аналогично подключению сбойного модуля;
Откройте защелку блокировки на новом модуле;
Подождите 20 секунд, перед установкой нового блока;
Плавно задвиньте модуль, как показано на рисунке
Закройте защелку;
Дождитесь процедуры восстановления контроллера, она может достигать порядка 30 минут;
Убедитесь что, указатель WARNING LED, на передней панели погас;
Подключите оставшиеся провода к контроллерному модулю
Дождитесь процедуры обновления прошивки на контроллере, индикатор REDY LED (зеленый) на передней панели должен перестать быстро, мигать. Это может занять от 30 до 50 минут.
Запустите Storage Navigator и проверьте основные параметры системы.
Снятие и установка передней панели
Процедура снятия передней панели выполняется следующим образом:
Вставьте ключ, входящий в комплект поставки в отверстие замка и поверните его в положение «разблокировано»;
Потяните панель на себя, держа ее за боковые грани;
Снимите два крюка, крепящих панель к нижней части полки массива;
Процедура установки передней панели выполняется следующим образом:
Вставьте ключ, входящий в комплект поставки в отверстие замка и поверните его в положение «разблокировано»;
Возьмите панель двумя руками;
Вставьте крюки, находящиеся в нижней части панели в отверстия в дисковой полке массива, сначала слева, затем справа;
Задвиньте панель к полке массива, пока она не зафиксируется на боковых защелках;
Поверните ключ и зафиксируйте панель.