meta data for this page
  •  

2023-01-06 IBM DS8870

Году в 2013 а может и раньше владелец компании в которой я тогда работал договорился на покупку новой СХД IBM ds88700 с огромной, просто баснословной скидкой. Спустя почти 8 лет эксплуатации данной системы однозначно понятно что ситуация была безвыходная и по своей воле никто такое купить не мог.

IBM DS8870

Все началось с того что система, не знаю конкретно эта или все СХД от IBM должна была быть установлена в течении определенного срока для сохранения контракта технической поддержки. А нам совершенно этот “холодильник” на тот момент было некуда пристраивать. В офисе на Доброслободской электричества едва хватало на охлаждение серверов компании, чего не скажешь о людях. А перекрытия и не выдержали бы такой нагрузки.

Поэтому нам с коллегой было поручено выехать на склад, изобразить дружелюбную обстановку для инженера IBM, запустить систему поставить ее на поддержку и попытаться выведать у него максимум секретов. Склад замечательное место на котором оборудование не только хранится но и настраивается, запускается, чинится и погибает. В данном случае нам была предоставлена взлетная площадка около станции зарядки электропогрузчиков так как в данном месте была сконцентрирована основная энергия в помещении.

Систему притащили и бросили посреди свободного пространства примерно 30 м2, выделили нам стол типа советской парты и подвели электричество. По началу инженер не подавал признаков недоумения во время запуска системы, но в конце концов не выдержал и попытался возразить что условия для эксплуатации системы не подходящие и что как бы перемещать ее по условиям сервисной поддержки после запуска нельзя. Мы конечно же ответили что СХД никуда не уезжает а будет работать где то тут рядом в более подходящей серверной, но запустить надо ее прямо сейчас.

20230106-211747.jpeg

Примерно через год был построен демо ЦОД в новом офисе компании и пробил час этой замечательной системы.

20230106-213150.jpeg

20230106-213207.jpeg

20230106-213158.jpeg

Система DS8800 представляет собой HiEnd массив IBM того времени и наверное единственную систему IBM которая могла подключаться к мэйнфреймам. Из функционала в этой СХД было всё:

  1. Снапшоты
  2. Tiering
  3. Репликация

На этом возможности данного массива заканчивались.

Конструктив шкафа оригинальный ни с чем не сравнимый (наша система справа):

  1. Флеш полки. Стоят вертикально! (у нас нет).
  2. Полки с обычными дисками SAS.
  3. ИБП
  4. Ноутбук Lenovo ThinkPad T4x0, который выполняет функции HMC. Батарея в ноутбуке отсутствует, он крепко прикручен к своему столу (стол кстати съемный) и имеет два зарядных устройства для отказоустойчивости по питанию. Присутствует ли какой-то AVR, я не знаю. Возможно оба зарядника просто сливаются в один разъем;
  5. Две машины IBM Power7;
  6. Два модуля расширения PCI, по одному для каждой P-машины.

Спустя несколько лет эксплуатации выяснилась одна неприятная особенность. Диски в системе умирают вне зависимости от нагрузки. Даже если она стоит греет воздух - накопители выходят с одинаковой регулярностью. Но самое неприятное было в том что либо данная система либо все DS8870 в принципе оснащаются дисками со встроенным шифрованием. Мы попытались несколько раз покупать диски по партномерам в канале запчастей, но система отказывалась их принимать. Диск нужно было инициализировать и подключить к встроенному серверу ключей. Все более менее серьезные операции в данной машине выполняются только с использованием одноразового пароля который создается на основе даты и серийного номера системы в сервисном центре IBM.

Поэтому чинить систему после окончания поддержки мы уже не могли.

Запасной план был - разобрать полки, выкинуть “Пэшки” и подключить диски к обычным серверам x86, но в связи с тем что диски были зашифрованы - их необходимо было каким-то образом активировать либо сбросить. Все попытки привести в чувства накопители не увенчались успехом.

Мы нашли способ “деинсталлировать” из системы несколько полок, выделив себе таким образом некоторый ЗИП из дисков на несколько лет вперед. Но в процессе эксплуатации кто-то случайно заменил “не тот” диск и все RAID группы перешли в аварийное состояние из которого выйти можно либо инициализацией системы (с использованием одноразового пароля) либо поочередно запуская процедуру горячей замены заблокированного диска.

20230106-215757.jpeg 20230106-215801.jpeg

На момент моего увольнения из компании в 2021 ситуация осталась в таком положении: СХД была выведена из работы, примерно 1/3 дисков мне хватило сил “переусадить” а 2/3 находилось в ошибочном состоянии. Массив включен. Нагрузки нет. ИБП вышли из строя. Загрузочные диски в машинах Power местами вышли из строя.

20230106-215746.jpeg