meta data for this page
  •  

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
domestic:rosplatforma:guide:dr:mitigation:fatal_hardware_failure [2022/12/15 11:25] – ↷ Page moved from domestic:rosplatforma:guide:mitigation:fatal_hardware_failure to domestic:rosplatforma:guide:dr:mitigation:fatal_hardware_failure mchusdomestic:rosplatforma:guide:dr:mitigation:fatal_hardware_failure [2022/12/15 11:25] (current) – ↷ Links adapted because of a move operation mchus
Line 37: Line 37:
 ===== План реагирования ===== ===== План реагирования =====
   - Убедиться в доступности сервисов;   - Убедиться в доступности сервисов;
-  - Проверить доступность интерфейсов веб администрирования "Р-Управление" и "Р-Хранилище", в случае необходимости восстановить работоспособность контейнеров администрирования, руководствуясь соответствующими разделами данного руководства (см. [[domestic:rosplatforma:guide:mitigation:r-man_webui_failure|Процедура реагирования при отказе интерфейса Р-Управление]] и [[domestic:rosplatforma:guide:mitigation:vstor_webui_failure|Процедура реагирования при отказе интерфейса Р-Хранилище]]) +  - Проверить доступность интерфейсов веб администрирования "Р-Управление" и "Р-Хранилище", в случае необходимости восстановить работоспособность контейнеров администрирования, руководствуясь соответствующими разделами данного руководства (см. [[domestic:rosplatforma:guide:dr:mitigation:r-man_webui_failure|Процедура реагирования при отказе интерфейса Р-Управление]] и [[domestic:rosplatforma:guide:dr:mitigation:vstor_webui_failure|Процедура реагирования при отказе интерфейса Р-Хранилище]]) 
-  - Проверить исправность кластера хранения данных через интерфейс "Р-Хранилище". Большинство сервисов метаданных должно функционировать для корректной работы кластера {{:domestic:rosplatforma:guide:mitigation:host_failed:20221209-104121.png}}+  - Проверить исправность кластера хранения данных через интерфейс "Р-Хранилище". Большинство сервисов метаданных должно функционировать для корректной работы кластера {{domestic:rosplatforma:guide:dr:mitigation:host_failed:20221209-104121.png}}
   - Убедиться в корректности работы подсистемы виртуализации;   - Убедиться в корректности работы подсистемы виртуализации;
   - Проверить корректность работы кластера высокой доступности:   - Проверить корректность работы кластера высокой доступности:
     - Все виртуальные машины кроме исключенных из конфигурации ''shaman'' перенесены на свободные узлы кластера. В случае необходимости перенести требуемые виртуальные машины вручную;     - Все виртуальные машины кроме исключенных из конфигурации ''shaman'' перенесены на свободные узлы кластера. В случае необходимости перенести требуемые виртуальные машины вручную;
     - Машины которые были запущены на подверженном сбою хосте перезапущены. В случае необходимости запустить необходимые виртуальные машины вручную;     - Машины которые были запущены на подверженном сбою хосте перезапущены. В случае необходимости запустить необходимые виртуальные машины вручную;
-    - Операционная системы виртуальных машин, которые были перезапущены запустилась, прикладное ПО работает. В случае необходимости восстановить работу виртуальных машин, руководствуясь разделом соответствующим данного руководства (см. [[domestic:rosplatforma:guide:mitigation:vm_hdd_corrupt|Процедура реагирования в случае повреждения данных виртуальной машины]]);+    - Операционная системы виртуальных машин, которые были перезапущены запустилась, прикладное ПО работает. В случае необходимости восстановить работу виртуальных машин, руководствуясь разделом соответствующим данного руководства (см. [[domestic:rosplatforma:guide:dr:mitigation:vm_hdd_corrupt|Процедура реагирования в случае повреждения данных виртуальной машины]]);
   - Выяснить причину сбоя и ожидаемое время восстановления.   - Выяснить причину сбоя и ожидаемое время восстановления.
   - Принудительно освободить сбойный сервер из конфигурации системы хранения только при наличии следующих факторов:    - Принудительно освободить сбойный сервер из конфигурации системы хранения только при наличии следующих факторов: