Процедура реагирования в случае повреждения данных виртуальной машины

Симптомы

  • Операционная система ВМ не загружается;
  • Файлы внутри ВМ повреждены;
  • Виртуальная машина не включается;
  • Регулярные сбои операционной системы ВМ;

Причины

  • Повреждение файлов операционной системы внутри виртуальной машины в следствии некорректного завершения работы ВМ или работы механизма высокой доступности;
  • Повреждение файлов мгновенных снимков виртуальной машины и их удаление;
  • Недостаточное количество ресурсов подсистемы виртуализации;
  • Недостаточное количество ресурсов дисковой подсистемы;
  • Действия вредоносных программ внутри виртуальной машины;
  • Проблемы вызванные оборудованием сервера виртуализации;
  • Сбой системы хранения данных;

Влияние на доступность сервисов

Повреждение данных виртуальной машины сказывается как минимум на работоспособности прикладного ПО указанной ВМ. В случае если повреждение было вызвано сбоем в системе хранения данных воздействие может быть значительно более широким и затрагивать прочие виртуальные машины кластера хранения.

План реагирования

  1. Исключить причину возникновения сбоя, связанную с изменением конфигурации виртуальной машины;
  2. Проверить наличие свободных ресурсов на подсистеме виртуализации, на сервере виртуализации и на подсистеме хранения данных, достаточных для запуска и функционирования виртуальной машины;
  3. Перенести подверженную сбою ВМ на другой сервер виртуализации с целью исключения причины возникновения сбоя, вызванной неисправностью аппаратных компонентов сервера;
  4. Произвести мониторинг состояния аппаратных ресурсов серверной подсистемы, мониторинг состояния системы хранения данных на предмет сбоев, командой vstorage -c %CLUSTER_NAME% top, где %CLUSTER_NAME% - имя кластера хранения данных.
  5. В случае если установлено что данные виртуальной машины безвозвратно испорчены необходимо переходить к процедуре восстановления;