Контроль использования ресурсов подсистемы хранения данных

Контроль использования ресурсов подсистемы хранения данных производится с использованием следующих интерфейсов:

  • Выделенный интерфейс веб-администрирования Р-Хранилище;
  • Интерфейс командной строки любого сервера, участвующего в Р-Хранилище.

Использование веб-интерфейса

Мониторинг подсистемы хранения данных должен производиться из отдельной консоли управления и мониторинга. Получить доступ к данной консоли можно в веб-интерфейсе Р-Управление путем нажатия кнопки в левом боковом меню “Хранилище”.

Для просмотра сводной информации по всем основным показателям кластера хранения необходимо использовать вкладку “Сводка” которая открывается по умолчанию. Данная страница поделена на блоки (виджеты) перенастроенной конфигурации. Изменение расположения и типа блоков не поддерживается. На странице представлены следующие блоки:

  • “Физическое пространство” - в данном виджете выводится информация о фактически занятом на накопителях кластера “сыром” дисковом пространстве (RAW). Круговая диаграмма показывает процент расхода физической емкости кластера хранения.
  • “Логическое пространство” - данный виджет предоставляет сведения об размеченном логическом пространстве и суммарной лицензионной емкости системы. Круговая диаграмма показывает процент расхода лицензионной емкости.
  • “Фрагменты” - состояние фрагментов (chunks) данных системы хранения. Все данные на системе хранения данных делятся на фрагменты, защита от выхода из строя дисков СХД производится на уровне фрагмента данных, например путем создания одной или нескольких копий указанного фрагмента. Данный виджет отображает информацию о сбойных фрагментах и производительности служебных операций по восстановлению целевого состояния.
  • “Чтение” и “Запись” отображают историческую сводку нагрузки на систему хранения данных в МБ/сек и числе операций ввода-вывода в секунду (IOPS) за прошедшие сутки.
  • “Сервисы” отображает состояние дисков в системе хранения данных. Для каждого диска создается отдельный сервис в системе. Отображаются сервисы метаданных и сервисы хранения.

Ресурсы отдельного сервера

Для просмотра параметров работы отдельного сервера необходимо перейти в раздел “Серверы” в боковом меню. В данном разрезе отображаются все серверы, которые входят в кластер системы хранения данных. Серверы сгруппированы по состоянию:

  • Исправен
  • Нет подключения
  • Без назначения
  • Не исправен

Для просмотра параметров требуемого сервера необходимо нажать на карточку с названием сервера.

Данная страница поделена на блоки (виджеты) перенастроенной конфигурации. Изменение расположения и типа блоков не поддерживается. На странице представлены следующие блоки:

  • Вычислительные ресурсы сервера, включая сведения о процессоре и оперативной памяти сервера а также их использовании за последние 12 часов.
  • “ДИСКИ” - данный виджет позволяет перейти к управлению каждым диском в отдельности и выводит сводную информацию по показателям чтения и записи всех дисков системы. Для перехода в раздел управления и мониторинга отдельными дисками необходимо нажать на название виджета “ДИСКИ”.
  • “СЕТЬ” - данный виджет позволяет перейти к параметрам настройки сетевых интерфейсов и выводит сводную информацию по показателям пропускной способности сети сервера. Для перехода в раздел управления и мониторинга отдельными сетевыми интерфейсами необходимо нажать на название виджета “СЕТЬ”.

Сведения о дисках сервера

Раздел ““Серверы - Имя сервера - Диски” выводит таблицу о дисках, которыми оснащен сервер и их ролью. Для просмотра детальной информации по каждому диску необходимо установить отметку на диске и нажать кнопку “Детали” в боковом меню.

Раздел “Сведения о диске” выводит основную справочную информацию по накопителю.

Для просмотра графика производительности отдельного накопителя необходимо установить отметку на требуемой строке таблицы и нажать кнопку “Производительность” в боковом меню.

Данный раздел выводит графики чтения и записи на указанный диск в МБ/сек и IOPS.

Сведения о сети сервера

Раздел “Серверы - Имя сервера - Сеть” выводит таблицу о сетевых интерфейсах, которыми оснащен сервер и их ролью в кластере хранения.

Для просмотра детальной информации по каждому интерфейсу необходимо установить отметку на требуемой строке таблицы и нажать кнопку “Детали” в боковом меню.

Данный раздел выводит информацию об основных параметрах сетевого интерфейса.

Для просмотра графика сетевой активности по каждому интерфейсу необходимо установить отметку на требуемой строке таблицы и нажать кнопку “Производительность” в боковом меню.

Данный раздел выводит графики приема и передачи данных по указанному интерфейсу а также объем ошибок в сетевых пакетах.

Использование интерфейса командной строки

Мониторинг кластера системы хранения данных с использованием командной строки должен производиться с сервера, который входит в кластер. Мониторинг должен производиться командой

vstorage -c <cluster_name> top

где <cluster_name> имя кластера хранения.

Для получения доступных кластеров хранения необходимо воспользоваться командой

 vstorage discover

Интерактивный вывод команды top представлен на рисунке ниже.

Интерфейс поддерживает переход в режим более детального представления информации, для этого необходимо:

  • Нажать клавишу с, чтобы отобразить список всех сервисов хранения;
  • Нажать клавишу m, чтобы отобразить список сервисов метаданных;
  • Нажать клавишу v, чтобы отобразить дополнительную информацию о кластере;
  • Нажать клавишу h, чтобы получить список доступных команд;
  • Нажать клавишу a, чтобы вернуться на главный экран;
Общая информация о кластере
Состояние сервисов метаданных
Состояние сервисов хранения
Информация о подключенных клиентах кластера
Журнал событий

Получение общей информации о кластере хранения

Раздел “Общая информация о кластере” предоставляет следующую информацию:

  • Поле Cluster может принимать следующие значения:
    • healthy - Все сервисы кластера работают в штатном режиме;
    • unknown - Состояние кластера не известно, информация не поступает;
    • degraded - Не критичный сбой сервисов фрагментов;
    • failure - Критичное состояние, вызванное большим количеством сбойных сервисов хранения (потерянных дисков). Автоматическая репликация блоков данных приостановлена;
    • SMART warning - Один или несколько физических дисков сигнализируют о наличии ошибок;
  • Поле Space выводит информацию по следующим показателям:
    • allocatable - выводит фактически доступное для виртуальных пространство с учетом выбранной технологии защиты данных и лицензионного ограничения.
    • free – Сырое свободное дисковое пространство в кластере
  • Поле MDS nodes - выводит информацию о числе работающих сервисов метаданных в сравнении с общим числом сервисов метаданных, настроенных для кластера.
  • Поле CS nodes - выводит информацию о числе работающих сервисов хранения в сравнении с целевым показателем кластера. В скобках выводится следующая информация:
    • avail - Число активных сервисов хранения, которые в данный момент запущены и работают в кластере.
    • inactive - Число неактивных сервисов хранения, которые временно не работают (сервис хранения отмечается как inactive в течение первых 5 минут недоступности)
    • offline - Число выключенных сервисов хранения, которые не работают более 5 минут (сервис хранения изменяется статус на offline после 5 минут недоступности). После изменения статуса на offline кластер начинает реплицировать данные, чтобы сохранить те фрагменты, которые хранились на выключенном сервисе хранения.
  • Поле License - выводит статус лицензии, дату окончания срока действия (при наличии), лицензированную емкость и использованную.
  • Поле Replication - выводит информацию о настройках репликации. Нормальное число реплик фрагментов и ограничение, достигнув которое фрагмент блокируется до восстановления.
  • Поле Chunks - выводит информацию о состоянии каждого фрагмента данных:
    • healthy - имеют достаточное число активных реплик;
    • replicating - в данный момент создаются реплики.
    • offline - Процентное отношение фрагментов, которые не имеют активных реплик.
    • void - Процентное отношение фрагментов, которые имеют одну или несколько реплик с неясным статусом.
    • pending - Процентное отношение фрагментов, которые должны быть реплицированы в первую очередь, так как все операции с данными фрагментами приостановлены и клиент ожидает завершения репликации.
    • blocked - Процентное отношение фрагментов, число реплик у которых равно или меньше минимального числареплик. Операции записи для данных фрагментов запрещены.
    • urgent - Процентное отношение фрагментов, число реплик у которых приближается к минимальному числу реплик.
    • degraded - Процентное отношение фрагментов, которые не имеют достаточного числа активных реплик.
    • standby - Процентное отношение фрагментов, которые имеют одну или несколько реплик в состоянии ожидания.Реплика имеет статус ожидания, если она неактивна более 5 минут.
    • overcommitted - Процентное отношение фрагментов, которые превысили число реплик.

Получение сведений о сервисах метаданных

MDSID STATUS   %CTIME   COMMITS   %CPU    MEM   UPTIME HOST
    7 avail      0.0%       5/s   0.2%   340m  24d  4h 10.0.0.103:2510
M   3 avail      0.1%       6/s   0.6%   341m  24d  4h 10.0.0.104:2510
    1 avail      0.1%       5/s   0.4%   340m  24d  4h rvirt02:2510
  • MDSID - Идентификатор сервиса метаданных. Буква M слева от идентификатора указывает на строку с Master-сервером;
  • STATUS - Состояние сервиса;
  • %CTIME - Процент времени затраченного сервисом за работу с данными;
  • COMMITS - Частота “сброса” данных;
  • %CPU - Процент времени использования ЦП;
  • MEM - Объем физической памяти, используемой сервисом;
  • UPTIME - Время с момента запуска сервиса;
  • HOST - IP адрес или доменное имя физического сервера, на котором запущен сервис.

Получение сведений о сервисах хранения

  CSID STATUS       SPACE  AVAIL REPLICAS   UNIQUE IOWAIT IOLAT(ms) QDEPTH HOST
  1045 active      1.07TB 799.1G     1057        6     0%    0.04/0    0.0 rvirt03
  1046 active      1.07TB 796.4G     1062        5     0%    0.04/0    0.0 rvirt03
  1047 active      1.07TB 786.2G     1128        7     0%    0.03/0    0.0 rvirt03
  1048 active      1.07TB 784.4G     1098        7     0%    0.04/0    0.0 rvirt03
  1033 active      1.07TB 815.0G      993       14     0%    0.03/0    0.0 rvirt04
  1034 active      1.07TB 814.9G      992       16     0%    0.01/0    0.0 rvirt04
  1035 active      1.07TB 814.8G      994       16     0%    0.05/0    0.0 rvirt04
  1036 active      1.07TB 815.6G      998       16     0%    0.04/0    0.0 rvirt04
  1025 active      1.07TB 982.5G      281       17     0%    0.04/0    0.0 rvirt02
  1026 active      1.07TB 982.4G      287       17     0%    0.03/0    0.0 rvirt02
  1027 active      1.07TB 980.1G      281       19     0%    0.03/0    0.0 rvirt02
  1028 active      1.07TB 982.0G      283       17     0%    0.02/0    0.0 rvirt02
  • CSID - Идентификатор сервиса хранения;
  • STATUS - Статус сервиса (см. описание значений выше);
  • SPACE - Объем дисковой емкости сервиса;
  • AVAIL - Свободная дисковая емкость сервиса;
  • REPLICAS - Количество копий фрагментов сохраненных на данном сервисе;
  • UNIQUE - Количество уникальных фрагментов сохраненных на данном сервисе;
  • IOWAIT - Процент времени затраченного на ожидание завершения записи на диск каждой операции;
  • IOLAT(ms) - Среднее / Максимальное время ожидания записи на данный сервис за последние 20 секунд;
  • QDEPTH - Средняя длинна очереди;
  • HOST - IP адрес или доменное имя физического сервера, на котором запущен сервис.

Получение сведений о клиентах СХД

    CLID   LEASES     READ    WRITE     RD_OPS     WR_OPS     FSYNCS IOLAT(ms) HOST
    6197      1/1   13KB/s   84KB/s     3ops/s     7ops/s     1ops/s    0.03/1 rvirt04
    6196      0/2     0B/s   68KB/s     0ops/s     5ops/s     2ops/s    0.05/1 rvirt03
    6193      0/4   204B/s   11KB/s     0ops/s     1ops/s     0ops/s    0.03/0 rvirt02
    6201      0/0     0B/s     0B/s     0ops/s     0ops/s     0ops/s       0/0 rvirt03
    6200      0/0     0B/s     0B/s     0ops/s     0ops/s     0ops/s       0/0 rvirt04
    6195      0/1     0B/s     0B/s     0ops/s     0ops/s     0ops/s       0/0 rvirt02

  • CLID - Идентификатор клиента;
  • LEASES - Среднее количество открытых файлов на чтение и запись за последние 20 секунд;
  • READ - Средняя пропускная способность чтения за последние 20 секунд;
  • WRITE - Средняя пропускная способность записи за последние 20 секунд;
  • RD_OPS - Среднее число операций чтения за последние 20 секунд;
  • WR_OPS - Среднее число операций записи за последние 20 секунд;
  • FSYNCS - Среднее число операций SYNC (сброса данных на диск из кэша) за последние 20 секунд;
  • IOLAT(ms) - Среднее / Максимальное время ожидания записи на данный сервис за последние 20 секунд;
  • HOST- IP адрес или доменное имя физического сервера, на котором запущен сервис.