Skip to content

Мониторинг состояния кластера и реакция на это ОС

Мониторинг состояния кластера и реакция на это ОС

Мониторинг состояния кластера должен проходить в автоматическом режиме. При наличии инциндентов ОС "Мегаполос" в большинстве случаев принимает решения сама.

Мониторинг состояния операционной системы и управляемого ею кластера происходит постоянно.

Мониторинг производится Prometeus.

Список инциндентов

  1. Увелинение нагрузки по определенному внешнему ip.
  2. Увеличение нагрузки на конкретный контейнер.
  3. Увеличение нагрузки на узел.
  4. Увеличение нагрузки на устройства
  5. Отказ устройства
  6. Паение контейнера

Список действий которые предпринимает ОС

  1. Перераспределить контейнеры по узлам
  2. Отключить контейнеры с низким приоритетом
  3. Заблокировать внешние порты
  4. Если есть доступ к настройкам "облака", то запросить увеличение ресурсов.

реагирование на изменение состояние параметров системы

  1. Prometeus непрерывно считывает состояние различных систем кластера
  2. При возникновении нештатной систуации Prometeus алерт
  3. Алерт вызывает API операционной системы и может сделать следущее
  4. изменяет настройки ОС
  5. удаляет контейнер