Мониторинг состояния кластера и реакция на это ОС
Мониторинг состояния кластера и реакция на это ОС
Мониторинг состояния кластера должен проходить в автоматическом режиме. При наличии инциндентов ОС "Мегаполос" в большинстве случаев принимает решения сама.
Мониторинг состояния операционной системы и управляемого ею кластера происходит постоянно.
Мониторинг производится Prometeus.
Список инциндентов
- Увелинение нагрузки по определенному внешнему ip.
- Увеличение нагрузки на конкретный контейнер.
- Увеличение нагрузки на узел.
- Увеличение нагрузки на устройства
- Отказ устройства
- Паение контейнера
Список действий которые предпринимает ОС
- Перераспределить контейнеры по узлам
- Отключить контейнеры с низким приоритетом
- Заблокировать внешние порты
- Если есть доступ к настройкам "облака", то запросить увеличение ресурсов.
реагирование на изменение состояние параметров системы
- Prometeus непрерывно считывает состояние различных систем кластера
- При возникновении нештатной систуации Prometeus алерт
- Алерт вызывает API операционной системы и может сделать следущее
- изменяет настройки ОС
- удаляет контейнер