Архив рубрики: Monitoring

Мониторинг серверов, сетей и оборудования

Ansible: Prometheus provisioning — роли common, exim, nginx, logrotate и unattended-upgrades

14 мая 2018

Продолжение сетапа из AWS: создание стека в AWS – bash-скрипт и CloudFormation шаблон. Далее потребуется добавить Ansible playbook и роли для настройки хоста. В принципе — ничего особенно отличного от того, что описано в постах серии RTFM migration, например — Ansible: миграция RTFM 2.9 – монтирование EBS и настройка NGINX на Bastion. Что надо будет выполнить: добавить… Читать далее »

AWS: создание стека в AWS — bash-скрипт и CloudFormation шаблон

10 мая 2018

Задача — развернуть мониторинг Prometehus + Grafana в AWS (в противоположность Azure на предыдущем проекте…). Весь стек будет состоять из одного EC2, на котором будет NGINX + Prometheus + Grafana. Из экспортёров на хосте мониторинга будут node_exporter и blackbox_exporter, скорее всего ещё mysql_exporter — собирать метрики с MariaDB бекенда нашего приложения, и какие-то ещё. Но это… Читать далее »

Prometehus: обзор — federation, мониторинг Docker Swarm и настройки Alertmanager

9 апреля 2018

Задача — настроить Proof of Concept мониторинга, используя Prometheus, что бы показать основные его возможности. Используется Prometheus 2.2.1 (между 1.* и 2.* существенные различия в синтаксисе). Чего не добавлено в этот пост — это работа с Prometheus API, и хотелось подробнее остановиться на Grafana и её шаблонах, но уже отдельным постом. Кроме того, в самом тексте… Читать далее »

Prometheus: мониторинг Azure VMSS с node_exporter и Docker контейнеров в Docker Swarm с cAdvisor

17 марта 2018

В продолжение постов о развёртывании Prometheus для мониторинга проекта в Azure (привет, Azure, давно не виделись! см. Azure: почему никогда). Спустя три месяца — проект решил, что мониторинг им всё-таки нужен, и меня «вернули». Посты по теме: полное описание самого проекта описание установки Prometheus сервера Остановился я на добавлении к Prometheus серверу виртуальных машин из… Читать далее »

Ansible: миграция RTFM 2.8 — logrotate, unattended-upgrades и Let’s Encrypt для Bastion хоста

29 января 2018

Прыдущая часть — AWS: миграция RTFM 2.7 – CloudFormation и Ansible – наcтройка NAT (там же ссылки на предыдущие посты). В этой части продолжим настройку Bastion хоста. Задача — добавить: роль logrotate: ротация логов NGINX (в дальнейшем логи будут сбрасываться через CloudWatch Logs агента) роль unattended-upgrades: автоапдейты системы роль Let’s Encrypt: получение и обновление сертификатов для сайтов роль… Читать далее »

bash: проверка статуса Spamassassin

28 января 2018

На почтовом сервере начал падать Spamassassin. Сервер старый, причину на ночь глядя искать откровенно лень (думаю, падает во время выполнения /usr/bin/sa-learn в cron-задаче — по времени прихода уведомлений будет яснее), да и почта будет скоро переезжать на сервер в AWS, поближе к RTFM (сейчас работает на VPS в ДЦ Воля-Кабель), потому добавлю скрипт для быстрого «фикса». Суть… Читать далее »

NGINX: Amplify — SaaS мониторинг от NGINX

23 января 2018

NGINX Amplify — сервис для полноценного мониторинга NGINX и его рабочего окружения. Умеет рисовать графики, отправлять уведомления о проблемах и даже подсказывать некорректные настройки хостов. Суть работы весьма простая: регистрируемся на сайте сервиса, устанавливаем Amplify агент, получаем данные. Бесплатен с определёнными ограничениями (5 агентов, 10 алертов и т.д.). На момент написания был доступен для Amazon Linux,… Читать далее »

Prometheus: exporter_proxy — мониторинг сервисов в приватной сети

11 декабря 2017

Есть рабочее окружение, которое включает в себя две VMSS с Docker Swarm — на одной работают swarm-managers, на второй — swarm-workers: В Master группе работает виртуальная машина с одним менеджером, в Nodes/Workers — три ВМ с воркерами. Master находятся за одним Load Balancer, Nodes — за вторым. Задача — собирать метрики со всех виртуальных машин.… Читать далее »

Prometheus: запуск сервера с Alertmanager, cAdvisor и Grafana

7 декабря 2017

Пример установки и настройки минимального мониторинга, чисто ознакомительного. Используем Pormetheus для сбора метрик, Alertmanager для отправки сообщений о проблемах, cAdvisor для сбора метрик из Docker, node-exporter для сбора метрик с виртуальной машины и Grafana — для визуализации собранных данных, а запускать всё будем из Docker Compose. Все получившиеся в результате конфиги можно посмотреть в репозитории.

Prometheus: Ansible, NGINX и Grafana dashboard

23 октября 2017

Продолжаем с Prometheus… Последней задачей было Azure: подключение volume – ARM, Ansible и данные Prometheus. Теперь — добавим Grafana для визуализации данных. Надо — обновить docker-compose файл, добавить запуск контейнера с Grafana, и в самой Grafana — настроить backend, что бы она получала данные с Prometheus сервера. Кроме того — надо обновить NGINX (в нём в блоге не… Читать далее »