Tag Archives: monitoring

Prometheus: AWS EC2 service discovery

11 June 2018
 

 Для чего нам нужен EC2 service discovery? В первую очередь – что бы избежать необходимости открывать порт на Application Load Balancer и гонять трафик “через мир”. Т.е. вместо того, что бы в конфиге Prometheus указывать статичный URL и URI, типа mainhost.domain.tld/metrics, который был бы направлен на AWS ALB, у которого было бы правило форвардить URI /metrics… Read More »

AWS: CloudWatch unified agent – сбор метрик и логов с EC2 и Ansible роль для него

7 June 2018
 

 В дополнение к посту AWS: CloudWatch logs – сбор и мониторинг логов, где сбор логов выполнялся старым агентом – пример использования нового агента, который собирать и метрики инстанса, и логи. Для работы агента – ЕС2 требуется подключенная роль CloudWatchAgentServerPolicy, создание описано тут>>>. Пост кратенький, просто пример установки и запуска. Установка CloudWatch unified агента Устанавливаем unzip: Загружаем архив… Read More »

Prometehus: обзор – federation, мониторинг Docker Swarm и настройки Alertmanager

9 April 2018
 

 Задача – настроить Proof of Concept мониторинга, используя Prometheus, что бы показать основные его возможности. Используется Prometheus 2.2.1 (между 1.* и 2.* существенные различия в синтаксисе). Чего не добавлено в этот пост – это работа с Prometheus API, и хотелось подробнее остановиться на Grafana и её шаблонах, но уже отдельным постом. Кроме того, в самом тексте… Read More »

Prometheus: мониторинг Azure VMSS с node_exporter и Docker контейнеров в Docker Swarm с cAdvisor

17 March 2018
 

 В продолжение постов о развёртывании Prometheus для мониторинга проекта в Azure (привет, Azure, давно не виделись! см. Azure: почему никогда). Спустя три месяца – проект решил, что мониторинг им всё-таки нужен, и меня “вернули”. Посты по теме: полное описание самого проекта описание установки Prometheus сервера Остановился я на добавлении к Prometheus серверу виртуальных машин из… Read More »

NGINX: Amplify – SaaS мониторинг от NGINX

23 January 2018
 

 NGINX Amplify – сервис для полноценного мониторинга NGINX и его рабочего окружения. Умеет рисовать графики, отправлять уведомления о проблемах и даже подсказывать некорректные настройки хостов. Суть работы весьма простая: регистрируемся на сайте сервиса, устанавливаем Amplify агент, получаем данные. Бесплатен с определёнными ограничениями (5 агентов, 10 алертов и т.д.). На момент написания был доступен для Amazon Linux,… Read More »

Prometheus: exporter_proxy – мониторинг сервисов в приватной сети

11 December 2017
 

 Есть рабочее окружение, которое включает в себя две VMSS с Docker Swarm – на одной работают swarm-managers, на второй – swarm-workers: В Master группе работает виртуальная машина с одним менеджером, в Nodes/Workers – три ВМ с воркерами. Master находятся за одним Load Balancer, Nodes – за вторым. Задача – собирать метрики со всех виртуальных машин.… Read More »

Prometheus: запуск сервера с Alertmanager, cAdvisor и Grafana

7 December 2017
 

 Пример установки и настройки минимального мониторинга, чисто ознакомительного. Используем Pormetheus для сбора метрик, Alertmanager для отправки сообщений о проблемах, cAdvisor для сбора метрик из Docker, node-exporter для сбора метрик с виртуальной машины и Grafana – для визуализации собранных данных, а запускать всё будем из Docker Compose. Все получившиеся в результате конфиги можно посмотреть в репозитории.

Prometheus: мониторинг – введение, установка, запуск, примеры

18 September 2017
 

 Prometheus – open-source система мониторинга, изначально разработанная в SoundCloud в 2012, публичный релиз состоялся в 2015. Сам Prometheus написан большей частью на Go, компоненты связываются по HTTP. Для визуализации имеет собственные графики, но может работать с системами типа Grafana (о ней позже, тоже будем применять). Данные хранит локально, в собственной TSDB базе, индексы хранятся в LevelDB.… Read More »

Monit: мониторинг и перезапуск NGINX

11 August 2017
 

 Домашняя страница проекта – тут>>>, документация – тут>>>. Имеется сервис с двумя виртуальными машинами в Azure VMSS. Если для Dev ещё можно использовать решение типа C: “мониторинг” NGINX с помощью AF_INET, то для Production – используем Monit. Пример тестовой установки в NGINX в Vagrant-боксе.

C: “мониторинг” NGINX с помощью AF_INET

8 August 2017
 

 В продакшене мы будем использовать что-то вроде Monit, а для Dev – решил написать маленькую утилиту, которая проверяет доступность NGINX и отправляет письмо при проблемах. Программа содержит две рабочие функции – socket_get(), которая с помощью connect()  пытается подключиться к порту NGINX (AF_INET сокету), и send_alarm(), которая с помощью system() выполняет mailx для отправки сообщений. Отправку… Read More »