Архив рубрики: Monitoring

Мониторинг серверов, сетей и оборудования

Kubernetes: мониторинг стоимости кластера — Kubernetes Resource Report и Kubecost
0 (0)

23 января 2023

Очень полезное дело — мониторить то, насколько эффективно используется кластер, особенно, если приложения деплоятся девелоперами, которые не сильно вникают в requests, и устанавливают завышенные значения «про запас». Запас, конечно, нужен — но и просто так реквестить ресурсы идея плохая. К примеру, у вас есть WorkerNode у которой 4 vCPU (4.000 milicpu) и 16 GB RAM,… Читать далее »

Grafana Loki: алерты с Ruler и labels из логов
0 (0)

15 декабря 2022

Пока пост по архитектуре и запуску Loki ещё в черновиках — посмотрим, как в Loki создавать алерты, за которые отвечает сервис ruler. Документация по алертам в Loki — Rules and the Ruler. Идея простая: создаём файл с алертами в Prometheus-like формате подключаем его к ruler ruler парсит логи по заданным в конфиге выражениям, и пушит… Читать далее »

PostgreSQL: запуск в Kubernetes з PostgreSQL Operator и мониторинг с Prometheus
0 (0)

5 октября 2022

Итак, Друид мы запустили. Apache Druid: обзор, запуск в Kubernetes и мониторинг с Prometheus . Пока что в дефолтном виде, то есть в роли сторейджа для метаданных используется локальная база Apache Derby . Дальше будем переключать Друид на PostgreSQL, еще позже – убирать оттуда ZooKeeper. Ну а для начала – запустим кластер PostgreSQL в Kubernetes, добавим PostgreSQL Exporter для Promethues и настроим сбор метрик.… Читать далее »

Apache Druid: обзор, запуск в Kubernetes и мониторинг с Prometheus
0 (0)

14 сентября 2022

Apache Druid — колоночная база данных, ориентированная на работу с большими объемами данных, сочетающая в себе возможности и преимущества Time-Series Database, Data Warehouse и поисковой системы. Общая задача — настроить мониторинг кластера Druid в Kubernetes, для чего сначала посмотрим что это вообще такое и как оно всё работает, а затем запустим Друид и потрогаем его… Читать далее »

AWS: VPC Flow Logs — описание и пример с CloudWatch Logs Insights
0 (0)

9 июня 2022

AWS VPC Flow Logs позволяет логгировать инфомрацию о трафике между сетевыми интерфейсами в VPC. Далее, эти логи могут быть сохранены в AWS S3 или отправлены в AWS CloudWatch Logs, при этом включение логгирования трафика никак не виляет на производительность работы сетевого интерфейса. Кратко рассмотрим основные понятия, доступные настройки и настроим Flow Logs для VPC с… Читать далее »

Elastic Stack: обзор и установка ELK на Ubuntu
0 (0)

28 января 2022

Последний раз ELK трогал (oh, my!) 7 лет тому, см. ELK: установка Elasticsearch+Logstash+Kibana на CentOS. Сейчас активно используем Logz.io, но расходы всё растут, и понемногу начинаем смотреть в сторону self-hosted ELK для запуска в Kubernetes, а потому надо поднять такой себе Proof of concept, дабы вспомнить с чем его едят и как настраивают. Собственно, в… Читать далее »

Prometheus: мониторинг сети с node_exporter — метрики сети CloudWatch и Docker —net=host
0 (0)

16 декабря 2021

Начал обновлять дашборды в Grafana, и столкнулся с двумя интересными вещами. Первое — что же на самом деле показывается в CloudWatch для сети в графиках NetworkIn/Out (Bytes), как эти данные правильно интерпретировать, и как данные CloudWatch коррелируют с данными самого node_exporter? Второе — почему node_exporter должен быть запущен именно в режиме host network mode? Сначала… Читать далее »

Prometheus: мониторинг AWS Load Balancer Controller Controller в AWS EKS
0 (0)

10 декабря 2021

«Внезапно», но AWS ALB Controller умеет в метрики для Prometheus. Используем стандартный URI /metrics. Для начала — проверим, что метрики в поде есть. Находим под: [simterm] $ kk -n kube-system get pod | grep aws aws-load-balancer-controller-7bdcf75789-wk4bt 1/1 Running 0 41h [/simterm] Пробрасываем на него порт: [simterm] $ kk port-forward -n kube-system pods/aws-load-balancer-controller-7bdcf75789-wk4bt 8080:8080 Forwarding from… Читать далее »

Prometheus: Recording Rules и теги — разделяем алерты в Slack
0 (0)

26 ноября 2021

С 2018 года используем Opsgenie, который получает алерты от Prometheus, CloudWatch и Uptrends, которые потом через Slack-интеграцию отправляет нам в Slack. Интеграции Slack на данный момент выглядят так: В каждой из них настроен фильтр по уровню важности, например интеграция P1, P2 > Slack #devops-alarms-warning: Но есть проблема: так как каналы получаются общие, то все алерты… Читать далее »

AWS: Trusted Advisor, часть 2 — алерты CloudWatch и уведомления в Slack
0 (0)

25 ноября 2021

В продолжение темы по работе с AWS TrustedAdvisor — рассмотрим настройку отправки уведомлений и обновление данных в Trusted Advisor. Начало — AWS: Trusted Advisor, часть 1 — обзор возможностей. Что бы настроить уведомления — используем метрики Trusted Advisor, которые он шлёт в CloudWatch, см. список на странице Trusted Advisor metrics and dimensions. Далее, CloudWatch будет… Читать далее »

Апрель 2026
Пн	Вт	Ср	Чт	Пт	Сб	Вс
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30