После добавления мониторинга Cassandra – Nagios периодически сообщает об ошибке:
Jul 16 08:17:55 ip-172-***-***-101 nagios: SERVICE ALERT: rdss.pp.domain.com;Cassandra service;CRITICAL;SOFT;1;CHECK_NRPE: Socket timeout after 10 seconds.
Которое выглядит так:
Для устранения ошибки – достаточно увеличить таймаут.
В файле, где описана сама команда (например – /usr/local/nagios/etc/objects/commands.cf
) – добавьте к ней опцию -t
с указанием времени в секундах:
define command{ command_name check_cassandra_cluster command_line $USER1$/check_nrpe -H $HOSTNAME$ -c check_cassandra_cluster -a '-H $ARG1$ -P $ARG2$ -w $ARG3$ -c $ARG4$' -t 20 }
Перезапускаем Nagios:
# service nagios restart Running configuration check... Stopping nagios:. done. Starting nagios: done.
Готово.