check_cpq - Utilizzo
Una volta scaricato ed installato lo script come definito nella sezione donwload è possibile configurare il plugin come segue:
define command{
command_name check_hp
command_line <path>/check_cpq --server $HOSTADDRESS$ --community $ARG1$ --device=$ARG2$
}
A questo punto l'uso all'interno di un host è il seguente:
define service{
use tFarmNetwork
host_name HOSTNAME
service_description FAN
is_volatile 0
max_check_attempts 1
normal_check_interval 5
retry_check_interval 1
check_command check_hp!community!FAN
}
Si può definire un servizio per ogni tipo di verifica che il plugin può effettuare e cioè:
- Apparato SERVER (DL/ML)
- FAN: verifica dello stato di salute delle ventole, allarmistica su eventuali cali di velocità o guasto
- PSU: verifica dello stato di salute degli alimentatori, ovviamente solo se ridondati
- CPU: stato di salute delle CPU
- TEMP: temperature rilevate all'interno della macchina, ambientali e sulle CPU
- LDEV: stato di funzionamento dei device logici, ad esempio stato di ridondanza di un RAID5 o RAID1
- PDEV: stato di salute dei singoli dischi facenti parte ad esempio di un raidgroup, in associazione a LDEV restituisce la posizione del disco danneggiato
- HEALT: restituisce la lista del messaggi non in stato RECOVERED sul log IML della macchina, in caso di riparazione di un guasto non rilevato da IML è necessario tramite hpimlview, bios oppure ILO cancellare il log rimasto per errore
- Apparato BLADE
- BLADE-FAN: verifica dello stato di salute delle ventole, allarmistica su eventuali cali di velocità o guasto
- BLADE-PSU: verifica dello stato di salute degli alimentatori, ovviamente solo se ridondati
Tipici esempi di output del plugin sono:
server:~# /usr/lib/nagios/plugins/check_cpq -c <community> -s <blade-name> -d BLADE-PSU
OK: <blade-name> status is [1 is ok] [2 is ok] [3 is ok] [4 is ok] [5 is ok] [6 is ok]
server:~# /usr/lib/nagios/plugins/check_cpq -c <community> -s <server-name> -d CPU
OK: <server-name> status is [0 is ok] [1 is ok]
server:~# /usr/lib/nagios/plugins/check_cpq -c <community> -s <server-name> -d HEALTH
CRIT: <server-name> status is [POST Error: 1785-Drive Array not Configured]