check_cpq - Utilizzo

Una volta scaricato ed installato lo script come definito nella sezione donwload è possibile configurare il plugin come segue:

define command{
  command_name    check_hp
  command_line    <path>/check_cpq --server $HOSTADDRESS$ --community $ARG1$ --device=$ARG2$
        }

A questo punto l'uso all'interno di un host è il seguente:

define service{
        use                     tFarmNetwork
        host_name               HOSTNAME
        service_description     FAN
        is_volatile             0
        max_check_attempts      1
        normal_check_interval   5
        retry_check_interval    1
        check_command           check_hp!community!FAN
        }

Si può definire un servizio per ogni tipo di verifica che il plugin può effettuare e cioè:

  •     Apparato SERVER (DL/ML)
    • FAN: verifica dello stato di salute delle ventole, allarmistica su eventuali cali di velocità o guasto
    • PSU: verifica dello stato di salute degli alimentatori, ovviamente solo se ridondati
    • CPU: stato di salute delle CPU
    • TEMP: temperature rilevate all'interno della macchina, ambientali e sulle CPU
    • LDEV: stato di funzionamento dei device logici, ad esempio stato di ridondanza di un RAID5 o RAID1
    • PDEV: stato di salute dei singoli dischi facenti parte ad esempio di un raidgroup, in associazione a LDEV restituisce la posizione del disco danneggiato
    • HEALT: restituisce la lista del messaggi non in stato RECOVERED sul log IML della macchina, in caso di riparazione di un guasto non rilevato da IML è necessario tramite hpimlview, bios oppure ILO cancellare il log rimasto per errore
  •     Apparato BLADE
    • BLADE-FAN: verifica dello stato di salute delle ventole, allarmistica su eventuali cali di velocità o guasto
    • BLADE-PSU: verifica dello stato di salute degli alimentatori, ovviamente solo se ridondati

Tipici esempi di output del plugin sono:

server:~# /usr/lib/nagios/plugins/check_cpq -c <community> -s <blade-name> -d BLADE-PSU
OK: <blade-name> status is  [1 is ok] [2 is ok] [3 is ok] [4 is ok] [5 is ok] [6 is ok]
server:~# /usr/lib/nagios/plugins/check_cpq -c <community> -s <server-name> -d CPU
OK: <server-name> status is  [0 is ok] [1 is ok]
server:~# /usr/lib/nagios/plugins/check_cpq -c <community> -s <server-name> -d HEALTH
CRIT: <server-name> status is  [POST Error: 1785-Drive Array not Configured]