Gestion des alertes par courriers électroniques
Il est possible d'activer des alertes par courriers électroniques pour un groupe de serveurs et de désactiver des alertes pour un agent ou un serveur donné. Par défaut, les alertes sont activées sur tous les serveurs.
Alertes par courrier électronique
Le serveur Zéphir intègre la possibilité d'envoyer un courrier électronique quand un problème est détecté sur un des serveurs qu'il gère.
Les différents types d'erreurs possibles sont les suivants :
- remontée par le serveur d'une erreur sur un de ses services (DNS, Apache, ...) ou un problème système ;
- un serveur n'a pas contacté le serveur Zéphir depuis un certain temps (délai limite configurable pour chaque serveur) ;
- une opération s'est mal déroulée sur le serveur (mise à jour, sauvegarde, ...).
Pour recevoir des courriers électroniques d'alerte, il faut :
- avoir renseigné votre adresse électronique et coché la case
activation du mail
dansVos préférences
depuis la page d'accueil
;
- sélectionner un groupe de serveurs dans l'onglet
serveurs
/Gérer les groupes enregistrés de serveurs
- éditer éventuellement
le groupe avec le bouton
(éditer)
pour enlever les serveurs non désirés - sinon cocher la case
Surveiller
dans la ligne du groupe à surveiller puis cliquer sur le boutonModifier
pour valider ce choix ;
Vous recevrez un courrier électronique en cas de problème sur un serveur et un autre lorsque le serveur retrouvera son état normal.
Les groupes surveillés apparaissent sur la page d'accueil de l'application.
Désactivation des alertes pour un agent ou un serveur donné
Il est possible d'indiquer une liste d'agents qui ne déclencheront pas d'alerte s'ils sont en erreur. Pour cela, il faut créer un fichier /var/lib/zephir/data/ignore_list
sur le serveur Zéphir et ajouter un nom d'agent par ligne.
Exemple
Les erreurs sur l'application des patches et sur les services distants ne seront pas prises en compte dans l'état global des serveurs si le fichier /var/lib/zephir/data/ignore_list
contient :
patches
web
Les agents existants par défaut sont :
network ;
web ;
tcpservices ;
rvp ;
nut ;
sysinfo ;
diskspace ;
netstats ;
patches ;
squid-stats ;
conn ;
vir ;
config ;
annuaire ;
printers ;
eximstats.
Il est possible de mettre ce fichier dans le répertoire /usr/share/zephir/monitor/stats/
sur les serveurs EOLE enregistrés.
Ce fichier sera remonté et pris en compte par le serveur Zéphir pour le serveur enregistré en question (il peut être distribué comme fichier divers dans une variante Zéphir).
Remarque
Cela peut être utile dans le cas d'un serveur qui présente régulièrement des problèmes (mauvaise connexion , mémoire limitée ...), afin d'éviter des alertes inutiles.
On peut empêcher un serveur de générer des alertes en passant le paramètre Désactiver les alertes pour ce serveur
à oui
dans la fiche du serveur (État actuel du serveur
) / Description du serveur
.
Ce paramètre peut également être modifié sur tous les serveurs d'un groupe de la façon suivante :
- Sélectionner un groupe de serveurs ;
- Utiliser le lien
Actions sur le groupe de serveurs
sur la pageListe des Serveurs sélectionnés
ou utiliser le lienagir sur le groupe
dans le menu de gauche ; - Utiliser l'action
Modifier un paramètre sur le groupe
en bas de page ; - Cliquer sur
Désactiver les alertes
;
Remarque
Cela peut être utile dans le cas d'un serveur de test.
Truc & astuce
Lors de la Sélection d'un groupe de serveurs
, il est possible de choisir le Blocage des alertes
comme critère de sélection.