Gestion des alertes par courriers électroniques

Il est possible d'activer des alertes par courriers électroniques pour un groupe de serveurs et de désactiver des alertes pour un agent ou un serveur donné. Par défaut, les alertes sont activées sur tous les serveurs.

Alertes par courrier électronique

Le serveur Zéphir intègre la possibilité d'envoyer un courrier électronique quand un problème est détecté sur un des serveurs qu'il gère.

Les différents types d'erreurs possibles sont les suivants :

  • remontée par le serveur d'une erreur sur un de ses services (DNS, Apache, ...) ou un problème système ;
  • un serveur n'a pas contacté le serveur Zéphir depuis un certain temps (délai limite configurable pour chaque serveur) ;
  • une opération s'est mal déroulée sur le serveur (mise à jour, sauvegarde, ...).

Pour recevoir des courriers électroniques d'alerte, il faut :

  • avoir renseigné votre adresse électronique et coché la case activation du mail dans Vos préférences depuis la page d'accueil ;
  • sélectionner un groupe de serveurs dans l'onglet serveurs / Gérer les groupes enregistrés de serveurs
  • éditer éventuellement le groupe avec le bouton (éditer) pour enlever les serveurs non désirés
  • sinon cocher la case Surveiller dans la ligne du groupe à surveiller puis cliquer sur le bouton Modifier pour valider ce choix ;

Vous recevrez un courrier électronique en cas de problème sur un serveur et un autre lorsque le serveur retrouvera son état normal.

Exemple d'alerte mail
Exemple d'alerte mail

Les groupes surveillés apparaissent sur la page d'accueil de l'application.

Désactivation des alertes pour un agent ou un serveur donné

Il est possible d'indiquer une liste d'agents qui ne déclencheront pas d'alerte s'ils sont en erreur. Pour cela, il faut créer un fichier /var/lib/zephir/data/ignore_list sur le serveur Zéphir et ajouter un nom d'agent par ligne.

Exemple

Les erreurs sur l'application des patches et sur les services distants ne seront pas prises en compte dans l'état global des serveurs si le fichier /var/lib/zephir/data/ignore_list contient :

patches

web

Les agents existants par défaut sont :

  • network ;

  • web ;

  • tcpservices ;

  • rvp ;

  • nut ;

  • sysinfo ;

  • diskspace ;

  • netstats ;

  • patches ;

  • squid-stats ;

  • conn ;

  • vir ;

  • config ;

  • annuaire ;

  • printers ;

  • eximstats.

Il est possible de mettre ce fichier dans le répertoire /usr/share/zephir/monitor/stats/ sur les serveurs EOLE enregistrés.

Ce fichier sera remonté et pris en compte par le serveur Zéphir pour le serveur enregistré en question (il peut être distribué comme fichier divers dans une variante Zéphir).

Remarque

Cela peut être utile dans le cas d'un serveur qui présente régulièrement des problèmes (mauvaise connexion , mémoire limitée ...), afin d'éviter des alertes inutiles.

On peut empêcher un serveur de générer des alertes en passant le paramètre Désactiver les alertes pour ce serveur à oui dans la fiche du serveur (État actuel du serveur) / Description du serveur.

Ce paramètre peut également être modifié sur tous les serveurs d'un groupe de la façon suivante :

  • Sélectionner un groupe de serveurs ;
  • Utiliser le lien Actions sur le groupe de serveurs sur la page Liste des Serveurs sélectionnés ou utiliser le lien agir sur le groupe dans le menu de gauche ;
  • Utiliser l'action Modifier un paramètre sur le groupe en bas de page ;
  • Cliquer sur Désactiver les alertes ;

Remarque

Cela peut être utile dans le cas d'un serveur de test.

Truc & astuce

Lors de la Sélection d'un groupe de serveurs, il est possible de choisir le Blocage des alertes comme critère de sélection.