Qu'est-ce que la gestion des problèmes ITIL ?

La gestion des problèmes est l'ensemble des processus et activités en charge de gérer le cycle de vie de tous les problèmes qui peuvent se produire au sein d’un service informatique. Son objectif principal est d'éviter que des problèmes, et les incidents qui en résultent, surviennent. Pour les incidents qui se sont déjà produits, la gestion des problèmes a pour but d’éviter qu'ils se reproduisent ou, s'ils sont inévitables, à minimiser leur impact sur l'entreprise. Pour comprendre la gestion des problèmes, il est important comprendre ce qu'est un problème. L’ITIL définit un problème comme la cause d'un ou plusieurs incidents. En d’autres termes, un problème est une condition sous-jacente qui pourrait avoir des impacts négatifs sur le service et qui doit donc être traité. Les problèmes ont un cycle de vie qui débute lorsque le problème survient (souvent en raison d’un changement dans l'environnement). Ce cycle inclut l'identification et les étapes de diagnostic et de correction, et prend fin lorsque le problème est résolu, soit par une action mise en place, soit par la disparition de la situation sous-jacente.

La gestion de problèmes ITIL est à la fois un processus transactionnel consistant à gérer le cycle de vie d'un problème individuel et un processus de gestion du portefeuille consistant à déterminer les problèmes à traiter, les ressources à leur appliquer et les risques qu’ils font peser sur l'organisation. La gestion des problèmes comprend des activités requises visant à diagnostiquer la cause première des incidents et à déterminer les mesures appropriées à prendre en vue de la résolution. Elle est également responsable de veiller à ce que les résolutions soient implémentées de manière sûre et efficace, en conformité avec les politiques et procédures de gestion des changements et des mises en production.

La partie portefeuille de la gestion des problèmes est responsable de tenir à jour les informations relatives aux problèmes qui existent dans l'environnement, aux solutions de contournement qui ont pu être développées et aux solutions identifiées pour la résolution. Ces informations permettent aux responsables de prendre des décisions qui vont réduire le nombre et l'impact des incidents.

 

Le rôle du gestionnaire des problèmes

Les gestionnaire des problèmes gèrent le cycle de vie des problèmes et doivent veiller à la bonne compréhension de ceux-ci ainsi qu’à la mise en œuvre de mesures appropriées. Leur but est d'éviter que des incidents se produisent et de minimiser l’impact de ceux qui n'ont pas pu être évités. Les gestionnaires des problèmes sont souvent en lien avec le personnel en charge de la gestion des incidents et des ressources techniques afin de veiller à la saisie des données du diagnostic relatives aux incidents associés et aux conditions environnementales relatives au problème. Les gestionnaires des problèmes ont pour tâche d’effectuer une analyse de la cause première (RCA) afin d'aider l'organisation à identifier non seulement la raison pour laquelle un incident se produit, mais également quand et comment le problème sous-jacent est apparu dans l'environnement. L'analyse de la cause première a souvent pour résultat l'identification d'un certain nombre de résolutions alternatives, et le responsable des problèmes joue un rôle essentiel pour aider à qualifier les alternatives en termes de coûts, de bénéfices et de risques afin de fournir une recommandation aux responsables qui prennent les décisions. Il est fréquent que la transmission des actions de résolution à travers les différents processus de gestion des changements et des mises en production prenne un certain temps. Pendant ce temps, les gestionnaires des problèmes doivent veiller à ce que des ressources telles que la base de connaissances et la base de données des erreurs connues soient mises à jour afin de permettre au personnel en charge de la gestion des incidents de traiter efficacement tous les incidents ou demandes de service récurrents. Bien que la gestion des incidents et la gestion des problèmes soient des processus séparés, les gestionnaires des problèmes utiliseront généralement les mêmes outils et systèmes de codage des catégories, de l'impact et de la priorité que leurs collègues responsables des incidents, afin d’encourager une collaboration efficace entre les processus.

Une Gestion proactive des problèmes

La gestion des problèmes ITIL consiste en deux processus principaux :

La gestion proactive des problèmes vise à identifier les futurs incidents et à les empêcher de se reproduire en identifiant et en éliminant la cause première avant qu'elle génère des incidents qui affectent le service. L'analyse proactive des problèmes est largement influencée par les données générées par les capacités automatisées de surveillance, l'analyse des enregistrements des changements et l'utilisation de l'analyse de tendance. La gestion proactive des problèmes diffère de son pendant réactif, car elle traite ces trois domaines clés :


Solutions de contournement

La gestion des problèmes peut être un processus long et pendant qu'elle est en cours, l'organisation informatique doit continuer à fournir des services aux utilisateurs. Pour cela, l'un des outils/techniques les plus couramment utilisés par le personnel de la gestion des services est une solution de contournement. Les solutions de contournement sont des solutions temporaires qui visent à réduire ou à éliminer l’effet des problèmes connus et des problèmes pour lesquels une résolution complète n'est pas encore disponible. En effet, les causes sous-jacentes sont difficilement identifiables, des étapes de résolution n'ont pas encore été développées et l'organisation n'a pas encore mis en place de résolutions permanentes.

Les solutions de contournement ne corrigent pas la cause première d'un problème. Elles se contentent de traiter les symptômes et les effets. Des exemples courants de solutions de contournement incluent le redémarrage du serveur, la purge des caches de l'application ou l’utilisation d’un processus ou d’un système alternatif afin de mener l'activité commerciale. Les solutions de contournement peuvent être exécutées par le personnel de la gestion des incidents ou par les utilisateurs finaux et elles peuvent être utilisées pendant des durées variées (de quelques secondes à quelques années).

La plupart des organisations documentent les solutions de contournement au sein de leur système de gestion des connaissances, les associant aux enregistrements de la base de données des erreurs connues. Ces enregistrements peuvent être présentés aux utilisateurs sous forme de FAQ, ou être uniquement visibles par le personnel de gestion des services sous forme d'instructions de diagnostic. Il est important de garder à l'esprit que les solutions de contournement suivent le même cycle de vie que le problème sous-jacent et, de fait, lorsque le problème est résolu, la solution de contournement initiée devrait être abandonnée afin d’éviter toute confusion.

Les processus ITIL de gestion des problèmes

L’ITIL définit la gestion des problèmes comme une partie des opérations de services, et est fortement liée à la gestion des incidents, à la gestion des changements et à l'amélioration continue des services. L’ITIL v3 décompose la gestion des problèmes selon les sous-processus suivants :

ITIL : Gestion des incidents vs gestion de problèmes

La différence entre gestion des incidents et gestion des problèmes est l'une des plus grandes causes de confusion dans les processus ITIL et de gestion des services. Bien qu’il existe un lien très étroit entre ces processus, ils sont volontairement différents et distincts. La gestion des incidents a pour tâche de répondre à un évènement qui s'est produit, de minimiser son impact opérationnel et de restaurer le service aussi rapidement que possible. La gestion des problèmes vise à comprendre la cause première expliquant pourquoi l'évènement s'est produit et à déterminer comment éviter qu'il se reproduise.

Nous avons déjà évoqué les processus impliqués dans la gestion des problèmes. Pour faire la différence, les activités principales dans la gestion des incidents sont :

Il est possible que plusieurs incidents se produisent avant que la gestion des problèmes dispose de suffisamment de données pour analyser ce qui s'est passé et découvrir les mesures à prendre afin de corriger la situation. Par conséquent, la communication et la coordination entre responsables des incidents et responsables des problèmes sont essentielles. La gestion des problèmes est une partie cruciale de votre gestion des services informatiques. Elle réunit les connaissances accumulées lors de la surveillance, de la gestion des incidents et d'autres composants des opérations de services, et les transmet aux processus d'amélioration continue des services qui contribueront à rendre les services offerts aux utilisateurs plus solides et plus fiables.

Autres ressources du centre de services informatiques

BLOG

4 techniques pour une gestion efficace des problèmes

BLOG

Gestion des changements et des mises en production ; c'est compliqué !

BLOG

Passer d'un ITSM réactif à un ITSM proactif

BLOG

Le changement de paradigme dans l’ITSM