Qu'est-ce que la gestion des incidents ITIL ?

Les entreprises visent des services sans interruption pour obtenir de meilleurs résultats en termes d'efficacité et de productivité. La gestion des incidents ITIL est le premier processus à être adopté par la plupart des organisations afin de permettre la récupération rapide d’un service. Ce processus fait partie de l'exploitation des services dans le cycle de vie du service ITIL . La gestion des incidents agit comme point de contact unique pour les utilisateurs finaux afin que ces derniers puissent signaler le moindre incident. Un incident est défini comme une interruption ou une perturbation du service normal. La plupart du temps, la gestion des incidents de l’ITIL a pour but d'éteindre les incendies pour garantir le bon fonctionnement du service. C'est l'un des processus ITIL les plus importants à mettre en œuvre en premier afin de résoudre les problèmes des utilisateurs aussi rapidement que possible. L'implémentation du service desk suit la méthode Adopter et Adapter, et mey en place les bonnes pratiques du processus de gestion des incidents ITIL et en les adaptant ensuite aux besoins de l'organisation. Une gestion des incidents réussie se traduit par une meilleure efficacité et une augmentation de la productivité.

Un service desk, ou centre de services informatique, est le point de contact unique entre l'équipe IT et les utilisateurs finaux. L'exploitation des services de l’ITIL recouvre les techniques de gestion des incidents, dont l'objectif principal est de garantir le bon fonctionnement des services, avec peu ou pas d'interruptions. Un processus de gestion des incidents compétent réduit le manque de communication entre les utilisateurs finaux et l'IT. Le processus ITIL de gestion des incidents est un ensemble de bonnes pratiques pour le traitement et la résolution effectives des incidents. Considérons de plus près certains des principes fondamentaux de la gestion des incidents.

Un incident peut être provoqué par un actif qui ne fonctionne pas correctement. Par conséquent, la gestion des incidents et la gestion des actifs sont étroitement liées dans le partage des informations. Des exemples d'incident incluent des problèmes de Wi-Fi, une erreur d'application, un problème de messagerie, un crash de portable, une erreur AD ou un problème d'authentification.

Le flux du processus de gestion des incidents

Le processus de gestion des incidents est composé d'une série d'étapes qui doivent être suivies pour que le processus de gestion des incidents soit efficace.

Enregistrer l'incident

En matière de gestion des incidents, enregistrer l'incident est la première étape pour signaler un incident identifié. C’est généralement effectué soit par les utilisateurs finaux eux-mêmes au moyen d'une source quelconque de ticket, ou par les agents qui soumettent les tickets pour le compte des utilisateurs finaux. Le modèle de formulaire d'incident est utilisé pour saisir les détails relatifs à l'incident. Ceci accélère le processus de récupération en automatisant sur la base de valeurs. Les canaux qui conviennent sont configurés pour permettre aux utilisateurs de soumettre un ticket. Les canaux courants comprennent l'e-mail, le libre-service et l'application mobile.

Classifier l'incident

La classification des incidents permet de catégoriser les tickets efficacement et de les assigner au bon agent. Les champs catégorie/sous-catégorie sont disponibles dans le modèle du formulaire d'incident afin de choisir la bonne catégorie d'incident associée. Configurez le formulaire d'incident avec la bonne combinaison de champs et automatisez la classification, la priorisation et l'attribution du ticket pour gagner un temps précieux au cours du processus. Une classification des incidents efficace facilite la prise de décisions.

Prioriser l'incident

L'accord sur les niveaux de service (SLA) s'appuie sur la priorité du ticket afin de définir le taux de réponse et de résolution. La priorité décide de la date d'échéance à laquelle le ticket doit être résolu. Il est donc essentiel d'assigner la bonne priorité au ticket. La matrice des priorités recueille l'impact et l'urgence des utilisateurs et décide ensuite de la priorité du ticket. Cela permet de traiter les problèmes critiques à temps. Définissez donc des SLA réalistes afin de satisfaire à vos engagements client.

Enquête & diagnostic

L'équipe de niveau I traite les incidents de faible priorité et les incidents complexes sont traités par les équipes de niveau II et III. L'équipe de niveau I effectue l'analyse et l'enquête initiales. Si aucune résolution n’a été trouvée, l'incident est alors escaladé aux équipes de niveau II et III pour une enquête approfondie. L'incident est associé à l'élément de configuration (CI) concerné pour accélérer le diagnostic.

Résolution & fermeture de l'incident

La résolution de l'incident est cruciale pour satisfaire le SLA et, de ce fait, il est important pour les agents d'obtenir une résolution en temps et en heure pour obtenir un bon niveau de performance. Il est également important de bien communiquer les informations concernant la résolution pour que les utilisateurs puissent revenir à la normale. La fermeture des tickets est traitée automatiquement par le système ou par le biais du portail en libre-service.

Support multi-niveaux vs. essaimage

Les méthodologies de gestion des services telles que DevOps, Agile et Lean ont introduit de nouvelles méthodes de travail pour les équipes IT,  leur objectif primordial étant de collaborer efficacement et de promouvoir le travail en équipe, à l'opposé du travail en silos.

SUPPORT MULTI NIVEAUX

Le modèle traditionnel de support à trois niveaux est un modèle hiérarchique composé de trois équipes : l'équipe de première ligne (Niveau I), les équipes techniques (Niveau II) et l'équipe de développement applicatif (Niveau III). Le niveau I résout la plupart des tickets, et l'équipe se compose le plus souvent de généralistes, tandis que les quelques tickets qui nécessitent une expertise plus poussée sont transférés au niveau 2, c'est à dire l'équipe de gestion des applications. Si l'incident n'est toujours pas résolu, il est alors transféré à l'équipe de développement qui va implémenter de nouveaux changements. Ce modèle à trois niveaux est hiérarchique et suit une procédure d'escalade.

ESSAIMAGE

L'essaimage, par contre, se concentre sur une collaboration effective entre les agents pour résoudre les problèmes aussi rapidement que possible. Il se base sur le partage de connaissances et son objectif principal est d'apprendre des autres afin de trouver une solution. Aucune hiérarchie n’est nécessaire, et il s'agit d'une structure horizontale. Les agents forment un essaim pour collaborer et réfléchir ensemble de manière efficace. L'essaimage est utile pour gérer les tickets non conventionnels. L'essaimage est influencé par la culture de l'organisation et il élimine les silos d'expertise.

Les bonnes pratiques de la gestion des incidents

Canaux

Offrez du support multicanal pour améliorer l'expérience utilisateur et assurez-vous d'informer les utilisateurs quant à la disponibilité de ces canaux. La consumérisation exige des entreprises qu'elles soient disponibles et accessibles n'importe où.

Gestion des utilisateurs

Les utilisateurs du service desk incluent les agents et les utilisateurs finaux. Il est vital de gérer les informations utilisateurs afin d'apporter plus de contexte à la personne qui résout le ticket

Catégorisation & Priorisation

Une classification adéquate vous permet de mieux réparer les problèmes et d’améliorer le temps de résolution. La priorisation garantit que les problèmes critiques pour l'entreprise soient traités en premier.

Automatisez autant que possible

La gestion des incidents implique un grand nombre de tickets et d'activités de routine telles que la catégorisation, la priorisation et l'attribution. L'automatisation améliore l'efficacité et la productivité

La communication est essentielle

Gardez vos utilisateurs informés quant à la progression du ticket. Cela renforce la confiance entre l'IT et les utilisateurs finaux.

Intégrez la gestion des actifs et la base de connaissances

Il est bénéfique d'intégrer la gestion des incidents à d'autres processus de l’ITIL afin de partager des informations utiles et d’éliminer les silos d'expertise.

Ludifiez votre service desk

Tirez parti de la ludification pour créer une culture agréable parmi les agents du service desk et les motiver à aller plus loin.

Gestion des incidents vs. Gestion des problèmes

Un problème est défini comme une série d'incidents dont la cause première est inconnue, tandis que l'incident est une interruption non prévue du service normal. La gestion des incidents est principalement réactive tandis que la gestion des problèmes est proactive afin d'éviter les incidents majeurs. L'objectif principal de la gestion des incidents est de restaurer les services le plus rapidement possible, tandis que la gestion des problèmes cherche à trouver une solution permanente. La gestion des problèmes débute lorsque la gestion des incidents est incapable de trouver une solution. L'enregistrement d'un problème est créé soit à partir d'un ou de plusieurs incidents récurrents, ou de manière indépendante. La gestion des problèmes effectue l'analyse de la cause première (RCA) afin de trouver une solution permanente et maintient la base de données des erreurs connues (KEDB). La gestion des incidents partage les informations essentielles telles que les détails de l'incident, l'utilisateur impacté, l'actif impacté, l'urgence, l'impact et la gravité. Par conséquent, la gestion des incidents joue le rôle d'un prérequis pour la gestion des problèmes en partageant les informations nécessaires. La gestion des problèmes suit certaines techniques éprouvées comme le diagramme d'Ishikawa, la méthode des 5 pourquoi (5 whys), le remue-méninges (brainstorming) ou encore la méthode Kepner Tregoe afin de découvrir la cause première.

La gestion des incidents majeurs

Les incidents majeurs causent des perturbations importantes et ont un impact conséquent sur le fonctionnement de l'entreprise. Un incident majeur est défini comme un problème ayant un impact et une urgence des plus élevés. Le gestionnaire d'incidents s'occupe des ressources nécessaires pour la résolution de l'incident et le gestionnaire des problèmes trouve la cause première sous-jacente de cet incident majeur. Des règles de SLA différentes sont définies pour traiter les incidents majeurs. La gestion proactive des problèmes identifie et prévient les incidents majeurs. Un rapport d'incident majeur est préparé pour saisir toutes les informations relatives à l'incident majeur et les utilisateurs impactés.

Exemple : panne de l'application ERP, menace relative au contrôle des accès

Rôles et responsabilités du gestionnaire d'incidents

Le gestionnaire d'incidents définit et gère le processus de la gestion des incidents pour l'organisation et adopte les bonnes pratiques de l’ITIL au sein du processus. Le gestionnaire d'incidents est responsable des tâches suivantes :

Les 5 choses à NE PAS FAIRE en gestion des incidents

Indicateurs clés de performance

Le gestionnaire d'incidents définit les bons KPI. Ceci garantit un alignement opérationnel efficace, et les rapports de KPI soient revus régulièrement avec le management. Les KPI sont associés aux facteurs critiques de succès (CSF) qui, à leur tour, sont associés aux objectifs fondamentaux de l'entreprise. La solution de service desk vous permet d'évaluer ces KPI grâce à des rapports d'analyse avancés. Ces rapports sont automatisés et utilisés dans le but d’améliorer le processus existant, et l'entreprise dans son ensemble. Les types de rapports incluent les tendances des tickets, la performance des agents, le CSAT, les rapports sur les SLA, etc.

Les indicateurs courants de la gestion des incidents incluent :

  • Volume des incidents (par catégorie d'incident, priorité, statut, demandeur, etc.)
  • Temps moyen de résolution
  • Temps moyen de réponse
  • % SLA
  • Les éléments de configuration (CI) en cause ou qui sont impacté par les incidents
  • Incidents résolus sans escalade
  • Coût moyen par incident
  • Taux de réouverture des incidents
  • Résolution dès le premier appel (FCR)

Checklist des fonctions pour une solution de gestion des incidents

Les fournisseurs de centres de services proposent une quantité de fonctionnalités appropriées à la gestion des incidents. Toutefois, la liste qui suit inclut les fonctionnalités minimales requises pour la gestion des incidents.

  • Créer les incidents via différents canaux comme l'e-mail, le portail, le téléphone mobile, le chat, etc.
  • Création d'incidents par les agents pour le compte de l'utilisateur final
  • Configurer le modèle de formulaire d'incident et l'enregistrer pour future référence
  • Automatiser les capacités de catégorisation, priorisation et attribution des incidents
  • Réassigner le ticket à un autre agent
  • Minuteur de SLA pour contrôler le temps de résolution
  • Possibilité de stopper le minuteur du SLA et de passer outre
  • Actions en bloc sur les incidents tels que réponse en bloc, changement de statut en bloc, etc.
  • Ajout d'un statut personnalisé aux incidents
  • Possibilité d'associer les CI appropriés à l'incident
  • Système intégré de gestion des connaissances pour ajouter un article de solution pertinent
  • Définir la matrice des priorités pour saisir l'impact et l'urgence
  • Notifications automatiques par e-mail pour le ticket, la réponse, le changement de statut, etc.
  • Matrice des escalades pour gérer les infractions aux SLA
  • Collaborer avec les agents pairs au sein d'un incident
  • Transférer un ticket à une tierce partie
  • Journaux d'audit pour connaître l'historique du ticket
  • Relation parent-enfant pour relier les tickets associés
  • Option de fusion pour éviter la duplication d'incidents
  • Configurer une enquête de satisfaction client (CSAT) pour connaître le niveau de satisfaction des utilisateurs
  • Mécanisme de reporting pour les incidents
  • Associer directement un incident à l'enregistrement d'un problème ou d'un changement
  • Possibilité d'intégrer des applications externes telles que des outils de supervision des événements, etc.

 

 

Les bénéfices de la gestion des incidents

Le système de gestion des incidents présente les bénéfices suivants :