Vad är problem management?

Problem management kallas vanligtvis för problemhantering på svenska. Problemhantering består av de processer och aktiviteter som används för att hantera problemens livscykler inom IT-service. Dess huvudsakliga mål är att förebygga problem och de incidenter som problemen orsakar. För incidenter som redan har uppstått arbetar man inom problemhantering med att förebygga att de återkommer. Om de inte går att undvika strävar man istället efter att minimera effekten som problemen har på verksamheten. För att förstå problemhantering är det viktigt att man vet vad ett problem är inom sammanhanget. ITIL anger att ett problem är orsaken till en eller flera incidenter. Det är ett underliggande förhållande som kan ha en negativ effekt på en tjänst och som därför måste hanteras. Problem har livscykler som börjar när de uppstår (ofta genom en ändring i miljön), fortsätter med identifiering och diagnos samt korrigering och avslutas när problemet löses (vare sig det löses av en åtgärd eller av att miljön ändras).

Problemhantering är en process som består av att hantera livscykler för individuella problem samt ett bredare perspektiv där man använder flertalet processer för att fatta beslut om vilka problem som bör hanteras, vilka resurser som får användas och vilka risker som problemen medför. Problemhantering innefattar alla aktiviteter som krävs för att diagnosticera grundorsaker till incidenter och bedöma lämpliga lösningar. Det innefattar även att säkerställa att eventuella lösningar implementeras på ett säkert och effektivt sätt, i enlighet med policyer och processer för ändringshantering och releasehantering.

Att skapa en ”portfölj” är en viktig del av problemhantering och består av att samla information om miljöns existerande problem, eventuella anpassningar som har utvecklats och vilka lösningar som finns. Portföljen består av information som låter ledningen fatta beslut som minskar antalet incidenter samt den åverkan dessa incidenter har.

Vad gör en problem manager?

En problem manager är såklart personen som ansvarar för problem management (eller problemhantering). Det är en person som ser över problemens livscykler så att de förstås och så att lämpliga åtgärder kan vidtas. Den som ansvarar för problemhantering har som mål att förebygga att incidenter uppstår och att minimera effekten av de incidenter som inte kan förhindras. En problem manager samarbetar ofta med personal som ansvarar för incidenthantering och tekniska resurser för att säkerställa att diagnostiska data samlas in om incidenter och miljöer som orsakar problem. En problem manager ansvarar även för att utföra orsaksanalyser (”Root Cause Analysis”, RCA) för att hjälpa organisationen att identifiera när incidenter uppstår samt när det underliggande problemet introducerades i miljön. Orsaksanalys resulterar ofta i ett antal olika lösningar som kan användas. Då spelar en problem manager en viktig roll i att utvärdera alternativens kostnader, fördelar och risker och sedan göra en rekommendation. Det tar ofta tid för lösningar att skickas genom lämpliga processer för ändrings- och releasehantering. Under den tiden ansvarar en problem manager för att se till att kunskapshanteringsresurser och databaser med kända fel uppdateras för att möjliggöra incidenthantering och för att hjälpa övrig personal att hantera återkommande incidenter och/eller serviceförfrågningar. Även om incidenthantering och problemhantering är separata processer använder en problem manager vanligtvis samma verktyg och system för kategorisering, effekt och prioritet som en incident manager. På så sätt möjliggörs mer effektiva samarbeten mellan de olika områdena.

Proaktivt problem management

Problem management (alltså problemhantering) består av två huvudsakliga processer:

Proaktiv problemhantering handlar om att identifiera möjliga incidenter och att förebygga dem genom att identifiera och ta bort grundorsaken innan driften störs. Proaktiv problemhantering påverkas i stor grad av de data som skapas av automatiska kontroller, analys av ändringsloggar och användning av trendanalys. Det skiljer sig från reaktiv problemhantering genom att man arbetar med tre viktiga områden:


Tillfälliga lösningar

Problemhantering kan vara en tidskrävande uppgift. Samtidigt måste organisationen fortsatt kunna tillhandahålla sina tjänster när man utför problemhantering. För att kunna göra det kan man använda tillfälliga lösningar, vilket ofta kallas för ”workarounds”. En ”workaround” är en tillfällig lösning som minskar eller förhindrar effekten av kända fel och problem som inte har en permanent lösning. Anledningen till att man inte har en permanent lösning kan vara att man inte har utvecklat nödvändiga steg eller att lösningen inte har implementerats än.

En ”workaround” löser inte det underliggande problemet utan endast vissa av dess symptom eller effekter. Vanliga exempel på ”workarounds” inkluderar att starta om servrar, rensa cacheminnen eller att använda en alternativ process eller ett alternativt system. En ”workaround” kan utföras av personer som ansvarar för incidenthantering eller av slutanvändare och kan användas i ett fåtal sekunder eller under flera år.

De flesta organisationerna dokumenterar sina tillfälliga lösningar som del av kunskapsdatabasen och länkar dokumentationen till databasen med kända fel. Denna dokumentation kan visas för användarna som vanliga frågor eller endast för personal inom tjänstehantering som diagnostiska anvisningar. Det är viktigt att komma ihåg att en tillfällig lösning följer samma livscykel som det underliggande problemet. När problemet har lösts bör den tillfälliga lösningen tas bort.

ITIL-processer för problem management

ITIL definierar problemhantering som en del av tjänstedrift. Det är även en process med viktiga länkar till incidenthantering, ändringshantering och kontinuerlig tjänsteförbättring. ITIL V3 delar upp problemhantering i följande underordnade processer:

Incidenthantering eller problemhantering?

Skillnaden mellan incidenthantering och problemhantering är något som kan orsaka stor förvirring inom ITIL-processer och tjänstehantering. Även om incidenthantering liknar problemhantering är de i själva verket separata processer. Incidenthantering handlar om att svara på incidenter som har uppstått, minska effekten på verksamheten och återställa driften så snart som möjligt. Problemhantering handlar å andra sidan om att förstå grundorsaken till problemet och förhindra att det återkommer i framtiden.

Vi har redan tagit en titt på vilka processer problemhantering medför. Alltså är det dags för en lista på vad incidenthantering inkluderar:

Det är möjligt att det krävs flera incidenter innan man har tillräckliga data för problemhantering och för att analysera vad som hänt och hur man kan rätta felet. Det innebär att kommunikation och koordination mellan en incident manager och en problem manager är en grundläggande del av processen. Problemhantering är en grundläggande del av organisationens ITSM (IT Service Management). Det kräver kunskaper från kontroller, incidenthantering och andra delar av tjänstedriften för att kontinuerligt förbättra tjänsten och se till att den service man erbjuder är så robust och pålitlig som möjligt.