Managementul problemelor - Problem management

Gestionarea problemelor este procesul responsabil de gestionarea ciclului de viață al tuturor problemelor care se întâmplă sau s-ar putea întâmpla într-un serviciu IT. Obiectivele principale ale gestionării problemelor sunt prevenirea apariției problemelor și incidentelor rezultate, eliminarea incidentelor recurente și reducerea la minimum a impactului incidentelor care nu pot fi prevenite. ITIL definește o problemă ca fiind cauza unuia sau mai multor incidente .

Domeniul de aplicare

Managementul problemelor include activitățile necesare pentru a diagnostica cauza principală a incidentelor identificate prin procesul de gestionare a incidentelor și pentru a determina rezolvarea acestor probleme. De asemenea, este responsabil să se asigure că rezoluția este implementată prin procedurile de control adecvate, în special gestionarea schimbărilor și gestionarea versiunilor .

Managementul problemelor va menține, de asemenea, informații despre probleme și soluțiile și soluțiile adecvate, astfel încât organizația să poată reduce numărul și impactul incidentelor în timp. În acest sens, gestionarea problemelor are o interfață puternică cu gestionarea cunoștințelor și vor fi utilizate instrumente precum baza de date a erorilor cunoscute . Deși gestionarea incidentelor și gestionarea problemelor sunt procese separate, acestea sunt strâns legate și vor folosi în mod obișnuit aceleași instrumente și pot utiliza sisteme de codificare, impact și prioritate similare. Acest lucru va asigura o comunicare eficientă atunci când se tratează incidentele și problemele conexe.

Valoare pentru afaceri

Gestionarea problemelor funcționează împreună cu gestionarea incidentelor și gestionarea schimbărilor pentru a se asigura că disponibilitatea și calitatea serviciilor IT sunt crescute. Când incidentele sunt rezolvate, se înregistrează informații despre rezoluție. De-a lungul timpului, aceste informații sunt utilizate pentru a accelera timpul de rezoluție și a identifica soluțiile permanente, reducând numărul și timpul de rezolvare a incidentelor. Acest lucru are ca rezultat mai puține perioade de nefuncționare și mai puține întreruperi ale sistemelor critice pentru afaceri.

Activități de proces, metode și tehnici

Managementul problemelor constă din două procese majore:

Detectarea problemelor

  • Suspiciunea sau detectarea unei cauze a unuia sau mai multor incidente de către biroul de service , care duce la ridicarea unei înregistrări a problemelor - Service Bureau ar fi putut rezolva incidentul, dar nu a stabilit o cauză definitivă și suspectează că este posibil să reapară.
  • Analiza unui incident de către un grup de asistență tehnică care relevă faptul că o problemă de bază există sau este posibil să existe.
  • Detectarea automată a unui defect de infrastructură sau o aplicație, folosind în mod automat instrumente eveniment / alertă pentru a ridica un incident care ar putea dezvălui necesitatea unui record problemă .
  • O notificare de la un furnizor sau contractant că există o problemă care trebuie rezolvată.
  • Analiza incidentelor ca parte a gestionării proactive a problemelor: buletine de monitorizare, comunicate, lucrări relevante

Problemă de înregistrare

Toate detaliile relevante ale problemei trebuie înregistrate, astfel încât să existe o înregistrare istorică completă. Aceasta trebuie să fie marcată cu dată și oră pentru a permite controlul și escaladarea adecvate. O referință încrucișată trebuie să fie făcută la incidentul (e) , care a inițiat „Evidența Problemă“:

  • Detalii despre servicii
  • Detalii despre echipament
  • Data / ora înregistrată inițial
  • Prioritate și detalii de clasificare
  • Descrierea incidentului
  • Detalii pentru toate acțiunile de diagnosticare sau încercări de recuperare întreprinse.

Prioritizarea problemei

Problemele pot fi clasificate în funcție de gravitatea și prioritatea lor, la fel ca incidentele, pentru a facilita urmărirea lor, luând în considerare impactul incidentelor asociate și frecvența lor de apariție. Din punct de vedere al infrastructurii, se poate întreba:

  • Sistemul poate fi recuperat sau trebuie înlocuit?
  • Cat va costa?
  • Câți oameni vor fi obligați să rezolve problema?
  • Cât timp va dura pentru a remedia problema?
  • Câte resurse suplimentare vor fi implicate?
  • Care este impactul nu a rezolva problema?

Investigarea și diagnosticarea problemelor

Rezultatul unei investigații pentru o problemă va fi un diagnostic de cauză rădăcină sau un raport RCA. Rezoluția ar trebui să fie suma nivelului adecvat de resurse și abilități utilizate pentru a o găsi. Există o serie de tehnici utile de rezolvare a problemelor care pot fi utilizate pentru a ajuta la diagnosticarea și rezolvarea problemelor.

  • Sistemul de gestionare a configurației (CMS) trebuie utilizat pentru a ajuta la determinarea nivelului de impact și pentru a ajuta la identificarea punctului de eșec.
  • Cunoscute Baza de date de eroare sau KEDB ar trebui să fie accesate și verificate în scopul de a afla dacă problema a avut loc în trecut, în cazul în care acest lucru de rezoluție ar trebui să fie deja în vigoare.
  • Analiza cronologică, evenimentele care au declanșat problema vor fi verificate în ordine cronologică pentru a avea o cronologie a evenimentelor. Scopul este de a vedea care eveniment declanșează următorul eveniment și așa mai departe sau de a exclude unele evenimente posibile.

Analiza valorii Pain conține o perspectivă mai largă a impactului unui incident sau a unei probleme pe afaceri. În loc să analizeze numărul de incidente / probleme de un anumit tip într-un anumit interval de timp, tehnica se concentrează pe analiza aprofundată a nivelului de durere care a fost cauzat afacerii de aceste incidente / probleme. O formulă pentru a calcula nivelul durerii ar trebui să ia în considerare:

  • numărul persoanelor afectate
  • durata timpului de inactivitate cauzat
  • costul pentru afacere

Metoda Kepner și Tregoe este utilizată pentru a investiga problemele cu rădăcini mai profunde. Au definit următoarele etape:

  • definirea problemei
  • descrierea problemei în termeni de identitate, locație, timp (durată) și dimensiune (impact)
  • stabilirea cauzelor posibile
  • testând cauza cea mai probabilă
  • verificând adevărata cauză

Analiza Pareto sau diagrama Pareto este o tehnică pentru separarea cauzelor potențiale importante de problemele banale. Ar trebui parcurși următorii pași:

  1. Formați un tabel care să enumere cauzele și frecvența acestora ca procent
  2. Aranjați rândurile în ordinea descrescătoare a importanței cauzelor (cea mai importantă cauză mai întâi)
  3. Adăugați o coloană procentuală cumulativă în tabel
  4. Creați o diagramă cu bare cu cauzele, în ordinea procentului lor din total
  5. Desenați o linie la 80% pe axa Y, apoi lăsați linia în punctul de intersecție cu axa X. Din grafic puteți vedea principalele cauze ale eșecurilor rețelei. Acestea ar trebui să fie vizate mai întâi.
Eșecuri de rețea
Cauze Procent din total % Calcul
Controlor de rețea 35 0 + 35% = 35%
Dosar corupție 26 35% + 26% = 61%
Sistem de operare server 6 61% + 6% = 67%

Înregistrare eroare cunoscută

După finalizarea investigației și găsită o soluție (sau chiar o soluție permanentă), trebuie înregistrată o înregistrare de eroare cunoscută și plasată în baza de date de erori cunoscute pentru a identifica și rezolva alte probleme similare. Scopul principal este de a restabili serviciul afectat cât mai curând posibil, cu un impact minim asupra afacerii.

O bună practică ar fi creșterea unei înregistrări de erori cunoscute cât mai devreme posibil în cadrul anchetei; odată ce o soluție a fost testată cu succes sau a fost identificată o cauză principală.

Revizuirea problemelor majore

O bună practică este să faceți o analiză a tuturor problemelor majore. Dar asta induce costuri. Revizuirea ar trebui să examineze:

  • Pașii corecți luați
  • Problemele întâmpinate în timpul implementării soluției
  • Nevoia de îmbunătățire
  • Preveniți reapariția unor incidente similare
  • Terț / Furnizor / Furnizor implicat în implementare

Cunoștințele învățate în urma revizuirii ar trebui să fie încorporate într-o revizuire a serviciului cu clientul comercial pentru a se asigura că acesta este conștient de acțiunile întreprinse și de planurile de prevenire a viitoarei incidente similare. Acest lucru ajută la îmbunătățirea satisfacției clienților și asigură afacerea că operațiunile de servicii gestionează incidente majore în mod responsabil și lucrează activ pentru a preveni reapariția lor viitoare.

Vezi si

Referințe

  • Noul manager rațional - descrie rezolvarea problemelor KT și luarea deciziilor (PSDM)
  • Offord, Paul (2011). RPR: o metodă de diagnosticare a problemelor pentru profesioniștii IT . Essex, Anglia: Advance Seven Limited. ISBN   978-1-4478-4443-3 .