Share via


Pregled analize korijenskih uzroka

Analiza uzroka (RCA) omogućuje vam pronalaženje skrivenih veza u podacima. Na primjer, pomaže vam razumjeti zašto nekim slučajevima treba više vremena da se završe od drugih ili zašto neki slučajevi zaglave u preradama, dok drugi rade glatko. RCA će vam pokazati ključne razlike između takvih slučajeva.

Obavezni podaci

RCA može koristiti sve atribute na razini slučaja, mjerne podatke i prilagođene mjerne podatke da bi pronašao veze među njima i metriku po vašem izboru.

Najbolji uzorak je uključiti sve podatke koje možete uključiti kao atribut razine slučaja i dopustiti RCA-u da odabere koji atribut zapravo utječe na mjerni podatak, a koji ne.

Kako RCA funkcionira

RCA algoritam izračunat će strukturu stabla u kojoj će svaki čvor podijeliti skup podataka na dva manja dijela. To se temelji na jednoj varijabli u kojoj pronalazi najbolju korelaciju između podjele varijable i ciljne metrike. Iz toga možete vidjeti skrivene veze u podacima. Ovdje će vam reći koja će kombinacija atributa utjecati na slučaj na koji način.

Kako RCA pronalazi najbolju podjelu

Prvo, generiramo stotine do tisuće kombinacija mogućih podjela. Zatim pokušavamo svaku podjelu otkriti koliko će zapravo podijeliti skup podataka na dva dijela. Izračunavamo varijancu glavne metrike u svakom dijelu podjele i izračunavamo rezultat za svaku podjelu sa sljedećim izračunom:

Ocjenasplit_x = Odstupanjelijevo * Broj preostalih slučajeva + varijancadesno* broj slučajeva desno

Zatim razvrstavamo sve podjele po ovom rezultatu i najbolje podjele uzimaju se od početka, s najnižim rezultatom. Za kategoričku glavnu metriku (niz) izračunavamo Gini nečistoću umjesto varijance.

RCA primjer

U ovom primjeru želimo vidjeti temeljni uzrok trajanja slučaja. U podacima imamo atribute na razini slučaja zemlju dobavljača, grad dobavljača, materijal, ukupni iznos i mjesto troška. Prosječno trajanje slučaja je 46 sati.

Gledajući svaku vrijednost svakog atributa zasebno, možemo vidjeti da je najveći utjecaj trajanja slučaja kada je grad dobavljača Graz, što u prosjeku povećava trajanje kućišta za dodatnih 15 sati. Iz ove početne analize možemo vidjeti da ostale vrijednosti atributa daleko manje utječu na ciljnu metriku. Međutim, kada izračunamo model stabla, možemo vidjeti da gornji izračun dovodi u zabludu (kao na sljedećoj snimci zaslona).

Snimka zaslona influencera trajanja slučaja.

Struktura stabla izgleda ovako:

  • Prva podjela su podaci duž varijable materijala . Podaci s aluminijem su s jedne strane, a svi ostali materijali s druge strane.

  • Aluminijska grana dalje je podijeljena po zemljama dobavljačima naNjemačku i Austriju.

  • Podružnica u Austriji nastavlja se podjelom po gradu dobavljaču, s Grazom s jedne strane i Bečom s druge strane.

  • U čvoru Graz prosječni slučaj bio je 36 sati sporiji od ukupnog prosječnog trajanja od 46 sati.

Na istom stablu možemo vidjeti da ako imamo još jedan materijal od aluminija, on se također dijeli po promjenjivom gradu dobavljača, gdje je s jedne strane Graz , a s druge Beč, München ili Frankfurt. Ali ovdje su vrijednosti suprotne. Graz ima puno bolju statistiku od Beča ili bilo kojeg njemačkog grada, s prosječnim slučajem u Grazu koji je 15 sati brži od ukupnog prosjeka za sve slučajeve.

Iz toga možemo vidjeti da su početne statistike obmanjujuće jer Graz ima loše performanse kada je materijal aluminij, Međutim, radi iznad prosjeka kada je materijal različit od aluminija i potpuno je suprotan za druge gradove.

Statistika utjecaja trajanja slučaja uzima u obzir samo jednu vrijednost i ponekad može dovesti u zabludu. RCA uzima u obzir njihove kombinacije kako bi vam pružio više uvida u vaš proces.