Aracılığıyla paylaş


Kök neden analizine genel bakış

Kök neden analizi (RCA), verilerinizdeki gizli bağlantıları bulmanızı sağlar. Örneğin, bazı çalışmaların tamamlanmasının neden diğerlerinden daha uzun sürdüğünü veya bazı servis taleplerinin neden yeniden çalışmalarda takıldığını ve bazılarının sorunsuz çalıştığını anlamanıza yardımcı olur. RCA size bu gibi durumlar arasındaki temel farkları gösterecektir.

Gerekli veriler

RCA, aralarındaki bağlantıları ve seçtiğiniz bir ölçümü bulmak için tüm çalışma düzeyindeki özniteliklerinizi, metriklerinizi ve özel ölçümlerinizi kullanabilir.

En iyi örnek, çalışma düzeyi özniteliği olarak ekleyebileceğiniz tüm verileri dahil etmek ve RCA'nın hangi özniteliğin ölçümü gerçekten etkileyip hangilerinin etkilemediğini seçmesine izin vermektir.

RCA nasıl çalışır?

RCA algoritması, her düğümün veri kümesini iki küçük parçaya böleceği bir ağaç yapısını hesaplar. Bu, değişken bölünmesi ile hedef ölçüm arasındaki en iyi korelasyonu bulduğu bir değişkeni temel alır. Bundan, verilerdeki gizli bağlantıları görebilirsiniz. Burası, hangi özniteliklerin kombinasyonunun çalışmayı hangi şekilde etkileyeceğini size söyleyeceği yerdir.

RCA en iyi bölmeyi nasıl bulur?

İlk olarak, olası bölmelerin yüz ila binlerce kombinasyonunu oluşturuyoruz. Ardından, veri kümesini gerçekte ne kadar iyi iki bölüme ayıracağını keşfetmek için her bir bölmeyi deniyoruz. Bölmenin her bir bölümündeki ana ölçümün varyansını hesaplıyoruz ve aşağıdaki hesaplamayla her bir bölümün puanını hesaplıyoruz:

puanböl_x = varyanssol * çalışma sayısısol + varyanssağ * çalışma sayısısağ

Ardından, tüm bölümleri bu puana göre sıralarız ve en iyi bölmeler en baştan alınır, en düşük puanla. Kategorik ana ölçüm (dize) için varyans yerine Gini katışıklığını hesaplıyoruz.

RCA örneği

Bu örnekte, çalışma süresinin arkasındaki kök nedeni görmek istiyoruz. Verilerde, tedarikçi ülkesi, tedarikçi şehri, malzeme, toplam tutar ve maliyet merkezi gibi çalışma düzeyi özniteliklerine sahibiz. Ortalama çalışma süresi 46 saattir.

Her bir özniteliğin her bir değerine ayrı ayrı bakarak, çalışma süresinin en yüksek etkileyicisinin, tedarikçi şehri Graz olduğu zaman olduğunu görebiliriz, bu da ortalama olarak çalışmanın süresini 15 saat daha arttırır. Bu ilk analizden, diğer öznitelik değerlerinin hedef ölçümü çok daha az etkilediğini görebiliriz. Ancak, ağaç modelini hesapladığımızda, yukarıdaki hesaplamanın yanıltıcı olduğunu görebiliriz (aşağıdaki ekran görüntüsünde olduğu gibi).

Çalışma süresi etkileyicisinin ekran görüntüsü.

Ağaç yapısı şöyle görünür:

  • İlk bölme, malzeme değişkeni boyunca verilerdir. Alüminyum bulunan veriler bir tarafta, diğer tüm malzemeler ise diğer taraftadır.

  • Alüminyum dalı, tedarikçi ülkesine göre Almanya ve Avusturya'ya bölünür.

  • Avusturya dalı, tedarikçi şehrine göre bölünmeye devam eder, bir tarafta Graz ve diğer tarafta Viyana olur.

  • Graz düğümünde, ortalama çalışma, 46 saatlik genel ortalama süreden 36 saat daha yavaştı.

Aynı ağaçta, alüminyumdan başka bir malzememiz varsa bir tarafta Graz, diğer tarafta Viyana, Münih veya Frankfurt olan değişken tedarikçi şehri tarafından da bölündüğünü görebiliriz. Ama burada değerler bunun tam tersidir.  Graz, Viyana'dan veya herhangi bir Alman kentinden çok daha iyi istatistiklere sahiptir ve Graz'daki ortalama çalışma, tüm çalışmalar için genel ortalamadan 15 saat daha hızlıdır.

Bundan, ilk istatistiklerin yanıltıcı olduğunu görebiliriz, çünkü Graz, malzeme alüminyum olduğunda kötü performans gösteriyor, Bununla birlikte, malzeme alüminyumdan başka ve diğer şehirler için tamamen zıt olduğunda ortalamanın üzerinde performans gösteriyor.

Çalışma Süresini Etkileyenler yalnızca bir değeri dikkate alır ve bu durum bazen yanıltıcı olabilir. RCA, süreciniz hakkında size daha fazla içgörü vermek için bunların kombinasyonlarını dikkate alır.