Κοινή χρήση μέσω


Επισκόπηση ανάλυσης ριζικής αιτίας

Βρείτε κρυφές συνδέσεις στα δεδομένα σας με την ανάλυση ριζικής αιτίας (RCA). Για παράδειγμα, σας βοηθά να κατανοήσετε γιατί ορισμένες υποθέσεις χρειάζονται περισσότερο χρόνο για την ολοκλήρωση τους από ό,τι άλλες ή γιατί ορισμένες υποθέσεις κολλούν κατά την επανεπεξεργασία ενώ κάποιες άλλες λειτουργούν ομαλά. Η RCA θα σας δείξει τις βασικές διαφορές μεταξύ αυτών των υποθέσεων.

Απαιτούμενα δεδομένα

Η RCA μπορεί να χρησιμοποιήσει όλα τα χαρακτηριστικά, τις μετρήσεις και τις προσαρμοσμένες μετρήσεις σε επίπεδο υπόθεσης για να βρει συνδέσεις μεταξύ τους καθώς και μια μέτρηση της επιλογής σας.

Το καλύτερο δείγμα είναι να συμπεριλάβετε όλα τα δεδομένα που μπορείτε να χρησιμοποιήσετε ως χαρακτηριστικό σε επίπεδο υπόθεσης και να επιτρέψετε στην RCA να επιλέξει ποιο από αυτά επηρεάζει πραγματικά το μετρικό και ποιο όχι.

Πώς λειτουργεί η RCA

Ο αλγόριθμος RCA θα υπολογίσει μια δομή δέντρου όπου κάθε κόμβος θα διαχωρίσει σύνολο δεδομένων σε δύο μικρότερα μέρη. Αυτό βασίζεται σε μία μεταβλητή όπου βρίσκει τον καλύτερο συσχετισμό μεταξύ της διαίρεσης μεταβλητής και του μετρικού προορισμού. Από αυτό, μπορείτε να δείτε τις κρυφές συνδέσεις στα δεδομένα. Αυτό είναι το σημείο όπου θα σας πει ποιος συνδυασμός χαρακτηριστικών θα επηρεάσει την υπόθεση με τον οποίο.

Τρόπος με τον οποίο η RCA εντοπίζει την καλύτερη διαίρεση

Αρχικά, δημιουργούν εκατοντάδες έως χιλιάδες συνδυασμούς πιθανών διαιρέσεων. Στη συνέχεια, επιχειρούμε κάθε διαίρεση για να ανακαλύψουμε πόσο καλά θα διαχωριστεί το σύνολο δεδομένων σε δύο μέρη. Υπολογίζουμε τη διαφορά του κύριου μετρικού σε κάθε μέρος της διαίρεσης και υπολογίζουμε τη βαθμολογία για κάθε διαίρεση με τον ακόλουθο υπολογισμό:

βαθμολογίαδιαίρεση_x = μεταβλητότητααριστερά * αριθμός υποθέσεωναριστερά + μεταβλητότηταδεξιά * αριθμός υποθέσεωνδεξιά

Στη συνέχεια, ταξινομούμε όλες τις διαιρέσεις κατά αυτήν τη βαθμολογία και οι καλύτερες διαιρέσεις λαμβάνονται από την αρχή, με τη μικρότερη βαθμολογία. Για την κατηγορική κύρια μέτρηση (συμβολοσειρά), υπολογίζουμε τη μεταβλητότητα Gini αντί της μεταβλητότητας.

Παράδειγμα RCA

Σε αυτό το παράδειγμα, θέλουμε να δούμε τη ριζική αιτία πίσω από τη διάρκεια της υπόθεσης. Στα δεδομένα, έχουμε χαρακτηριστικά σε επίπεδο υπόθεσης χώρα προμηθευτή, πόλη προμηθευτή, υλικό, συνολικό ποσό και κέντρο κόστους. Η μέση διάρκεια υπόθεσης είναι 46 ώρες.

Κοιτώντας κάθε τιμή κάθε χαρακτηριστικού ξεχωριστά, μπορούμε να δούμε ότι ο μεγαλύτερος επηρεάζοντας της διάρκειας υπόθεσης είναι όταν η πόλη προμηθευτή είναι Graz η οποία κατά μέσο όρο αυξάνει τη διάρκεια της υπόθεσης κατά πρόσθετες 15 ώρες. Από αυτήν την αρχική ανάλυση, μπορούμε να δούμε ότι οι άλλες τιμές των χαρακτηριστικών επηρεάζουν τη μέτρηση προορισμού πολύ λιγότερο. Ωστόσο, όταν υπολογίζουμε το μοντέλο δέντρου, μπορούμε να δούμε ότι ο υπολογισμός παραπάνω είναι παραπλανητικός (όπως στο παρακάτω στιγμιότυπο).

Στιγμιότυπο οθόνης του επηρεάζοντα διάρκειας υπόθεσης.

Η δομή δέντρου έχει την εξής εμφάνιση:

  • Η πρώτη διαίρεση είναι τα δεδομένα κατά μήκος της μεταβλητής υλικό. Τα δεδομένα με αλουμίνιο είναι στη μία πλευρά και όλα τα άλλα υλικά είναι στην άλλη πλευρά.

  • Η διακλάδωση αλουμίνιο διαιρείται περαιτέρω κατά χώρα προμηθευτή σε Γερμανία και Αυστρία.

  • Η διακλάδωση Αυστρία συνεχίζει με διαίρεση ανά πόλη προμηθευτή με Graz στη μία πλευρά και Βιέννη στην άλλη.

  • Στον κόμβο Graz, η μέση υπόθεση ήταν 36 ώρες πιο αργή από τη συνολική μέση διάρκεια των 46 ωρών.

Στο ίδιο δέντρο, μπορούμε να δούμε ότι εάν έχουμε άλλο υλικό εκτός από αλουμίνιο, διαιρείται επίσης με τη μεταβλητή χώρα προμηθευτή όπου από τη μία πλευρά είναι Graz και από την άλλη είναι Βιέννη, Μόναχο ή Φρανκφούρτη. Εδώ όμως, οι τιμές είναι το αντίθετο.  Το Graz διαθέτει πολύ καλύτερα στατιστικά στοιχεία από τη Βιέννη ή οποιαδήποτε πόλη της Γερμανίας, ενώ ο μέσος όρος υποθέσεων στο Graz είναι 15 ώρες ταχύτερος από τον συνολικό μέσο όρο για όλες τις υποθέσεις.

Από αυτό, μπορούμε να δούμε ότι οι αρχικές στατιστικές τιμές είναι διαφορετικές επειδή το Graz δεν τα πάει καλά όταν το υλικό είναι αλουμίνιο, ωστόσο, εκτελεί πάνω από τον μέσο όρο όταν το υλικό δεν είναι αλουμίνιο και είναι εντελώς διαφορετικό για άλλες πόλεις.

Τα στατιστικά Επιρροή διάρκειας υπόθεσης λαμβάνουν υπόψη μόνο μία τιμή και μερικές φορές μπορεί να είναι παραπλανητική. Η RCA λαμβάνει υπόψη συνδυασμούς αυτών, για να σας δώσει περισσότερες πληροφορίες σχετικά με τη διεργασία σας.