Δημιουργία απεικονίσεων σημαντικών παραγόντων επιρροής

ΙΣΕΙ ΓΙΑ: Power BI Desktop Υπηρεσία Power BI

Η απεικόνιση σημαντικών παραγόντων επιρροής σάς βοηθά να κατανοήσετε τους παράγοντες που επηρεάζουν ένα μετρικό που σας ενδιαφέρει. Αναλύει τα δεδομένα σας, ταξινομεί τους παράγοντες που έχουν σημασία και τους εμφανίζει ως σημαντικούς παράγοντες επιρροής. Για παράδειγμα, ας υποθέσουμε ότι θέλετε να καταλάβετε τι επηρεάζει την κύκλο εργασιών των υπαλλήλων, η οποία είναι επίσης γνωστή ως απώλεια. Ένας παράγοντας μπορεί να είναι η διάρκεια της σύμβασης απασχόλησης και ένας άλλος παράγοντας μπορεί να είναι ο χρόνος μετακίνησης.

Πότε να χρησιμοποιείτε σημαντικούς παράγοντες επιρροής

Η απεικόνιση σημαντικών παραγόντων επιρροής είναι μια εξαιρετική επιλογή εάν θέλετε:

  • Δείτε ποιοι παράγοντες επηρεάζουν το μετρικό που αναλύεται.
  • Αναδείξτε τη σχετική σπουδαιότητα αυτών των παραγόντων. Για παράδειγμα, οι βραχυχρόνιες συμβάσεις επηρεάζουν τη μετακίνηση περισσότερο από τις μακροπρόθεσμες συμβάσεις;

Δυνατότητες της απεικόνισης σημαντικών παραγόντων επιρροής

Screenshot of the numbered features of the key influencers visual.

  1. Καρτέλες: Επιλέξτε μια καρτέλα για εναλλαγή μεταξύ των προβολών. Οι σημαντικοί παράγοντες επιρροής σάς εμφανίζουν τους κορυφαίους παράγοντες στην επιλεγμένη τιμή μετρικού. Τα κορυφαία τμήματα εμφανίζουν τα κορυφαία τμήματα που συμβάλλουν στην επιλεγμένη τιμή μετρικού. Ένα τμήμα αποτελείται από έναν συνδυασμό τιμών. Για παράδειγμα, ένα τμήμα μπορεί να είναι οι καταναλωτές που είναι πελάτες για τουλάχιστον 20 έτη και κατοικούν στη δυτική περιοχή.

  2. Αναπτυσσόμενο πλαίσιο: Η τιμή του υπό διερεύνηση μετρικού. Σε αυτό το παράδειγμα, εξετάστε το μετρικό Αξιολόγηση. Η επιλεγμένη τιμή είναι Χαμηλή.

  3. Επανάληψη δήλωσης: Σάς βοηθά να ερμηνεύσετε την απεικόνιση στο αριστερό τμήμα παραθύρου.

  4. Αριστερό τμήμα παραθύρου: Το αριστερό τμήμα παραθύρου περιέχει μία απεικόνιση. Σε αυτή την περίπτωση, το αριστερό τμήμα παραθύρου εμφανίζει μια λίστα με τους πιο σημαντικούς παράγοντες επιρροής.

  5. Επανάληψη δήλωσης: Σάς βοηθά να ερμηνεύσετε την απεικόνιση στο δεξιό τμήμα παραθύρου.

  6. Δεξιό τμήμα παραθύρου: Το δεξιό τμήμα παραθύρου περιέχει μία απεικόνιση. Σε αυτήν την περίπτωση, το γράφημα στηλών εμφανίζει όλες τις τιμές για τον σημαντικό παράγοντα επιρροής Θέμα που επιλέχθηκε στο αριστερό τμήμα παραθύρου. Η συγκεκριμένη τιμή χρηστικότητας από το αριστερό τμήμα παραθύρου εμφανίζεται με πράσινο χρώμα. Όλες οι άλλες τιμές για το Θέμα εμφανίζονται με μαύρο χρώμα.

  7. Γραμμή μέσου όρου: Ο μέσος όρος υπολογίζεται για όλες τις πιθανές τιμές για το Θέμα, με την εξαίρεση της χρηστικότητας (που είναι ο επιλεγμένος παράγοντας επιρροής). Επομένως, ο υπολογισμός εφαρμόζεται σε όλες τις τιμές με μαύρο χρώμα. Σας δείχνει το ποσοστό των άλλων θεμάτων που είχαν χαμηλή αξιολόγηση. Στην περίπτωση αυτή, το 11,35% είχε χαμηλή αξιολόγηση (φαίνεται από τη διακεκομμένη γραμμή).

  8. Πλαίσιο ελέγχου: Φιλτράρει την απεικόνιση στο δεξιό τμήμα παραθύρου για να εμφανίσει μόνο τις τιμές που είναι παράγοντες επιρροής για αυτό το πεδίο. Σε αυτό το παράδειγμα, η απεικόνιση φιλτράρεται για να εμφανίσει τη χρηστικότητα, την ασφάλεια και την περιήγηση.

Ανάλυση μετρικού που είναι κατηγορικό

Παρακολουθήστε αυτό το βίντεο για να μάθετε πώς μπορείτε να δημιουργήσετε μια απεικόνιση σημαντικών παραγόντων επιρροής με κατηγορικό μετρικό. Στη συνέχεια, ακολουθήστε τα βήματα για να δημιουργήσετε μία.

Σημείωμα

Αυτό το βίντεο μπορεί να χρησιμοποιεί παλαιότερες εκδόσεις του Power BI Desktop ή του Υπηρεσία Power BI.

  1. Ο Υπεύθυνος Προϊόντων σας θέλει να διαπιστώσετε ποιοι παράγοντες οδηγούν τους πελάτες να αφήσουν αρνητικούς ελέγχους σχετικά με την υπηρεσία cloud σας. Για να ακολουθήσετε τις οδηγίες στο Power BI Desktop, ανοίξτε το αρχείο PBIX σχολίων πελατών.

Σημείωμα

Το σύνολο δεδομένων σχολίων πελατών βασίζεται στα [Moro και άλλοι, 2014] S. Moro, P. Cortez και P. Rita. "Μια προσέγγιση που βασίζεται σε δεδομένα για την πρόβλεψη της επιτυχίας της τραπεζικής τηλεμάρκετινγκ." Decision Support Systems, Elsevier, 62:22-31, Ιούνιος 2014.

  1. Στην περιοχή Δημιουργία απεικόνισης στο τμήμα παραθύρου Απεικονίσεις , επιλέξτε το εικονίδιο Σημαντικοί παράγοντες επιρροής .

    Screenshot of the Key influencers icon on the Visualizations pane.

  2. Μετακινήστε το μετρικό που θέλετε να διερευνήσετε στο πεδίο Ανάλυση . Για να δείτε τι προκαλεί μια χαμηλή αξιολόγηση της υπηρεσίας από έναν πελάτη, επιλέξτε Αξιολόγηση πίνακα>πελατών.

  3. Μετακινήστε τα πεδία που πιστεύετε ότι μπορεί να επηρεάσουν την Αξιολόγηση στο πεδίο Επεξήγηση κατά . Μπορείτε να μετακινήσετε όσα πεδία θέλετε. Σε αυτή την περίπτωση, ξεκινήστε με:

    • Χώρα-Περιοχή
    • Ρόλος στον οργανισμό
    • Τύπος συνδρομής
    • Μέγεθος εταιρείας
    • Theme
  4. Αφήστε κενό το πεδίο Ανάπτυξη κατά . Αυτό το πεδίο χρησιμοποιείται μόνο κατά την ανάλυση ενός πεδίου μέτρησης ή σύνοψης.

  5. Για να εστιάσετε στις αρνητικές αξιολογήσεις, επιλέξτε Χαμηλή στο αναπτυσσόμενο πλαίσιο Τι επηρεάζει την Αξιολόγηση ώστε να είναι .

    Screenshot of the drop-down box with high and low options.

Η ανάλυση εκτελείται στο επίπεδο πίνακα του πεδίου που αναλύεται. Σε αυτή την περίπτωση, είναι το μετρικό Αξιολόγηση . Αυτό το μετρικό ορίζεται σε επίπεδο πελάτη. Κάθε πελάτης έχει δώσει είτε υψηλή είτε χαμηλή βαθμολογία. Όλοι οι επεξηγηματικοί παράγοντες πρέπει να οριστούν στο επίπεδο πελάτη για να μπορούν να χρησιμοποιηθούν από την απεικόνιση.

Στο προηγούμενο παράδειγμα, όλοι οι επεξηγηματικοί παράγοντες έχουν μια σχέση είτε ενός προς ένα είτε πολλών προς ένα με το μετρικό. Στην περίπτωση αυτή, κάθε πελάτης αναθέσει ένα μοναδικό θέμα στην αξιολόγησή του. Παρομοίως, οι πελάτες προέρχονται από μία χώρα ή περιοχή, έχουν έναν τύπο ιδιότητας μέλους και έχουν έναν ρόλο στον οργανισμό τους. Οι επεξηγηματικοί παράγοντες αποτελούν ήδη χαρακτηριστικά ενός πελάτη και δεν απαιτούνται μετασχηματισμοί. Η απεικόνιση μπορεί να τις χρησιμοποιήσει αμέσως.

Παρακάτω στο εκπαιδευτικό βοήθημα, θα δείτε πιο σύνθετα παραδείγματα που έχουν σχέσεις "ένα-προς-πολλά". Σε αυτές τις περιπτώσεις, οι στήλες πρέπει πρώτα να συναθροιστούν στο επίπεδο πελάτη για να μπορέσετε να εκτελέσετε την ανάλυση.

Οι μετρήσεις και τα συγκεντρωτικά αποτελέσματα που χρησιμοποιούνται ως επεξηγηματικοί παράγοντες αξιολογούνται επίσης σε επίπεδο πίνακα του μετρικού Ανάλυση . Ορισμένα παραδείγματα εμφανίζονται παρακάτω σε αυτό το άρθρο.

Ερμηνεία κατηγορικών σημαντικών παραγόντων επιρροής

Ας ρίξουμε μια ματιά στους σημαντικούς παράγοντες επιρροής για τις χαμηλές αξιολογήσεις.

Κορυφαίος μοναδικός παράγοντας που επηρεάζει την πιθανότητα για χαμηλή αξιολόγηση

Ο πελάτης σε αυτό το παράδειγμα μπορεί να έχει τρεις ρόλους: καταναλωτής, διαχειριστής και εκδότης. Το να είσαι καταναλωτής είναι ο κορυφαίος παράγοντας που συμβάλλει σε μια χαμηλή αξιολόγηση.

Screenshot of key influencers, with Role in Org is consumer selected.

Πιο συγκεκριμένα, οι καταναλωτές είναι 2,57 φορές πιο πιθανό να δώσουν στην υπηρεσία σας αρνητική βαθμολογία. Το γράφημα σημαντικών παραγόντων επιρροής παραθέτει τον παράγοντα Ο ρόλος στον οργανισμό είναι καταναλωτής πρώτα στη λίστα στα αριστερά. Επιλέγοντας Ο ρόλος στον οργανισμό είναι καταναλωτής, το Power BI εμφανίζει περισσότερες λεπτομέρειες στο δεξιό τμήμα παραθύρου. Εμφανίζεται το συγκριτικό εφέ κάθε ρόλου για την πιθανότητα για χαμηλή αξιολόγηση.

  • Το 14,93% των καταναλωτών δίνουν χαμηλή βαθμολογία.
  • Κατά μέσο όρο, όλοι οι ρόλοι δίνουν χαμηλή βαθμολογία κατά το 5,78% του χρόνου.
  • Οι καταναλωτές έχουν 2,57 φορές μεγαλύτερη πιθανότητα να δώσουν χαμηλή βαθμολογία σε σύγκριση με όλους τους άλλους ρόλους. Μπορείτε να προσδιορίσετε αυτή τη βαθμολογία διαιρώντας την πράσινη ράβδο με την κόκκινη διακεκομμένη γραμμή.

Δεύτερος μοναδικός παράγοντας που επηρεάζει την πιθανότητα για χαμηλή αξιολόγηση

Η απεικόνιση σημαντικών παραγόντων επιρροής συγκρίνει και κατατάσσει παράγοντες από πολλές διαφορετικές μεταβλητές. Ο δεύτερος σημαντικός παράγοντας επιρροής δεν έχει καμία σχέση με τον παράγοντα Ρόλος στον οργανισμό. Επιλέξτε τον δεύτερο σημαντικό παράγοντα επιρροής στη λίστα, ο οποίος είναι Το Θέμα είναι χρηστικότητα.

Screenshot of key influencers, with Theme is usability selected.

Ο δεύτερος πιο σημαντικός παράγοντας σχετίζεται με το θέμα της κριτικής του πελάτη. Οι πελάτες που έστειλαν σχόλια σχετικά με τη χρηστικότητα του προϊόντος ήταν 2,55 φορές πιο πιθανό να δώσουν χαμηλή βαθμολογία σε σύγκριση με τους πελάτες που σχολίασαν άλλα θέματα, όπως η αξιοπιστία, η σχεδίαση ή η ταχύτητα.

Μεταξύ των απεικονίσεων, ο μέσος όρος, ο οποίος εμφανίζεται από την κόκκινη διακεκομμένη γραμμή, άλλαξε από 5,78% σε 11,35%. Ο μέσος όρος είναι δυναμικός καθώς βασίζεται στον μέσο όρο όλων των άλλων τιμών. Για τον πρώτο σημαντικό παράγοντα επιρροής, ο μέσος όρος εξέθετε τον ρόλο πελάτη. Για τον δεύτερο σημαντικό παράγοντα επιρροής, εξέκλεισε το θέμα χρηστικότητας.

Επιλέξτε το πλαίσιο ελέγχου Εμφάνιση μόνο των τιμών που είναι παράγοντες επιρροής για να φιλτράρετε χρησιμοποιώντας μόνο τις τιμές επιρροής. Σε αυτή την περίπτωση, είναι οι ρόλοι που οδηγούν σε χαμηλή βαθμολογία. 12 θέματα μειώνονται στα τέσσερα που το Power BI αναγνώρισε ως θέματα που οδηγούν σε χαμηλές αξιολογήσεις.

Screenshot of check box to only show values that are influencers.

Αλληλεπίδραση με άλλες απεικονίσεις

Κάθε φορά που επιλέγετε έναν αναλυτή, φίλτρο ή άλλη απεικόνιση στον καμβά, η απεικόνιση σημαντικών παραγόντων επιρροής εκ νέου εκ νέου την ανάλυσή της στο νέο τμήμα δεδομένων. Για παράδειγμα, μπορείτε να μετακινήσετε το Μέγεθος εταιρείας στην αναφορά και να το χρησιμοποιήσετε ως αναλυτή. Χρησιμοποιήστε το για να δείτε εάν οι σημαντικοί παράγοντες επιρροής για τους εταιρικούς πελάτες σας είναι διαφορετικοί από ότι για το γενικό πληθυσμό. Ένα εταιρικό μέγεθος εταιρείας είναι μεγαλύτερο από 50.000 υπαλλήλους.

Επιλέξτε >50.000 για να επαναλάβετε την ανάλυση και μπορείτε να δείτε ότι οι παράγοντες επιρροής έχουν αλλάξει. Για τους πελάτες που είναι μεγάλες επιχειρήσεις, ο κορυφαίος παράγοντας επιρροής για τις χαμηλές αξιολογήσεις είναι να έχουν θέμα που σχετίζεται με την ασφάλεια. Μπορεί να θέλετε να το διερευνήσετε περαιτέρω για να δείτε εάν υπάρχουν δυνατότητες ασφάλειας που δεν είναι ικανοποιημένες από τους μεγάλους πελάτες σας.

Screenshot of visual to select by company size.

Ερμηνεία συνεχών σημαντικών παραγόντων επιρροής

Μέχρι στιγμής, έχετε δει πώς μπορείτε να χρησιμοποιήσετε την απεικόνιση για να εξερευνήσετε πώς διαφορετικά κατηγορικά πεδία επηρεάζουν τις χαμηλές αξιολογήσεις. Είναι επίσης δυνατό να υπάρχουν συνεχείς παράγοντες, όπως η ηλικία, το ύψος και η τιμή στο πεδίο Επεξήγηση κατά . Ας δούμε τι θα συμβεί όταν το στοιχείο Διάρκεια μετακινηθεί από τον πίνακα πελάτη στην ενότητα Επεξήγηση κατά. Η "Διάρκεια" απεικονίζει το χρονικό διάστημα κατά το οποίο ένας πελάτης έχει χρησιμοποιήσει την υπηρεσία.

Καθώς αυξάνεται η διάρκεια, αυξάνεται επίσης και η πιθανότητα για τη λήψη χαμηλότερης βαθμολογίας. Αυτή η τάση υποδηλώνει ότι οι μακροχρόνιοι πελάτες είναι πιο πιθανό να δώσουν αρνητική βαθμολογία. Αυτή η δεδομενική πληροφορία έχει ενδιαφέρον και ίσως θελήσετε να την λάβετε αργότερα.

Η απεικόνιση δείχνει ότι κάθε φορά που η διάρκεια αυξάνεται κατά 13,44 μήνες, κατά μέσο όρο η πιθανότητα για μια χαμηλή αξιολόγηση αυξάνεται κατά 1,23 φορές. Στην περίπτωση αυτή, οι 13,44 μήνες απεικονίζουν την τυπική απόκλιση της διάρκειας. Επομένως, η δεδομενικές πληροφορίες που λαμβάνετε εξετάζει πώς η αύξηση της διάρκειας κατά ένα τυπικό ποσό, που είναι η τυπική απόκλιση της διάρκειας, επηρεάζει την πιθανότητα λήψης μιας χαμηλής αξιολόγησης.

Το γράφημα διασποράς στο δεξιό τμήμα παραθύρου σχεδιάζει το μέσο ποσοστό των χαμηλών αξιολογήσεων για κάθε τιμή της διάρκειας. Επισημαίνει την κλίση με μια γραμμή τάσης.

Screenshot of scatter plot for Tenure.

Αποθήκευση συνεχών σημαντικών παραγόντων επιρροής

Σε ορισμένες περιπτώσεις, μπορεί να διαπιστώσετε ότι οι συνεχείς παράγοντές σας μετατράπηκαν αυτόματα σε κατηγορικούς. Εάν η σχέση μεταξύ των μεταβλητών δεν είναι γραμμική, δεν μπορούμε να περιγράψουμε ότι η σχέση απλώς αυξάνεται ή μειώνεται (όπως κάναμε στο παραπάνω παράδειγμα).

Εκτελούμε δοκιμές συσχέτισης για να προσδιορίσουμε τον γραμμικό τρόπο του επηρεασμού σχετικά με τον στόχο. Εάν ο στόχος είναι συνεχής, εκτελούμε συσχέτιση Pearson και, εάν ο στόχος είναι κατηγορικός, εκτελούμε δοκιμές σημειακής δισειριακής συσχέτισης. Εάν εντοπίσουμε ότι η σχέση δεν είναι αρκετά γραμμική, διεξάγουμε εποπτευόμενη αποθήκευση και δημιουργούμε έως και πέντε θέσεις αποθήκευσης. Για να καταλάβουμε ποιες θέσεις αποθήκευσης έχουν περισσότερο νόημα, χρησιμοποιούμε μια εποπτευόμενη μέθοδο αποθήκευσης που εξετάζει τη σχέση μεταξύ του επεξηγηματικού παράγοντα και του στόχου που αναλύεται.

Ερμηνεία μετρήσεων και συγκεντρωτικών τιμών ως σημαντικών παραγόντων επιρροής

Μπορείτε να χρησιμοποιήσετε μετρήσεις και συγκεντρωτικές τιμές ως επεξηγηματικούς παράγοντες μέσα στην ανάλυσή σας. Για παράδειγμα, μπορεί να θέλετε να δείτε τι επίδραση έχει το πλήθος δελτίων υποστήριξης πελατών ή η μέση διάρκεια ενός ανοιχτού δελτίου στη βαθμολογία που λαμβάνετε.

Στην περίπτωση αυτή, θέλετε να δείτε εάν ο αριθμός δελτίων υποστήριξης που έχει ένας πελάτης επηρεάζει τη βαθμολογία που δίνει. Τώρα, εισαγάγετε το Αναγνωριστικό δελτίου υποστήριξης από τον πίνακα "Δελτίο υποστήριξης". Επειδή ένας πελάτης μπορεί να έχει πολλά δελτία υποστήριξης, συγκεντρώνετε το αναγνωριστικό στο επίπεδο πελάτη. Η συνάθροιση είναι σημαντική καθώς η ανάλυση εκτελείται στο επίπεδο πελάτη, επομένως, όλοι οι παράγοντες οδήγησης πρέπει να οριστούν σε αυτό το επίπεδο υποδιαίρεσης.

Ας δούμε το πλήθος των αναγνωριστικών. Κάθε γραμμή πελάτη έχει ένα πλήθος δελτίων υποστήριξης που σχετίζονται με αυτή. Στην περίπτωση αυτή, καθώς το πλήθος των δελτίων υποστήριξης αυξάνεται, η πιθανότητα χαμηλής αξιολόγησης αυξάνεται κατά 4,08 φορές. Η απεικόνιση στη δεξιά πλευρά εμφανίζει τον μέσο όρο των δελτίων υποστήριξης με διαφορετικές τιμές Αξιολόγησης , με αξιολόγηση σε επίπεδο πελάτη.

Screenshot that shows influence of Support Ticket ID.

Ερμηνεία των αποτελεσμάτων: Κορυφαία τμήματα

Μπορείτε να χρησιμοποιήσετε την καρτέλα Σημαντικοί παράγοντες επιρροής για να αξιολογήσετε μεμονωμένα κάθε παράγοντα. Μπορείτε επίσης να χρησιμοποιήσετε την καρτέλα Κορυφαία τμήματα για να δείτε πώς ένας συνδυασμός παραγόντων επηρεάζει το μετρικό που αναλύετε.

Τα κορυφαία τμήματα αρχικά εμφανίζουν μια επισκόπηση όλων των τμημάτων που έχει εντοπίσει το Power BI. Το παρακάτω παράδειγμα δείχνει ότι βρέθηκαν έξι τμήματα. Αυτά τα τμήματα κατατάσσονται κατά το ποσοστό των χαμηλών αξιολογήσεων εντός του τμήματος. Για παράδειγμα, στο τμήμα 1, το 74,3% των αξιολογήσεων πελατών είναι χαμηλές. Όσο υψηλότερη είναι η φυσαλίδα, τόσο υψηλότερο είναι το ποσοστό των χαμηλών αξιολογήσεων. Το μέγεθος της φυσαλίδας αντιπροσωπεύει τον αριθμό των πελατών που βρίσκονται εντός του τμήματος.

Screenshot of Top segments tab selected.

Η επιλογή μιας φυσαλίδας εμφανίζει τις λεπτομέρειες αυτού του τμήματος. Εάν επιλέξετε Τμήμα 1, για παράδειγμα, βρίσκετε ότι αποτελείται από σχετικά καθιερωμένους πελάτες. Είναι πελάτες για πάνω από 29 μήνες και έχουν περισσότερα από τέσσερα δελτία υποστήριξης. Τέλος, δεν είναι εκδότες, επομένως είναι είτε καταναλωτές είτε διαχειριστές.

Σε αυτή την ομάδα, το 74,3% των πελατών έδωσαν χαμηλή αξιολόγηση. Ο μέσος πελάτης έδωσε χαμηλή αξιολόγηση κατά 11,7% του χρόνου, επομένως, αυτό το τμήμα έχει μεγαλύτερο ποσοστό χαμηλών αξιολογήσεων. Είναι 63 ποσοστιαίες μονάδες υψηλότερο. Το τμήμα 1 περιέχει επίσης περίπου το 2,2% των δεδομένων, επομένως αντιπροσωπεύει ένα αναγνωρίσιμο τμήμα του πληθυσμού.

Screenshot of top segment according to rating.

Προσθήκη μετρήσεων

Ορισμένες φορές ένας παράγοντας επιρροής μπορεί να έχει σημαντική επίδραση, αλλά να αντιπροσωπεύει λίγα από τα δεδομένα. Για παράδειγμα, το Θέμα είναι χρηστικότητα είναι ο τρίτος μεγαλύτερος παράγοντας επιρροής για χαμηλές αξιολογήσεις. Ωστόσο, ενδέχεται να υπήρχαν ελάχιστοι πελάτες που παραπονέθηκαν σχετικά με τη χρηστικότητα. Οι μετρήσεις μπορούν να σας βοηθήσουν να ιεραρχήσετε τους παράγοντες επιρροής στους οποίους θέλετε να εστιάσετε.

Μπορείτε να ενεργοποιήσετε τις μετρήσεις μέσω της κάρτας Ανάλυση του τμήματος παραθύρου μορφοποίησης.

Screenshot of enable counts slider in the Format pane.

Αφού ενεργοποιηθούν οι μετρήσεις, θα δείτε ένα δακτυλίδι γύρω από τη φυσαλίδα κάθε παράγοντα επιρροής, το οποίο αντιπροσωπεύει το κατά προσέγγιση ποσοστό δεδομένων που περιέχει ο παράγοντας επιρροής. Όσο περισσότερο από τη φυσαλίδα κυκλώνει το δακτυλίδι, τόσο περισσότερα δεδομένα περιέχει. Μπορούμε να δούμε ότι το Θέμα είναι χρηστικότητα περιέχει ένα μικρό ποσοστό δεδομένων.

Screenshot of rings that around influencer bubbles that represent counts.

Μπορείτε επίσης να χρησιμοποιήσετε το κουμπί εναλλαγής Ταξινόμηση κατά στο κάτω αριστερό μέρος της απεικόνισης για να ταξινομήσετε τις φυσαλίδες πρώτα κατά μέτρηση, αντί για επίδραση. Ο Τύπος συνδρομής είναι Premier είναι ο κορυφαίος παράγοντας επιρροής με βάση το πλήθος.

Screenshot of the Sort by toggle to sort by counts first.

Ένα πλήρες δακτυλίδι γύρω από τον κύκλο σημαίνει ότι ο παράγοντας επιρροής περιέχει το 100% των δεδομένων. Μπορείτε να αλλάξετε τον τύπο πλήθους σε σχετικό προς τον μέγιστο παράγοντα επιρροής, χρησιμοποιώντας την αναπτυσσόμενη λίστα Τύπος πλήθους στην κάρτα Ανάλυση του τμήματος παραθύρου μορφοποίησης. Τώρα, ο παράγοντας επιρροής με τα περισσότερα δεδομένα θα αντιπροσωπεύεται από ένα πλήρες δακτυλίδι και όλες οι άλλες μετρήσεις θα είναι σχετικές με αυτό.

Screenshot that shows the relative counts drop-down menu.

Ανάλυση μετρικού που είναι αριθμητικό

Εάν μετακινήσετε ένα μη συνοπτικό αριθμητικό πεδίο στο πεδίο Ανάλυση , μπορείτε να επιλέξετε τον τρόπο χειρισμού αυτού του σεναρίου. Μπορείτε να αλλάξετε τη συμπεριφορά της απεικόνισης, μεταβαίνοντας στο παράθυρο μορφοποίησης και κάνοντας εναλλαγή μεταξύ των τύπων Τύπος κατηγορικής ανάλυσης και Τύπος συνεχούς ανάλυσης.

Screenshot of drop-down menu to change from categorical to continuous.

Ένας Τύπος κατηγορικής ανάλυσης συμπεριφέρεται όπως περιγράφεται παραπάνω. Για παράδειγμα, εάν ερευνούσατε βαθμολογίες έρευνας που κυμαίνονται από 1 έως 10, θα μπορούσατε να ρωτήσετε "Τι επηρεάζει τις βαθμολογίες της έρευνας για να είναι 1;"

Ένας Τύπος συνεχούς ανάλυσης αλλάζει την ερώτηση σε συνεχή. Στο παραπάνω παράδειγμα, η νέα ερώτηση θα είναι "Τι επηρεάζει τις βαθμολογίες της έρευνας ώστε να αυξηθούν/μειωθούν;"

Αυτή η διάκριση είναι χρήσιμη όταν έχετε πολλές μοναδικές τιμές στο πεδίο που αναλύετε. Στο παρακάτω παράδειγμα, εξετάζουμε τις τιμές των κατοικιών. Δεν έχει νόημα να ρωτήσουμε "Τι επηρεάζει την τιμή της κατοικίας να είναι 156.214;" καθώς αυτό είναι πολύ συγκεκριμένο και είναι πιθανό να μην έχουμε αρκετά δεδομένα για να συνάγουμε ένα μοτίβο.

Αντί για αυτό, μπορούμε να ρωτήσουμε "Τι επηρεάζει την αύξηση της τιμής των κατοικιών"; πράγμα που μας επιτρέπει να αντιμετωπίζουμε τις τιμές των κατοικιών ως εύρος τιμών και όχι ως διακριτές τιμές.

Screenshot of drop-down options to choose influencers.

Ερμηνεία των αποτελεσμάτων: Σημαντικοί παράγοντες επιρροής

Σημείωμα

Τα παραδείγματα σε αυτήν την ενότητα χρησιμοποιούν δεδομένα τιμών κατοικιών δημόσιου τομέα. Μπορείτε να κάνετε λήψη του δείγματος συνόλου δεδομένων εάν θέλετε να ακολουθήσετε τις οδηγίες.

Σε αυτό το σενάριο, εξετάζουμε το θέμα "Τι επηρεάζει την αύξηση της τιμής των κατοικιών". Ορισμένοι επεξηγηματικοί παράγοντες θα μπορούσαν να επηρεάσουν μια τιμή κατοικίας όπως Year Built (έτος κατασκευής της κατοικίας), KitchenQual (ποιότητα κουζίνας) και YearRemodAdd (έτος αναπαλαίωσης της κατοικίας).

Στο παρακάτω παράδειγμα, εξετάζουμε τον κορυφαίο παράγοντα επιρροής μας, ο οποίος είναι η ποιότητα της κουζίνας που είναι Εξαιρετική. Τα αποτελέσματα είναι παρόμοια με αυτά που είδαμε όταν αναλύαμε κατηγορικές μετρήσεις με μερικές σημαντικές διαφορές:

  • Το γράφημα στηλών στη δεξιά πλευρά εξετάζει τους μέσους όρους και όχι τα ποσοστά. Επομένως, μας δείχνει ποια είναι η μέση τιμή κατοικίας μιας κατοικίας με εξαιρετική κουζίνα (πράσινη ράβδος) σε σύγκριση με τη μέση τιμή κατοικίας μιας κατοικίας χωρίς εξαιρετική κουζίνα (διακεκομμένη γραμμή)
  • Ο αριθμός στη φυσαλίδα εξακολουθεί να είναι η διαφορά μεταξύ της κόκκινης διακεκομμένης γραμμής και της πράσινης ράβδου, αλλά εκφράζεται ως αριθμός (158.49 χιλ.) αντί για πιθανότητα (1,93x). Έτσι, κατά μέσο όρο, οι κατοικίες με εξαιρετική κουζίνα είναι σχεδόν 160.000 δολάρια πιο ακριβές από τις κατοικίες χωρίς εξαιρετική κουζίνα.

Screenshot of numeric target categorical influencers.

Στο παρακάτω παράδειγμα, εξετάζουμε την επίδραση που έχει ένας συνεχής παράγοντας (έτος αναπαλαίμησης κατοικίας) στην τιμή της κατοικίας. Οι διαφορές σε σύγκριση με τον τρόπο με τον οποίο αναλύουμε τους συνεχείς παράγοντες επιρροής για τα κατηγορικά μετρικά είναι οι εξής:

  • Το γράφημα διασποράς στο δεξιό τμήμα παραθύρου σχεδιάζει τη μέση τιμή κατοικίας για κάθε διακριτή τιμή του έτους που αναπαλαιώθηκε.
  • Η τιμή στη φυσαλίδα δείχνει πόσο αυξάνεται η μέση τιμή των κατοικιών (στην προκειμένη περίπτωση 2,87 χιλ. δολάρια) όταν το έτος που αναπαλαιώθηκε η κατοικία αυξάνεται με την τυπική του απόκλιση (στη συγκεκριμένη περίπτωση 20 χρόνια)

Screenshot of numeric target continuous influencers.

Τέλος, στην περίπτωση των μετρήσεων, εξετάζουμε τον μέσο όρο έτους που χτίστηκε ένα σπίτι. Η ανάλυση έχει ως εξής:

  • Το γράφημα διασποράς στο δεξιό τμήμα παραθύρου σχεδιάζει τη μέση τιμή κατοικίας για κάθε διακριτή τιμή στον πίνακα
  • Η τιμή στη φυσαλίδα δείχνει πόσο αυξάνεται η μέση τιμή των κατοικιών (στην προκειμένη περίπτωση 1,35 χιλ. δολάρια) όταν ο μέσος όρος του έτους αυξάνεται με την τυπική του απόκλιση (στη συγκεκριμένη περίπτωση 30 έτη)

Screenshot of Key influencers for house prices with influencers on the left and the scatterplot on the right.

Ερμηνεία των αποτελεσμάτων: Κορυφαία τμήματα

Τα κορυφαία τμήματα για αριθμητικούς στόχους δείχνουν ομάδες όπου οι τιμές κατοικιών είναι κατά μέσο όρο υψηλότερες από ό,τι στο συνολικό σύνολο δεδομένων. Για παράδειγμα, παρακάτω μπορούμε να δούμε ότι το Τμήμα 1 αποτελείται από κατοικίες όπου το GarageCars (ο αριθμός των αυτοκινήτων που μπορεί να χωρέσει το γκαράζ) είναι μεγαλύτερος από 2 και το RoofStyle είναι Hip. Οι κατοικίες με αυτά τα χαρακτηριστικά έχουν μέση τιμή 355 χιλ. δολάρια σε σύγκριση με τον συνολικό μέσο όρο των δεδομένων που είναι 180 χιλ. δολάρια.

Screenshot that shows Top segments for house prices.

Ανάλυση μετρικού που είναι μέτρηση ή συνοπτική στήλη

Στην περίπτωση μέτρησης ή συνοπτικής στήλης, η ανάλυση λαμβάνει προεπιλεγμένη τιμή Τύπος συνεχούς ανάλυσης που περιγράφεται παραπάνω. Δεν μπορεί να αλλάξει. Η μεγαλύτερη διαφορά μεταξύ της ανάλυσης μιας μέτρησης/συνοπτικής στήλης και μιας μη συνοπτικής αριθμητικής στήλης είναι το επίπεδο στο οποίο εκτελείται η ανάλυση.

Στην περίπτωση μη συνοπτικών στηλών, η ανάλυση εκτελείται πάντα στο επίπεδο πίνακα. Στο παραπάνω παράδειγμα τιμής κατοικίας, αναλύσαμε το μετρικό Τιμή κατοικίας για να δούμε τι επηρεάζει μια τιμή κατοικίας ώστε να αυξηθεί/μειωθεί. Η ανάλυση εκτελείται αυτόματα στο επίπεδο πίνακα. Ο πίνακάς μας διαθέτει ένα μοναδικό αναγνωριστικό για κάθε σπίτι, επομένως η ανάλυση εκτελείται σε επίπεδο κατοικίας.

Screenshot that shows the table level analysis for the house price example.

Για μετρήσεις και συνοπτικές στήλες, δεν γνωρίζουμε αμέσως το επίπεδο στο οποίο θα αναλυθούν. Εάν η Τιμή κατοικίας συνοψίζεται ως Μέσος όρος, θα πρέπει να εξετάσουμε το επίπεδο στο οποίο θα θέλαμε να υπολογιστεί αυτή η μέση τιμή κατοικίας. Είναι η μέση τιμή κατοικίας σε επίπεδο γειτονιάς; Ή ίσως σε περιφερειακό επίπεδο;

Οι μετρήσεις και οι συνοπτικές στήλες αναλύονται αυτόματα στο επίπεδο των πεδίων Επεξήγηση κατά που χρησιμοποιούνται. Φανταστείτε ότι έχουμε τρία πεδία Επεξήγηση κατά για τα οποία ενδιαφερόμαστε: Ποιότητα κουζίνας, Τύπος κατασκευής και Κλιματισμός. Η Μέση τιμή κατοικίας θα υπολογιστεί για κάθε μοναδικό συνδυασμό αυτών των τριών πεδίων. Συχνά είναι χρήσιμο να μεταβείτε σε μια προβολή πίνακα για να δείτε την εμφάνιση των δεδομένων που αξιολογούνται.

Screenshot that shows the three columns and the average house price.

Αυτή η ανάλυση είναι πολύ συνοπτική και επομένως θα είναι δύσκολο για το μοντέλο παλινδρόμησης να εντοπίσει τυχόν μοτίβα στα δεδομένα από τα οποία μπορεί να διδαχθεί. Θα πρέπει να εκτελέσουμε την ανάλυση σε ένα πιο λεπτομερές επίπεδο για να λάβουμε καλύτερα αποτελέσματα. Εάν θέλαμε να αναλύσουμε την τιμή κατοικίας στο επίπεδο κατοικίας, θα πρέπει να προσθέσουμε ρητά το πεδίο αναγνωριστικό στην ανάλυση. Ωστόσο, δεν θέλουμε το αναγνωριστικό κατοικίας να θεωρείται παράγοντας επιρροής. Δεν είναι χρήσιμο να μάθατε ότι καθώς αυξάνεται το αναγνωριστικό κατοικίας, αυξάνεται η τιμή μιας κατοικίας. Η επιλογή ενότητας πεδίων Ανάπτυξη κατά είναι εύχρηστη εδώ. Μπορείτε να χρησιμοποιήσετε την Ανάπτυξη κατά για να προσθέσετε πεδία που θέλετε να χρησιμοποιήσετε για τον ορισμό του επιπέδου ανάλυσης χωρίς να αναζητήσετε νέους παράγοντες επιρροής.

Ρίξτε μια ματιά στην εμφάνιση της απεικόνισης όταν προσθέσουμε το αναγνωριστικό στην Ανάπτυξη κατά. Αφού έχετε ορίσει το επίπεδο στο οποίο θέλετε να αξιολογηθεί η μέτρησή σας, η ερμηνεία των παραγόντων επιρροής είναι ακριβώς η ίδια με τις μη συνοπτικές αριθμητικές στήλες.

Screenshot that shows the house price visualization that depends on the three columns discussed in this section.

Εάν θέλετε να μάθετε περισσότερα σχετικά με τον τρόπο ανάλυσης μετρήσεων με την απεικόνιση σημαντικών παραγόντων επιρροής, παρακολουθήστε το παρακάτω βίντεο. Για να μάθετε πώς το Power BI χρησιμοποιεί ML.NET στο παρασκήνιο για να εξηγήσει πληροφορίες με φυσικό τρόπο, ανατρέξτε στο θέμα Το Power BI προσδιορίζει σημαντικούς παράγοντες επιρροής χρησιμοποιώντας ML.NET.

Σημείωμα

Αυτό το βίντεο μπορεί να χρησιμοποιεί παλαιότερες εκδόσεις του Power BI Desktop ή του Υπηρεσία Power BI.

Ζητήματα και αντιμετώπιση προβλημάτων

Ποιοι είναι οι περιορισμοί για την απεικόνιση;

Η απεικόνιση σημαντικών παραγόντων επιρροής έχει ορισμένους περιορισμούς:

  • Δεν υποστηρίζεται το Direct Query
  • Δεν υποστηρίζεται δυναμική Σύνδεση μονή για Υπηρεσίες Ανάλυσης του Azure και Υπηρεσίες ανάλυσης του SQL Server
  • Η δημοσίευση στο web δεν υποστηρίζεται
  • Απαιτείται .NET Framework 4.6 ή νεότερη έκδοση
  • Η ενσωμάτωση του SharePoint Online δεν υποστηρίζεται

Screenshot of drop-down choices for numeric question

Εμφανίζεται ένα σφάλμα που αναφέρει ότι δεν βρέθηκαν παράγοντες επιρροής ή τμήματα. Γιατί συμβαίνει αυτό;

Screenshot of no influencers found error message.

Αυτό το σφάλμα παρουσιάζεται όταν έχετε συμπεριλάβει πεδία στην ενότητα Επεξήγηση κατά , αλλά δεν βρέθηκαν παράγοντες επιρροής.

  • Έχετε συμπεριλάβει το μετρικό που αναλύατε στην Ανάλυση και Επεξήγηση κατά. Καταργήστε το από την ενότητα Επεξήγηση κατά.
  • Τα επεξηγηματικά πεδία έχουν πάρα πολλές κατηγορίες με λίγες παρατηρήσεις. Αυτή η κατάσταση δυσχεραίνει τον προσδιορισμό των παραγόντων που είναι παράγοντες επιρροής από την απεικόνιση. Είναι δύσκολο να γίνει γενίκευση με βάση μόνο μερικές παρατηρήσεις. Εάν αναλύετε ένα αριθμητικό πεδίο, μπορεί να θέλετε να μεταβείτε από Κατηγορική ανάλυση σε Συνεχή ανάλυση στο τμήμα παραθύρου μορφοποίησης στην κάρτα Ανάλυση .
  • Οι επεξηγηματικοί παράγοντες έχουν αρκετές παρατηρήσεις για να γενικευτούν, αλλά η απεικόνιση δεν βρήκε τυχόν χαρακτηριστικές συσχετίσεις για να αναφέρει.

Εμφανίζεται ένα σφάλμα ότι το μετρικό που αναλύω δεν έχει αρκετά δεδομένα για να εκτελέσω την ανάλυση. Γιατί συμβαίνει αυτό;

Screenshot of not enough data error message.

Η απεικόνιση λειτουργεί εξετάζοντας τα μοτίβα στα δεδομένα για μία ομάδα σε σύγκριση με άλλες ομάδες. Για παράδειγμα, αναζητά πελάτες που έδωσαν χαμηλές αξιολογήσεις σε σύγκριση με πελάτες που έδωσαν υψηλές αξιολογήσεις. Εάν τα δεδομένα στο μοντέλο σας έχουν μόνο λίγες παρατηρήσεις, είναι δύσκολο να εντοπιστούν μοτίβα. Εάν η απεικόνιση δεν έχει αρκετά δεδομένα για να εντοπιστούν χαρακτηριστικοί παράγοντες επιρροής, υποδεικνύει ότι απαιτούνται περισσότερα δεδομένα για την εκτέλεση της ανάλυσης.

Συνιστούμε να έχετε τουλάχιστον 100 παρατηρήσεις για την επιλεγμένη κατάσταση. Σε αυτή την περίπτωση, η κατάσταση είναι οι πελάτες που χάνονται. Χρειάζεστε επίσης τουλάχιστον 10 παρατηρήσεις για τις καταστάσεις που χρησιμοποιείτε για τη σύγκριση. Σε αυτή την περίπτωση, η κατάσταση σύγκρισης είναι οι πελάτες που δεν χάνονται.

Εάν αναλύετε ένα αριθμητικό πεδίο, μπορεί να θέλετε να μεταβείτε από Κατηγορική ανάλυση σε Συνεχή ανάλυση στο τμήμα παραθύρου μορφοποίησης στην κάρτα Ανάλυση .

Εμφανίζεται ένα σφάλμα που όταν η "Ανάλυση" δεν συνοψίζεται, η ανάλυση εκτελείται πάντα στο επίπεδο γραμμής του γονικού της πίνακα. Δεν επιτρέπεται η αλλαγή αυτού του επιπέδου μέσω των πεδίων "Ανάπτυξη κατά". Γιατί συμβαίνει αυτό;

Κατά την ανάλυση μιας αριθμητικής ή κατηγορικής στήλης, η ανάλυση εκτελείται πάντα στο επίπεδο πίνακα. Για παράδειγμα, εάν αναλύετε τιμές κατοικιών και ο πίνακάς σας περιέχει μια στήλη αναγνωριστικού, η ανάλυση θα εκτελείται αυτόματα στο επίπεδο αναγνωριστικού κατοικίας.

Όταν αναλύετε μια μέτρηση ή συνοπτική στήλη, πρέπει να δηλώσετε ρητά σε ποιο επίπεδο θα θέλατε να εκτελείται η ανάλυση. Μπορείτε να χρησιμοποιήσετε την Ανάπτυξη κατά για να αλλάξετε το επίπεδο της ανάλυσης για μετρήσεις και συνοπτικές στήλες, χωρίς να προσθέσετε νέους παράγοντες επιρροής. Εάν η Τιμή κατοικίας ορίστηκε ως μέτρηση, μπορείτε να προσθέσετε τη στήλη αναγνωριστικού κατοικίας στην Ανάπτυξη κατά για να αλλάξετε το επίπεδο της ανάλυσης.

Εμφανίζεται ένα σφάλμα ότι ένα πεδίο στην ενότητα Επεξήγηση κατά δεν σχετίζεται με μοναδικό τρόπο με τον πίνακα που περιέχει το μετρικό που αναλύω. Γιατί συμβαίνει αυτό;

Η ανάλυση εκτελείται στο επίπεδο πίνακα του πεδίου που αναλύεται. Για παράδειγμα, εάν αναλύετε σχόλια πελατών για την υπηρεσία σας, μπορεί να έχετε έναν πίνακα που σας υποδεικνύει εάν ένας πελάτης έδωσε μια υψηλή αξιολόγηση ή μια χαμηλή αξιολόγηση. Σε αυτή την περίπτωση, η ανάλυσή σας εκτελείται στο επίπεδο πίνακα πελάτη.

Εάν έχετε έναν σχετικό πίνακα που έχει οριστεί σε επίπεδο μεγαλύτερης λεπτομέρειας από τον πίνακα που περιέχει το μετρικό σας, εμφανίζεται αυτό το σφάλμα. Ακολουθεί ένα παράδειγμα:

  • Αναλύετε τι προκαλεί τις χαμηλές αξιολογήσεις της υπηρεσίας σας από τους πελάτες.
  • Θέλετε να δείτε εάν η συσκευή στην οποία ο πελάτης χρησιμοποιεί την υπηρεσία επηρεάζει τους ελέγχους που δίνει.
  • Ένας πελάτης μπορεί να χρησιμοποιεί την υπηρεσία με πολλούς διαφορετικούς τρόπους.
  • Στο παρακάτω παράδειγμα, ο πελάτης 10000000 χρησιμοποιεί τόσο ένα πρόγραμμα περιήγησης όσο και ένα tablet για να αλληλεπιδρά με την υπηρεσία.

Screenshot of a related table defined at a more granular level than the table that contains your metric.

Εάν προσπαθήσετε να χρησιμοποιήσετε τη στήλη συσκευών ως επεξηγηματικό παράγοντα, εμφανίζεται το ακόλουθο σφάλμα:

Screenshot of wrong column error message.

Αυτό το σφάλμα εμφανίζεται επειδή η συσκευή δεν έχει οριστεί σε επίπεδο πελάτη. Ένας πελάτης μπορεί να χρησιμοποιεί την υπηρεσία σε πολλές συσκευές. Για να εντοπίσει μοτίβα η απεικόνιση, η συσκευή πρέπει να αποτελεί χαρακτηριστικό του πελάτη. Υπάρχουν διάφορες λύσεις που εξαρτώνται από την αντίληψή σας για την επιχείρηση:

  • Μπορείτε να αλλάξετε τη σύνοψη των συσκευών για να μετρήσετε. Για παράδειγμα, χρησιμοποιήστε το πλήθος των συσκευών εάν ο αριθμός των συσκευών μπορεί να επηρεάσει τη βαθμολογία που δίνει ένας πελάτης.
  • Μπορείτε να συγκεντρώσετε τη στήλη συσκευών για να δείτε εάν η χρήση της υπηρεσίας σε μια συγκεκριμένη συσκευή επηρεάζει την αξιολόγηση ενός πελάτη.

Σε αυτό το παράδειγμα, τα δεδομένα περιστρέφονται για τη δημιουργία νέων στηλών για πρόγραμμα περιήγησης, κινητές συσκευές και tablet (βεβαιωθείτε ότι διαγράφετε και δημιουργείτε εκ νέου τις σχέσεις σας στην προβολή μοντελοποίησης μετά την περιστροφή των δεδομένων σας). Μπορείτε πλέον να χρησιμοποιήσετε αυτές τις συγκεκριμένες συσκευές στην ενότητα Επεξήγηση κατά. Όλες οι συσκευές ήταν παράγοντες επιρροής και το πρόγραμμα περιήγησης έχει τον μεγαλύτερο αντίκτυπο στη βαθμολογία του πελάτη.

Πιο συγκεκριμένα, οι πελάτες που δεν χρησιμοποιούν το πρόγραμμα περιήγησης για την υπηρεσία έχουν κατά 3,79 φορές μεγαλύτερη πιθανότητα να δώσουν χαμηλή βαθμολογία σε σχέση με τους πελάτες που το κάνουν. Πιο κάτω στη λίστα, για κινητές συσκευές ισχύει το αντίστροφο. Οι πελάτες που χρησιμοποιούν την εφαρμογή για κινητές συσκευές είναι πιο πιθανό να δώσουν χαμηλή βαθμολογία σε σχέση με τους πελάτες που δεν τη χρησιμοποιούν.

Screenshot that shows mobile app are more likely to give a low score.

Εμφανίζεται μια προειδοποίηση ότι δεν συμπεριλήφθηκαν μετρήσεις στην ανάλυσή μου. Γιατί συμβαίνει αυτό;

Screenshot that shows measures not included error message.

Η ανάλυση εκτελείται στο επίπεδο πίνακα του πεδίου που αναλύεται. Εάν αναλύετε την απώλεια πελατών, μπορεί να έχετε έναν πίνακα που σας υποδεικνύει εάν ένας πελάτης χάνονται ή όχι. Σε αυτή την περίπτωση, η ανάλυσή σας εκτελείται στο επίπεδο πίνακα πελάτη.

Οι μετρήσεις και τα συγκεντρωτικά αποτελέσματα αναλύονται από προεπιλογή σε επίπεδο πίνακα. Εάν υπήρχε μια μέτρηση για τις μέσες μηνιαίες δαπάνες, θα αναλύονταν στο επίπεδο του πίνακα πελατών.

Εάν ο πίνακας πελατών δεν διαθέτει ένα μοναδικό αναγνωριστικό, δεν μπορείτε να αξιολογήσετε τη μέτρηση και παραβλέπεται από την ανάλυση. Για να αποφύγετε αυτή την κατάσταση, βεβαιωθείτε ότι ο πίνακας με το μετρικό σας έχει ένα μοναδικό αναγνωριστικό. Σε αυτή την περίπτωση, είναι ο πίνακας πελατών και το μοναδικό αναγνωριστικό είναι το αναγνωριστικό πελάτη. Είναι επίσης εύκολο να προσθέσετε μια στήλη ευρετηρίου χρησιμοποιώντας το Power Query.

Εμφανίζεται μια προειδοποίηση ότι το μετρικό που αναλύω έχει περισσότερες από 10 μοναδικές τιμές και ότι αυτό το ποσό μπορεί να επηρεάσει την ποιότητα της ανάλυσής μου. Γιατί συμβαίνει αυτό;

Η απεικόνιση AI μπορεί να αναλύσει κατηγορικά πεδία και αριθμητικά πεδία. Στην περίπτωση των κατηγορικών πεδίων, ένα παράδειγμα μπορεί να είναι Η απώλεια είναι Ναι ή Όχι και η Ικανοποίηση πελατών είναι Υψηλή, Μεσαία ή Χαμηλή. Η αύξηση του αριθμού των κατηγοριών για ανάλυση σημαίνει ότι υπάρχουν λιγότερες παρατηρήσεις ανά κατηγορία. Αυτή η κατάσταση καθιστά δυσκολότερο τον εντοπισμό μοτίβων στα δεδομένα.

Κατά την ανάλυση αριθμητικών πεδίων, έχετε τη δυνατότητα να επιλέξετε τη δυνατότητα επεξεργασίας των αριθμητικών πεδίων όπως το κείμενο, όπου θα εκτελέσετε την ίδια ανάλυση όπως και για τα κατηγορικά δεδομένα (Κατηγορική ανάλυση). Εάν έχετε πολλές διακριτές τιμές, συνιστούμε να αλλάξετε την ανάλυση σε Συνεχή ανάλυση, καθώς αυτό σημαίνει ότι μπορούμε να συνάγουμε μοτίβα από τότε που οι αριθμοί αυξάνονται ή μειώνονται, αντί να τις αντιμετωπίζουμε ως διακριτές τιμές. Μπορείτε να μεταβείτε από Κατηγορική ανάλυση σε Συνεχή ανάλυση στο παράθυρο μορφοποίησης, στην κάρτα Ανάλυση .

Για να βρείτε ισχυρότερους παράγοντες επιρροής, συνιστούμε να ομαδοποιήσετε παρόμοιες τιμές σε μία ενιαία μονάδα. Για παράδειγμα, εάν έχετε ένα μετρικό για την τιμή, είναι πιθανό να λάβετε καλύτερα αποτελέσματα με την ομαδοποίηση παρόμοιων τιμών σε Υψηλές, Μεσαίες και Χαμηλές κατηγορίες σε σχέση με τη χρήση μεμονωμένων σημείων τιμών.

Screenshot that shows more than 10 unique factors warning.

Υπάρχουν παράγοντες στα δεδομένα μου που φαίνεται ότι θα έπρεπε να είναι σημαντικοί παράγοντες επιρροής, αλλά δεν είναι. Πώς μπορεί να συμβαίνει αυτό;

Στο παρακάτω παράδειγμα, οι πελάτες που είναι καταναλωτές οδηγούν σε χαμηλές αξιολογήσεις, με το 14,93% των αξιολογήσεων να είναι χαμηλές. Ο ρόλος διαχειριστή επίσης έχει υψηλό ποσοστό χαμηλών αξιολογήσεων, 13,42%, αλλά δεν θεωρείται παράγοντας επιρροής.

Ο λόγος για αυτή την απόφαση είναι ότι η απεικόνιση λαμβάνει υπόψη επίσης τον αριθμό σημείων δεδομένων κατά τον εντοπισμό παραγόντων επιρροής. Το παρακάτω παράδειγμα έχει περισσότερους από 29.000 καταναλωτές και 10 φορές λιγότερους διαχειριστές, περίπου 2.900. Μόνο 390 από αυτούς έδωσαν χαμηλή αξιολόγηση. Η απεικόνιση δεν έχει αρκετά δεδομένα για να προσδιορίσει εάν έχει εντοπίσει ένα μοτίβο στις αξιολογήσεις διαχειριστών ή πρόκειται απλώς για ένα τυχαίο εύρημα.

Screenshot that shows how influencers are determined.

Ποια είναι τα όρια σημείου δεδομένων για τους βασικούς παράγοντες επιρροής; Εκτελούμε την ανάλυση σε ένα δείγμα 10.000 σημείων δεδομένων. Οι φυσαλίδες στη μία πλευρά εμφανίζουν όλους τους παράγοντες επιρροής που βρέθηκαν. Τα γραφήματα στηλών και διασποράς στην άλλη πλευρά συμμορφώνονται με τις στρατηγικές δειγματοληψίας για αυτές τις απεικονίσεις πυρήνα.

Πώς υπολογίζονται οι σημαντικοί παράγοντες επιρροής για κατηγορική ανάλυση;

Στο παρασκήνιο, η απεικόνιση AI χρησιμοποιεί ML.NET για την εκτέλεση μιας λογιστικής παλινδρόμησης για τον υπολογισμό των σημαντικών παραγόντων επιρροής. Η λογιστική παλινδρόμηση είναι ένα στατιστικό μοντέλο που συγκρίνει διαφορετικές ομάδες μεταξύ τους.

Εάν θέλετε να δείτε τι προκαλεί τις χαμηλές αξιολογήσεις, η λογιστική παλινδρόμηση εξετάζει πώς οι πελάτες που έδωσαν χαμηλή βαθμολογία διαφέρουν από τους πελάτες που έδωσαν υψηλή βαθμολογία. Εάν έχετε πολλές κατηγορίες, όπως οι βαθμολογίες "υψηλή", "ουδέτερη" και "χαμηλή", εξετάζετε σε τι διαφέρουν οι πελάτες που έδωσαν χαμηλή αξιολόγηση από τους πελάτες που δεν έδωσαν χαμηλή αξιολόγηση. Σε αυτή την περίπτωση, σε τι διαφέρουν οι πελάτες που έδωσαν χαμηλή βαθμολογία από τους πελάτες που έδωσαν υψηλή ή ουδέτερη αξιολόγηση;

Η λογιστική παλινδρόμηση αναζητά μοτίβα στα δεδομένα και εξετάζει πώς οι πελάτες που έδωσαν χαμηλή αξιολόγηση μπορεί να διαφέρουν από τους πελάτες που έδωσαν υψηλή αξιολόγηση. Μπορεί να εντοπίσει, για παράδειγμα, ότι οι πελάτες με περισσότερα δελτία υποστήριξης δίνουν υψηλότερο ποσοστό χαμηλών αξιολογήσεων από ό,τι οι πελάτες με λίγα ή καθόλου δελτία υποστήριξης.

Η λογιστική παλινδρόμηση λαμβάνει επίσης υπόψη τον αριθμό των σημείων δεδομένων που υπάρχουν. Για παράδειγμα, εάν οι πελάτες που έχουν ρόλο διαχειριστή δίνουν αναλογικά περισσότερο αρνητικές βαθμολογίες, αλλά υπάρχουν μόνο λίγοι διαχειριστές, αυτός ο παράγοντας δεν θεωρείται παράγοντας επιρροής. Αυτή η διαπίστωση γίνεται επειδή δεν υπάρχουν αρκετά διαθέσιμα σημεία για να συναχθεί ένα μοτίβο. Για να προσδιοριστεί εάν ένας παράγοντας θεωρείται παράγοντας επιρροής χρησιμοποιείται μια στατιστική δοκιμή γνωστή ως δοκιμή Wald. Η απεικόνιση χρησιμοποιεί μια τιμή p 0,05 για τον προσδιορισμό του ορίου.

Πώς υπολογίζονται οι σημαντικοί παράγοντες επιρροής για αριθμητική ανάλυση;

Στο παρασκήνιο, η απεικόνιση AI χρησιμοποιεί ML.NET για την εκτέλεση μιας γραμμικής παλινδρόμησης για τον υπολογισμό των σημαντικών παραγόντων επιρροής. Μια γραμμική παλινδρόμηση είναι ένα στατιστικό μοντέλο που εξετάζει τον τρόπο με τον οποίο το αποτέλεσμα του πεδίου αναλύετε αλλαγές με βάση τους επεξηγηματικούς παράγοντες.

Για παράδειγμα, εάν αναλύουμε τιμές κατοικιών, μια γραμμική παλινδρόμηση θα εξετάσει την επίδραση που θα έχει η ύπαρξη μιας εξαιρετικής κουζίνας στην τιμή της κατοικίας. Οι κατοικίες με εξαιρετικές κουζίνες έχουν γενικά χαμηλότερες ή υψηλότερες τιμές σε σύγκριση με τις κατοικίες χωρίς εξαιρετικές κουζίνες;

Η γραμμική παλινδρόμηση λαμβάνει επίσης υπόψη τον αριθμό των σημείων δεδομένων. Για παράδειγμα, αν οι κατοικίες με γήπεδα τένις έχουν υψηλότερες τιμές, αλλά έχουμε λίγες κατοικίες με γήπεδο τένις, αυτός ο παράγοντας δεν θεωρείται σημαντικός. Αυτή η διαπίστωση γίνεται επειδή δεν υπάρχουν αρκετά διαθέσιμα σημεία για να συναχθεί ένα μοτίβο. Για να προσδιοριστεί εάν ένας παράγοντας θεωρείται παράγοντας επιρροής χρησιμοποιείται μια στατιστική δοκιμή γνωστή ως δοκιμή Wald. Η απεικόνιση χρησιμοποιεί μια τιμή p 0,05 για τον προσδιορισμό του ορίου.

Πώς υπολογίζονται τα τμήματα;

Στο παρασκήνιο, η απεικόνιση AI χρησιμοποιεί ML.NET για την εκτέλεση ενός δέντρου αποφάσεων για τον εντοπισμό υποομάδων που παρουσιάζουν ενδιαφέρον. Στόχος του δέντρου αποφάσεων είναι να καταλήξει σε μια υποομάδα σημείων δεδομένων που είναι σε σχετικά υψηλή θέση στο μετρικό που σας ενδιαφέρει. Θα μπορούσε να είναι πελάτες με χαμηλές αξιολογήσεις ή κατοικίες με υψηλές τιμές.

Το δέντρο αποφάσεων λαμβάνει κάθε επεξηγηματικό παράγοντα και προσπαθεί να εξηγήσει λογικά ποιος παράγοντας δίνει τον καλύτερο διαχωρισμό. Για παράδειγμα, εάν φιλτράρετε τα δεδομένα για να συμπεριλάβετε μόνο τους πελάτες που είναι μεγάλες επιχειρήσεις, αυτό θα διαχωρίσει τους πελάτες που έδωσαν υψηλή αξιολόγηση από τους πελάτες που έδωσαν χαμηλή αξιολόγηση; Εναλλακτικά, είναι καλύτερο να φιλτράρετε τα δεδομένα για να συμπεριλάβετε μόνο τους πελάτες που έστειλαν σχόλια σχετικά με την ασφάλεια;

Αφού το δέντρο αποφάσεων κάνει έναν διαχωρισμό, λαμβάνει το υποσύνολο των δεδομένων και προσδιορίζει τον επόμενο καλύτερο διαχωρισμό για αυτά τα δεδομένα. Σε αυτή την περίπτωση, το υποσύνολο είναι οι πελάτες που έστειλαν σχόλια σχετικά με την ασφάλεια. Μετά από κάθε διαχωρισμό, το δέντρο αποφάσεων εξετάζει επίσης εάν έχει αρκετά σημεία δεδομένων ώστε αυτή η ομάδα να είναι αρκετά αντιπροσωπευτική ώστε να συναγάγει ένα μοτίβο ή αν πρόκειται για ανωμαλία στα δεδομένα και όχι για ένα πραγματικό τμήμα. Για τον έλεγχο της στατιστικής σημαντικότητας της συνθήκης διαχωρισμού, εφαρμόζεται μια άλλη στατιστική δοκιμή, με τιμή p 0,05.

Όταν το δέντρο αποφάσεων ολοκληρώσει την εκτέλεση, λαμβάνει όλους τους διαχωρισμούς, όπως τα σχόλια για την ασφάλεια και τη μεγάλη επιχείρηση και δημιουργεί φίλτρα Power BI. Αυτός ο συνδυασμός φίλτρων είναι συσκευασμένος ως τμήμα στην απεικόνιση.

Γιατί ορισμένοι παράγοντες γίνονται παράγοντες επιρροής ή πα σταματούν να είναι παράγοντες επιρροής καθώς μετακινώ περισσότερα πεδία στο πεδίο Επεξήγηση κατά ;

Η απεικόνιση αξιολογεί όλους τους επεξηγηματικούς παράγοντες μαζί. Ένας παράγοντας μπορεί να είναι από μόνος του σημαντικός παράγοντας, όμως όταν λαμβάνεται υπόψη μαζί με άλλους παράγοντες μπορεί να μην είναι. Ας υποθέσουμε ότι θέλετε να αναλύσετε τα στοιχεία που ωθούν την τιμή μιας κατοικίας να είναι υψηλή, με επεξηγηματικούς παράγοντες τα υπνοδωμάτια και το μέγεθος της κατοικίας:

  • Από μόνος του, ο μεγαλύτερος αριθμός υπνοδωματίων μπορεί να αποτελεί παράγοντα κινητήριας δύναμης για την υψηλή τιμή της κατοικίας.
  • Με τη συμπερίληψη του μεγέθους της κατοικίας στην ανάλυση, εξετάζετε τι συμβαίνει με τα υπνοδωμάτια ενώ παραμένει σταθερό το ΕΜΑ.
  • Εάν το μέγεθος της κατοικίας οριστεί σε 1.500 τετραγωνικά πόδια, είναι πιθανό ότι μια συνεχής αύξηση του αριθμού των υπνοδωματίων θα αυξήσει σημαντικά την τιμή της κατοικίας.
  • Τα υπνοδωμάτια ενδέχεται να μην είναι τόσο σημαντικός παράγοντας όσο ήταν πριν από την εξέταση του μεγέθους της κατοικίας.

Η κοινή χρήση της αναφοράς σας με έναν συνάδελφο Power BI απαιτεί να έχετε και οι δύο άδειες χρήσης Power BI Pro ή η αναφορά να αποθηκεύεται σε Premium εκχωρημένους πόρους. Ανατρέξτε στο θέμα Κοινή χρήση αναφορών.