Esercizio: Consolidamento dei dati

Completato

L'attività richiesta per questo esercizio consiste nel creare un nuovo progetto di mining dei processi da due set di dati.

In questo esercizio si procederà a esaminare i dati, verificare che i campi obbligatori siano inclusi nei set di dati, identificare le colonne corrispondenti tra i set di dati, caricare i set di dati e quindi unire i set di dati in base alle colonne corrispondenti.

Obiettivi

Gli obiettivi di questo esercizio sono:

  • Rivedere e preparare i dati.

  • Creare il processo e caricare i dati da più origini.

  • Unire i set di dati in base alle colonne corrispondenti.

  • Eseguire il mapping degli attributi.

Campi obbligatori

Per far sì che il mining dei processi possa analizzare i registri eventi, è necessario disporre dei campi seguenti: Case ID, Activity ed Event Start.

Preparazione dei dati e caricamento

Si ricevono due set di dati in formato xlsx. Si vogliono rivedere i dati per accertarsi che tutti i campi obbligatori siano inclusi nei set di dati, identificare le colonne corrispondenti e quindi procedere alla creazione del processo.

Procedura generale: Preparazione dei dati e caricamento

Per completare questo esercizio, provare a eseguire la seguente procedura generale. Se non si è in grado di procedere, andare alla sezione Procedura dettagliata e seguire le istruzioni fornite.

  1. Aprire i file e controllare il set di dati.

  2. Se necessario, convertire i dati in un formato facilmente leggibile.

  3. Verificare che tutte le colonne richieste siano incluse nei set di dati.

  4. Identificare le colonne corrispondenti tra i set di dati.

  5. Salvare i set di dati come file CSV.

  6. Creare il processo e quindi caricare i set di dati.

Procedura dettagliata: Preparazione dei dati e caricamento

Questa sezione fornisce indicazioni più approfondite per ila procedura generale precedente.

Attività: Esame del set di dati e identificazione delle colonne corrispondenti

La prima attività consiste nell'esaminare i set di dati e identificare le colonne corrispondenti seguendo questi passaggi:

  1. Individuare e aprire il file AP_EV_LAB_Combine_log.xlsx.

    I dati nel file dovrebbero avere un aspetto simile all'immagine seguente.

    Screenshot dell'aspetto dei dati nei dati CSV iniziali.

    Nota

    Una barra verticale (|) separa i dati, rendendone complicata la lettura. Usare la funzionalità Testo in colonne di Excel per rendere i dati più facili da leggere.

  2. Selezionare la scheda Dati.

  3. Tutti i dati di ogni riga si trovano in una cella. Selezionare tutte le righe, inclusa l'intestazione, quindi selezionare il pulsante Testo in colonne.

    Screenshot della scheda Dati con tutte le righe selezionate e del pulsante Testo in colonne evidenziato.

  4. Selezionare Delimitato, quindi Avanti.

    Schermata della procedura guidata Converti testo in colonne, passaggio 1 di 3, con l'opzione Delimitato e il pulsante Avanti evidenziati.

  5. Selezionare Altro, immettere una barra verticale (|), quindi selezionare Avanti.

    Schermata della procedura guidata Converti testo in colonne, passaggio 2 di 3, con una barra verticale immessa e il pulsante Avanti.

  6. Selezionare Fine.

    Ora i dati dovrebbero risultare più facili da leggere.

  7. Verificare se i campi obbligatori sono presenti.

    Screenshot dei campi obbligatori Case I D, Activity e Timestamp evidenziati.

  8. Identificare eventuali altri campi dei quali eseguire eventualmente il mapping per il mining dei processi. Selezionare Fine.

  9. Facoltativamente, è possibile annotare i campi da usare. Dopo aver completato l'ispezione dei dati, selezionare File > Salva con nome.

  10. Salvare il file in formato CSV standard e assegnare allo stesso un nome appropriato.

    Screenshot del file salvato in formato CSV e a cui è stato assegnato un nome appropriato.

  11. Chiudere il file.

  12. Preparare il secondo set di dati individuando e aprendo il file AP_EV_LAB_Combine_attr.xlsx.

    I dati nel file dovrebbero avere un aspetto simile all'immagine seguente.

    Screenshot del contenuto del file per il secondo set di dati.

    Nota

    Una barra verticale (|) separa i dati, rendendone complicata la lettura. Usare la funzionalità Testo in colonne di Excel per rendere i dati più facili da leggere.

  13. Selezionare la scheda Dati.

  14. Tutti i dati di ogni riga si trovano in una cella. Selezionare tutte le righe, inclusa l'intestazione, quindi selezionare il pulsante Testo in colonne.

    Screenshot della scheda Dati e del pulsante Converti testo in colonne per rendere i dati più facili da leggere.

  15. Selezionare Delimitato, quindi Avanti.

  16. Selezionare Altro, immettere una barra verticale (|), quindi selezionare Avanti.

  17. Selezionare Fine.

    Ora i dati dovrebbero risultare più facili da leggere.

  18. Tutti i campi obbligatori sono già presenti nel primo file. Individuare le colonne in comune tra i due set di dati.

  19. Notare che InvoiceID e Case ID del primo set di dati corrispondono. Usare queste colonne come colonne corrispondenti.

    Screenshot della colonna corrispondente.

  20. Identificare eventuali altri campi dei quali eseguire il mapping per il mining dei processi.

  21. Facoltativamente, è possibile annotare i campi da usare. Dopo aver completato l'ispezione dei dati, selezionare File > Salva con nome.

  22. Salvare il file come CSV e assegnare allo stesso un nome appropriato.

    Screenshot del nome del file compilato nel file salvato come CSV.

  23. Chiudere il file.

Attività: Creazione del processo e caricamento dei dati

Per creare il processo e caricare i dati, attenersi alla seguente procedura:

  1. Accedere a Microsoft Power Automate e selezionare l'ambiente corretto.

    Screenshot dell'ambiente selezionato in Power Automate.

  2. Selezionare Mining dei processi dal riquadro di sinistra, quindi + Inizia qui.

    Screenshot del mining dei processi selezionato dal riquadro di sinistra e del pulsante Inizia qui evidenziato.

  3. Immettere Merged datasets per Nome processo, selezionare Importa dati per Origine dati, selezionare Flusso di dati, quindi selezionare Continua.

    Screenshot della procedura guidata Crea un nuovo processo che mostra il nome compilato con Importa dati e Flusso di dati selezionati.

  4. Selezionare Ignora se il sistema richiede di aggiungere l'area di lavoro Power BI.

  5. Selezionare Testo/CSV come origine dati.

    Screenshot di Testo/CSV selezionato come origine dati.

  6. Selezionare Carica file, quindi fare clic sul pulsante Sfoglia.

    Screenshot delle opzioni Carica file e Sfoglia selezionate.

  7. Selezionare il primo file CSV creato, quindi Apri.

    Screenshot del file CSV e del pulsante Apri selezionato.

  8. Se non è stato effettuato l'accesso, selezionare il pulsante Accedi e fornire le proprie credenziali.

  9. Selezionare Avanti.

    Screenshot delle impostazioni di connessione con il pulsante Avanti visualizzato.

  10. Dovrebbe essere visualizzata un'anteprima dei dati. Selezionare Avanti.

    Screenshot che mostra i dati in anteprima e del pulsante Avanti selezionato.

    Il sistema dovrebbe ora passare alla fase di trasformazione.

    Screenshot di passaggio 3 di 4, la fase Trasforma i tuoi dati.

  11. Per caricare il secondo set di dati, selezionare Recupera dati, quindi Testo/CSV.

    Screenshot dell'opzione Recupera dati e di Testo/CSV selezionato per il secondo set di dati.

  12. Selezionare Carica file, quindi fare clic sul pulsante Sfoglia.

  13. Selezionare il secondo file CSV creato, quindi Apri.

    Screenshot del secondo file CSV selezionato e del pulsante Apri.

  14. Selezionare Avanti.

  15. Dovrebbe essere visualizzata un'anteprima dei dati. Selezionare Crea.

Ora le due tabelle dovrebbero essere state caricate.

Screenshot dei due set di dati caricati.

Unione di set di dati

Dopo aver caricato correttamente tutti i set di dati, è possibile unirli in una nuova tabella consolidata. Questa nuova tabella integra i dati di entrambi i set di dati caricati.

Procedura generale: Unione di set di dati

Per completare questo esercizio, provare a eseguire la seguente procedura generale. Se non si è in grado di procedere, andare alla sezione Procedura dettagliata e seguire le istruzioni fornite.

  1. Per unire i due set di dati in una nuova tabella, usare la funzionalità Esegui merge di query come nuova di Power Query.

  2. Selezionare le tabelle di unione destra e sinistra.

  3. Selezionare le colonne corrispondenti corrette tra le due tabelle.

  4. Accertarsi di unire i dati usando un left outer join.

  5. Espandere la tabella.

  6. Escludere le colonne duplicate.

  7. Rinominare la nuova tabella.

  8. Attivare le funzionalità di caricamento per la tabella che si vuole caricare, quindi disattivarle per le altre due tabelle.

  9. Eseguire il mapping dei dati.

  10. Salvare il processo.

Procedura dettagliata: Unione di set di dati

Questa sezione fornisce indicazioni più approfondite per ila procedura generale precedente.

Attività: Unione del set di dati e mapping

Per unire set di dati e mapping, seguire questi passaggi:

  1. Selezionare il menu a discesa Esegui merge di query, quindi selezionare Esegui merge di query come nuova.

    Screenshot del pulsante Esegui merge di query come nuova.

  2. Selezionare la prima tabella creata per Tabella sinistra per l'unione, quindi selezionare Case ID come colonna corrispondente.

  3. Selezionare la seconda tabella creata per Tabella destra per l'unione, quindi selezionare InvoiceID come colonna corrispondente.

  4. Selezionare Left outer per Tipo di join, quindi selezionare OK.

    Schermata della procedura guidata per l'unione delle query, in cui è selezionata l'opzione Left outer per Tipo di join.

  5. Dovrebbe essere visualizzato un messaggio di errore simile al seguente: "La valutazione è stata annullata perché la combinazione di dati provenienti da più origini potrebbe rivelare dati da un'origine all'altra. Fare clic su Continua se la possibilità di rivelare i dati è accettabile." Selezionare Continua.

    Screenshot di un messaggio di errore e del pulsante Continua.

  6. La seconda tabella dovrebbe ora essere visualizzata come una colonna. Espandere la tabella e selezionare le colonne da aggiungere. Individuare la seconda colonna della tabella, quindi selezionare l'icona espandi.

    Screenshot dell'icona Espandi.

    Nota

    Ora si procederà a selezionare le colonne che si desidera includere. Poiché non si desidera che la tabella Merge includa più colonne contenenti valori, è necessario selezionare le colonne univoche per questa tabella.

  7. Deselezionare la casella di controllo InvoiceID, quindi selezionare OK.

    Screenshot della finestra di dialogo di espansione che mostra la casella di controllo InvoiceID deselezionata.

    La tabella Merge dovrebbe ora essere simile all'immagine seguente.

    Screenshot delle colonne della tabella Merge.

  8. Fare clic con il pulsante destro del mouse sulla tabella Merge, quindi selezionare Rinomina.

  9. Rinominare la tabella in Merged_log_attr.

  10. Per impostazione predefinita, la funzionalità di caricamento è attivata in tutte e tre le tabelle. Poiché si desidera caricare solo la tabella Merge, fare clic con il pulsante destro del mouse sulla prima tabella, quindi selezionare Abilita caricamento. Questa azione disattiva la funzionalità di caricamento per la prima tabella.

    Screenshot dell'opzione Abilita caricamento disattivata.

  11. Fare clic con il pulsante destro del mouse sulla seconda tabella, quindi selezionare Abilita caricamento. Questa azione disattiva la funzionalità di caricamento per la seconda tabella.

  12. Il nome delle tabelle in cui la funzionalità di caricamento è disattivata dovrebbe apparire in carattere corsivo.

    Screenshot delle tabelle con funzionalità di caricamento disattivata.

  13. Selezionare Avanti.

  14. Il sistema dovrebbe ora passare alla fase di mapping. Eseguire per prima cosa il mapping dei campi obbligatori, come mostrato nella tabella seguente.

    Nome attributo Tipo di attributo Tipo di dati attributo
    Case ID Case ID Testo
    Activity Activity Testo
    Timestamp Event Start Data/ora

    Screenshot dei campi obbligatori di cui è stato eseguito il mapping nel passaggio 4 di 4, Mapping dei dati.

  15. È possibile includere molti altri campi. Ai fini di questo esercizio, si esegue il mapping di tutti i campi.

  16. Eseguire il mapping del resto dei campi come mostrato nella tabella seguente.

    Nome attributo Tipo di attributo Tipo di dati attributo
    Resource Resource Testo
    Resource Name Event Level Attribute Testo
    Vendor Case Level Attribute (first event) Testo
    Automation Case Level Attribute (first event) Testo
    Paid on Time Case Level Attribute (first event) Testo
    Reason for Rejection Case Level Attribute (first event) Testo
    Cash Discount % Case Level Attribute (first event) Numerico
    Cash Discount Value Financial per Case (first event) Numerico
    Invoice Value Financial per Case (first event) Numerico
    Business Unit Case Level Attribute (first event) Testo
    Region Case Level Attribute (first event) Testo
  17. Dopo aver eseguito il mapping dei campi, selezionare Salva e analizza.

    Screenshot di tutti i campi oggetto di mapping e del pulsante Salva e analizza.

  18. Attendere il completamento dell'analisi. Il processo potrebbe richiedere alcuni minuti.

Una volta completata l'analisi, la panoramica del processo dovrebbe risultare simile all'immagine seguente.

Screenshot della panoramica della mappa dei processi al termine dell'analisi.