Condividi tramite


Attività 10: Aggiunta della trasformazione Raggruppamento fuzzy per l'identificazione di duplicati

In questa attività viene aggiunta una trasformazione Raggruppamento fuzzy al flusso di dati. La trasformazione Raggruppamento fuzzy consente di identificare i duplicati nei dati di origine. Per ulteriori informazioni, vedere Trasformazione Raggruppamento fuzzy.

  1. Trascinare la trasformazione Raggruppamento fuzzy in Altre trasformazioni nella Casella degli strumenti SSIS nella scheda Flusso di dati in Combina record corretti e con correzione.

  2. Fare clic con il pulsante destro del mouse sulla trasformazione Raggruppamento fuzzy nella scheda Flusso di dati, quindi scegliere Rinomina. Digitare Raggruppa fornitori con ID corrispondenti e premere INVIO.

  3. Collegare Combina record corretti e con correzione a Raggruppa fornitori con ID corrispondenti utilizzando il collegamento blu.

    Connessione a Raggruppa fornitori con ID corrispondenti

  4. Fare doppio clic su Raggruppa fornitori con ID corrispondenti.

  5. In Editor trasformazione Raggruppamento fuzzy fare clic su Nuovo accanto all'elenco a discesa Gestione connessione OLE DB per avviare la finestra di dialogo Configura gestione connessione OLE DB.

  6. Nella finestra di dialogo fare clic su Nuovo per avviare la finestra di dialogo Gestione connessione.

  7. Digitare (local) o un punto (.) per il nome del server.

  8. Selezionare MDS per il campo Selezionare o immettere un nome di database. Verrà utilizzato il database MDS come archiviazione temporanea per la trasformazione Raggruppamento fuzzy. Per la trasformazione Raggruppamento fuzzy è necessaria una connessione a un'istanza di SQL Server per la creazione delle tabelle temporanee di SQL Server necessarie all'algoritmo di trasformazione. A tal fine, è possibile creare un database o utilizzarne un altro esistente.

  9. Fare clic su Test connessione per testare la connessione, quindi scegliere OK nella finestra di messaggio.

  10. Nella finestra di dialogo Gestione connessione fare clic su OK.

  11. Selezionare (local) .MDS (o localhost.MDS) dall'elenco Connessioni dati, quindi scegliere OK.

  12. In Editor trasformazione Raggruppamento fuzzy verificare che sia selezionato (local).MDS o localhost.MDS per il campo Gestione connessione OLE DB.

  13. Passare alla scheda Colonne.

  14. Selezionare la casella di controllo SupplierID_Output nell'elenco Colonne di input disponibili. Per configurare la trasformazione, selezionare le colonne di input da utilizzare per l'identificazione dei duplicati. Per mantenerla semplice, utilizzare solo SupplierID in questo passaggio.

    Editor trasformazione Raggruppamento fuzzy

  15. Scegliere OK per chiudere Editor trasformazione Raggruppamento fuzzy.

Passaggio successivo

Attività 11: Aggiunta della trasformazione Suddivisione condizionale a Filtra duplicati