Condividi tramite


Creare una nuova struttura di data mining OLAP

È possibile utilizzare la Creazione guidata per il data mining in Microsoft SQL Server Analysis Services per creare una struttura che sfrutta dati da un modello multidimensionale. I modelli di data mining basati su cubi OLAP possono usare le colonne e i valori nelle tabelle dei fatti, nelle dimensioni e nei gruppi di misure come attributi per l'analisi.

Per creare una nuova struttura di data mining OLAP

  1. In Esplora Soluzioni in SQL Server Data Tools (SSDT), in un progetto di Analysis Services, fare clic con il pulsante destro del mouse sulla cartella Strutture di data mining e quindi fare clic su Nuova struttura di data mining per aprire la Creazione guidata Data Mining.

  2. Nella pagina Benvenuti nella creazione guidata per il data mining, fare clic su Avanti.

  3. Nella pagina Selezionare il metodo di definizione selezionareDa cubo esistente e quindi fare clic su Avanti.

    Se viene visualizzato un errore con il messaggio Non è possibile recuperare un elenco di algoritmi di data mining supportati, aprire la finestra di dialogo Proprietà progetto e verificare di aver specificato il nome di un'istanza di Analysis Services che supporta i modelli multidimensionali. Non è possibile creare modelli di data mining in un'istanza di Analysis Services che supporta la modellazione tabulare.

  4. Nella pagina Crea struttura di data mining, decidi se creare solo una struttura di data mining o una struttura di data mining più un modello di data mining correlato. In genere è più semplice creare un modello di data mining contemporaneamente, in modo da poter includere le colonne necessarie.

    Se si crea un modello di data mining, selezionare l'algoritmo di data mining che si desidera utilizzare e quindi fare clic su Avanti. Per altre informazioni su come scegliere un algoritmo, vedere Algoritmi di data mining (Analysis Services - Data mining) .

  5. Nella pagina Seleziona la Dimensione del Cubo di Origine, sotto Seleziona una Dimensione del Cubo di Origine, individuare la dimensione che contiene la maggior parte dei dati del caso.

    Ad esempio, se si sta tentando di identificare i raggruppamenti dei clienti, è possibile scegliere la dimensione Customer; se si sta tentando di analizzare gli acquisti tra le transazioni, è possibile scegliere la dimensione Internet Sales Order Details. Non è possibile usare solo i dati in questa dimensione, ma devono contenere attributi importanti da usare nell'analisi.

    Fare clic su Avanti.

  6. Nella pagina Seleziona la chiave del caso, in Attributi, selezionare l'attributo che sarà la chiave della struttura di data mining e quindi fare clic su Avanti.

    In genere, l'attributo utilizzato come chiave per la struttura di data mining è anche una chiave per la dimensione e verrà pre-selezionato.

  7. Nella pagina Seleziona colonne a livello di caso, in Attributi e misure correlati, selezionare gli attributi e le misure che contengono valori da aggiungere alla struttura di data mining come dati dei casi. Fare clic su Avanti.

  8. Nella pagina Specifica utilizzo colonne modello di data mining, sotto Struttura del modello di data mining, impostare prima la colonna prevedibile e quindi scegliere le colonne da utilizzare come input.

    • Selezionare la casella di controllo nella colonna più a sinistra per includere i dati nella struttura di data mining. È possibile includere colonne nella struttura che verrà usata per riferimento, ma non usarle per l'analisi.

    • Selezionare la casella di controllo nella colonna Input per usare l'attributo come variabile nell'analisi.

    • Selezionare la casella di controllo nella colonna Stima solo per gli attributi prevedibili.

    Si noti che le colonne designate come chiavi non possono essere usate per l'input o la stima.

    Fare clic su Avanti.

  9. Nella pagina Specifica utilizzo colonne modello di data mining è anche possibile aggiungere e rimuovere tabelle nidificate alla struttura di data mining utilizzando Aggiungi tabelle annidate e tabelle nidificate.

    In un modello di data mining OLAP, una tabella nidificata è un altro insieme di dati all'interno del cubo che ha una relazione uno-a-molti con la dimensione che rappresenta gli attributi del caso. Pertanto, quando si apre la finestra di dialogo, pre-seleziona i gruppi di misure che sono già correlati alla tabella dei casi che hai selezionato. A questo punto, scegliere una dimensione diversa che contiene informazioni aggiuntive utili per l'analisi.

    Ad esempio, se si analizzano i clienti, utilizzate la dimensione [Customer] come tabella dei casi. Per la tabella nidificata, puoi aggiungere il motivo citato dai clienti quando effettuano un acquisto, che è incluso nella dimensione [Sales Reason].

    Se si aggiungono dati annidati, è necessario specificare due colonne aggiuntive:

    • Chiave della tabella nidificata: deve essere pre-selezionata nella pagina , selezionare Chiave tabella nidificata.

    • Attributo o attributi da utilizzare per l'analisi: La pagina Seleziona colonne tabella nidificata fornisce un elenco di misure e attributi della selezione della tabella nidificata.

      • Per ogni attributo incluso nel modello, selezionare la casella nella colonna a sinistra.

      • Se si vuole usare l'attributo solo per l'analisi, selezionare Input.

      • Se si vuole includere la colonna come uno degli attributi stimabili per il modello, selezionare Stima.

      • Qualsiasi elemento incluso nella struttura ma non specificato come attributo di input o stimabile viene aggiunto alla struttura con il flag Ignore. Ciò significa che i dati vengono elaborati quando si compila il modello ma non viene usato nell'analisi ed è disponibile solo per il drill-through. Questo può essere utile se vuoi includere dettagli come i nomi dei clienti, ma non vuoi usarli nell'analisi.

    Fare clic su Fine per chiudere la parte della procedura guidata che funziona con le tabelle nidificate. È possibile ripetere il processo per aggiungere più colonne annidate.

  10. Nella pagina Specificare il contenuto e il tipo di dati delle colonne , in Struttura del modello di data mining impostare il tipo di contenuto e il tipo di dati per ogni colonna.

    Annotazioni

    I modelli di data mining OLAP non supportano l'uso della funzionalità Rileva per rilevare automaticamente se una colonna contiene dati continui o discreti.

    Fare clic su Avanti.

  11. Nella pagina Cubo origine di suddivisione è possibile filtrare i dati utilizzati per creare la struttura di data mining.

    Sezionamento del cubo consente di limitare i dati usati per compilare il modello. Ad esempio, è possibile creare modelli separati per ogni area suddividendo la gerarchia della geografia e

    • Dimensione: scegliere una dimensione correlata dall'elenco a discesa.

    • Gerarchia: selezionare il livello della gerarchia di dimensioni in cui si desidera applicare il filtro. Ad esempio, se si suddivide in base alla dimensione [Geography], dovresti scegliere un livello di gerarchia, ad esempio [Nome paese regione].

    • Operatore: scegliere un operatore dall'elenco.

    • Espressione filtro: digitare un valore o un'espressione da utilizzare come condizione di filtro oppure usare l'elenco a discesa per selezionare un valore dall'elenco dei membri al livello specificato della gerarchia.

      Ad esempio, se è stata selezionata [Geography] come dimensione e [Region Country Name] come livello gerarchia, l'elenco a discesa contiene tutti i paesi/aree geografiche validi che è possibile usare come condizione di filtro. È possibile effettuare più selezioni. Di conseguenza, i dati nella struttura di mining saranno limitati ai dati del cubo provenienti da queste aree geografiche.

    • Parametri: ignorare questa casella di controllo. Questa finestra di dialogo supporta più scenari di filtro dei cubi e questa opzione non è rilevante per la creazione di una struttura di data mining.

    Fare clic su Avanti.

  12. Nella pagina Suddividere i dati in set di addestramento e test, specificare una percentuale dei dati della struttura di data mining da essere riservati per i test o specificare il numero massimo di casi di test. Fare clic su Avanti.

    Se si specificano entrambi i valori, i limiti vengono combinati per usare qualsiasi valore inferiore.

  13. Nella pagina Completamento procedura guidata specificare un nome per la nuova struttura di data mining OLAP e il modello di data mining iniziale.

  14. Fare clic su Fine.

  15. Nella pagina Completamento procedura guidata è anche possibile creare una dimensione del modello di data mining e/o un cubo utilizzando la dimensione del modello di data mining. Queste opzioni sono supportate solo per i modelli compilati usando gli algoritmi seguenti:

    • Algoritmo di Clustering di Microsoft

    • Algoritmo Microsoft Decision Trees

    • Algoritmo Microsoft Association Rules

    Crea dimensione del modello di data mining: selezionare questa casella di controllo e specificare un nome di tipo per la dimensione del modello di data mining. Quando si utilizza questa opzione, viene creata una nuova dimensione all'interno del cubo originale utilizzato per costruire la struttura di data mining. È possibile utilizzare questa dimensione per eseguire il drill-down ed eseguire ulteriori analisi. Poiché la dimensione si trova all'interno del cubo, viene automaticamente mappata alla dimensione dei dati del caso.

    Creare un cubo usando la dimensione del modello di data mining: selezionare questa casella di controllo e specificare un nome per il nuovo cubo. Quando si utilizza questa opzione, viene creato un nuovo cubo contenente sia le dimensioni esistenti utilizzate per la compilazione della struttura che la nuova dimensione di data mining contenente i risultati del modello.

Vedere anche

Attività e procedure della struttura di mining