Condividi tramite


Colonne del modello di data mining

Un modello di data mining consente di applicare un algoritmo specifico ai dati rappresentati da una struttura di data mining. Analogamente alla struttura, il modello di data mining contiene colonne. Un modello di data mining è contenuto all'interno della struttura di data mining ed eredita tutti i valori delle proprietà definite dalla struttura. Nel modello possono essere utilizzate tutte le colonne contenute nella struttura di data mining o un subset delle colonne.

In una colonna di un modello di data mining è possibile definire due informazioni aggiuntive, ovvero utilizzo e flag di modellazione.

  • Utilizzo è una proprietà che definisce il modo in cui il modello utilizza la colonna. Le colonne possono essere utilizzate come colonne di input, colonne chiave o colonne stimabili.

  • I flag di modellazione offrono all'algoritmo ulteriori informazioni sui dati definiti nella tabella del case per consentire la compilazione di un modello più accurato. È possibile definire flag di modellazione a livello di programmazione utilizzando il linguaggio DMX (Data Mining Extensions) oppure tramite Progettazione modelli di data mining in Business Intelligence Development Studio.

Nell'elenco seguente vengono descritti i flag di modellazione che è possibile definire in una colonna di un modello di data mining.

  • MODEL_EXISTENCE_ONLY
    Indica che la presenza dell'attributo è più importante rispetto ai valori nella colonna attributo. Si consideri, ad esempio, una tabella del case contenente un elenco di elementi ordinati associati a un cliente specifico. I dati della tabella includono tipo di prodotto, ID e costo di ogni elemento. Ai fini della modellazione, il fatto che il cliente abbia acquistato un determinato articolo potrebbe essere più importante rispetto al costo dell'articolo stesso. In questo caso, la colonna relativa al costo dovrebbe venire contrassegnata come MODEL_EXISTENCE_ONLY.

  • REGRESSOR
    Indica che l'algoritmo può utilizzare la colonna specificata nella formula di regressione degli algoritmi di regressione. Questo flag è supportato dagli algoritmi Microsoft Decision Trees e Microsoft Time Series.

Per ulteriori informazioni sull'impostazione della proprietà di utilizzo e sulla definizione di flag di modellazione a livello di programmazione tramite DMX, vedere CREATE MINING MODEL (DMX). Per ulteriori informazioni sull'impostazione della proprietà di utilizzo e sulla definizione di flag di modellazione in Business Intelligence Development Studio, vedere Gestione dei modelli di data mining in Progettazione modelli di data mining.