Condividi tramite


Flag di modellazione (mining dei dati)

È possibile usare i flag di modellazione in SQL Server Analysis Services per fornire informazioni aggiuntive a un algoritmo di data mining sui dati definiti in una tabella case. L'algoritmo può utilizzare tali informazioni per compilare un modello di data mining più accurato.

Alcuni flag di modellazione vengono definiti al livello della struttura di data mining, mentre altri sono definiti a livello della colonna del modello di data mining. Ad esempio, il flag di modellazione NOT NULL viene usato con le colonne della struttura di mining. È possibile definire flag di modellazione aggiuntivi nelle colonne del modello di data mining, a seconda dell'algoritmo usato per creare il modello.

Annotazioni

I plug-in di terze parti potrebbero avere altri flag di modellazione, oltre a quelli predefiniti da Analysis Services.

Elenco di flag di modellazione

Nell'elenco seguente vengono descritti i flag di modellazione supportati in Analysis Services. Per informazioni sui flag di modellazione supportati da algoritmi specifici, vedere l'argomento di riferimento tecnico per l'algoritmo usato per creare il modello.

NOT NULL
Indica che i valori per la colonna dell'attributo non devono mai contenere un valore Null. Se Analysis Services rileva un valore Null per questa colonna di attributo durante il processo di training del modello, verrà generato un errore.

MODEL_EXISTENCE_ONLY
Indica che la colonna verrà considerata come con due stati: Missing e Existing. Se il valore è NULL, viene considerato mancante. Il flag MODEL_EXISTENCE_ONLY viene applicato all'attributo stimabile ed è supportato dalla maggior parte degli algoritmi.

In effetti, impostando il flag MODEL_EXISTENCE_ONLY per True modificare la rappresentazione dei valori in modo che siano presenti solo due stati: Missing e Existing. Tutti gli stati non mancanti vengono combinati in un singolo Existing valore.

Un uso tipico per questo flag di modellazione è costituito da attributi per i quali lo NULL stato ha un significato implicito e il valore esplicito dello NOT NULL stato potrebbe non essere importante quanto il fatto che la colonna abbia alcun valore. Ad esempio, una colonna [DateContractSigned] potrebbe essere NULL se un contratto non è mai stato firmato e NOT NULL se il contratto è stato firmato. Pertanto, se lo scopo del modello è quello di stimare se un contratto verrà firmato, è possibile usare il flag MODEL_EXISTENCE_ONLY per ignorare il valore esatto della data nei NOT NULL casi e distinguere solo i casi in cui un contratto è Missing o Existing.

Annotazioni

"Missing" è uno stato speciale utilizzato dall'algoritmo e differisce dal valore di testo "Missing" in una colonna. Per altre informazioni, vedere Valori mancanti (Analysis Services - Data mining).

REGRESSOR
Indica che la colonna è un candidato per l'uso come regressore durante l'elaborazione. Questo flag viene definito in una colonna del modello di data mining e può essere applicato solo alle colonne con un tipo di dati numerico continuo. Per ulteriori informazioni sugli usi di questo flag, vedere la sezione in questo argomento, Usi del flag di modellazione REGRESSOR.

Visualizzazione e modifica dei flag di modellazione

È possibile visualizzare i flag di modellazione associati a una colonna della struttura di data mining o a una colonna del modello nel Designer per Data Mining visualizzando le proprietà della struttura o del modello.

Per determinare quali flag di modellazione sono stati applicati alla struttura di data mining corrente, è possibile creare una query sul set di righe dello schema di data mining che restituisce i flag di modellazione solo per le colonne della struttura usando una query simile alla seguente:

SELECT COLUMN_NAME, MODELING_FLAG  
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS  
WHERE STRUCTURE_NAME = '<structure name>'  

È possibile aggiungere o modificare i flag di modellazione utilizzati in un modello usando la Progettazione di Data Mining e modificare le proprietà delle colonne associate. Tali modifiche richiedono la rielaborazione della struttura o del modello.

È possibile specificare parametri di modellazione in una nuova struttura o modello di data mining utilizzando DMX, oppure script AMO o XMLA. Tuttavia, non è possibile modificare i flag di modellazione utilizzati in un modello e una struttura di data mining esistenti utilizzando DMX. È necessario creare un nuovo modello di mining usando la sintassi ALTER MINING STRUCTURE....ADD MINING MODEL.

Usi dell'indicatore di modellazione REGRESSOR

Quando si imposta il flag di modellazione REGRESSOR su una colonna, si indica all'algoritmo che la colonna contiene potenziali regreditori. I regreditori effettivi utilizzati nel modello sono determinati dall'algoritmo . Un potenziale regressore può essere rimosso se non modella l'attributo stimabile.

Quando si costruisce un modello utilizzando l'Assistente Data Mining, tutte le colonne di input continue vengono contrassegnate come possibili regressori. Pertanto, anche se non si imposta in modo esplicito il flag REGRESSOR in una colonna, la colonna potrebbe essere usata come regreditore nel modello.

È possibile determinare i regreditori effettivamente utilizzati nel modello elaborato eseguendo una query sul set di righe dello schema per il modello di data mining, come illustrato nell'esempio seguente:

SELECT COLUMN_NAME, MODELING_FLAG  
FROM $system.DMSCHEMA_MINING_COLUMNS  
WHERE MODEL_NAME = '<model name>'  

Nota Se si modifica un modello di data mining e si modifica il tipo di contenuto di una colonna da continuo a discreto, è necessario modificare manualmente il flag nella colonna di data mining e quindi rielaborare il modello.

Regreditori nei modelli di regressione lineare

I modelli di regressione lineare sono basati sull'algoritmo Microsoft Decision Trees. Anche se non si usa l'algoritmo Microsoft Linear Regression, qualsiasi modello di albero delle decisioni può contenere un albero o nodi che rappresenta una regressione su un attributo continuo.

Pertanto, in questi modelli non è necessario specificare che una colonna continua rappresenta un regressore. L'algoritmo Microsoft Decision Trees partizionerà il set di dati in aree con modelli significativi anche se non si imposta il flag REGRESSOR nella colonna. La differenza è che quando si imposta il flag di modellazione, l'algoritmo tenterà di trovare equazioni di regressione del formato seguente per adattare i modelli nei nodi dell'albero.

a*C1 + b*C2 + ...

Viene quindi calcolata la somma dei residui e, se la deviazione è troppo grande, viene forzata una divisione nell'albero.

Ad esempio, se si stima il comportamento di acquisto dei clienti usando Income come attributo e si imposta il flag di modellazione REGRESSOR nella colonna, l'algoritmo tenterà innanzitutto di adattare i valori Income usando una formula di regressione standard. Se la deviazione è troppo grande, la formula di regressione viene abbandonata e l'albero verrà suddiviso su un altro attributo. L'algoritmo dell'albero delle decisioni tenterebbe quindi di adattarsi a un regressore per il reddito in ognuno dei rami dopo la divisione.

È possibile usare il parametro FORCE_REGRESSOR per garantire che l'algoritmo userà un particolare regressore. Questo parametro può essere usato con l'algoritmo Decision Trees e l'algoritmo Linear Regression.

Usa i seguenti link per saperne di più su come utilizzare i flag di modellazione.

Attività Argomento
Modificare i flag di modellazione tramite Designer di Data Mining Visualizzare o modificare i flag di modellazione (data mining)
Specifica un suggerimento all'algoritmo per raccomandare i probabili regressori Specificare una colonna da usare come regressore in un modello
Vedere i flag di modellazione supportati da algoritmi specifici (nella sezione Flag di modellazione per ogni argomento di riferimento dell'algoritmo) Algoritmi di data mining (Analysis Services - Data mining)
Scopri di più sulle colonne della struttura di data mining e sulle proprietà che è possibile impostare su di esse Colonne della struttura di mining
Informazioni sulle colonne dei modelli di data mining e sui flag di modellazione applicabili al livello del modello Colonne del modello di mining
Consultare la sintassi per l'uso dei flag di modellazione nelle istruzioni DMX Segnali di modellazione (DMX)
Comprendere i valori mancanti e come usarli Valori mancanti (Analysis Services - Data mining)
Informazioni sulla gestione di modelli e strutture e sull'impostazione delle proprietà di utilizzo Spostamento di oggetti di data mining