Condividi tramite


Contenuto dei modelli di mining dei dati per i modelli di regressione logistica (Servizi di analisi - Data mining)

In questo argomento viene descritto il contenuto del modello di data mining specifico per i modelli che usano l'algoritmo Microsoft Logistic Regression. Per una spiegazione su come interpretare le statistiche e la struttura comuni a tutti i tipi di modelli, e le definizioni generali dei termini correlati al contenuto del modello di data mining, vedere Contenuto del modello di data mining (Analysis Services - Data Mining).

Informazioni sulla struttura di un modello di regressione logistica

Viene creato un modello di regressione logistica usando l'algoritmo Microsoft Neural Network con parametri che vincolano il modello per eliminare il nodo nascosto. Pertanto, la struttura complessiva di un modello di regressione logistica è quasi identica a quella di una rete neurale: ogni modello ha un singolo nodo padre che rappresenta il modello e i relativi metadati e un nodo speciale delle statistiche marginali (NODE_TYPE = 24) che fornisce statistiche descrittive sugli input usati nel modello.

Inoltre, il modello contiene una sottorete (NODE_TYPE = 17) per ogni attributo stimabile. Proprio come in un modello di rete neurale, ogni sottorete contiene sempre due rami: uno per il livello di input e un altro ramo che contiene il livello nascosto (NODE_TYPE = 19) e il livello di output (NODE_TYPE = 20) per la rete. La stessa sottorete può essere usata per più attributi se sono specificati come predict-only. Gli attributi stimabili che sono anche input potrebbero non essere visualizzati nella stessa sottorete.

Tuttavia, in un modello di regressione logistica, il nodo che rappresenta il livello nascosto è vuoto e non ha figli. Pertanto, il modello contiene nodi che rappresentano singoli output (NODE_TYPE = 23) e singoli input (NODE_TYPE = 21), ma non singoli nodi nascosti.

struttura del contenuto per il modello di regressione logistica

Per impostazione predefinita, un modello di regressione logistica viene visualizzato in Microsoft Neural Network Viewer. Con questo visualizzatore personalizzato, è possibile filtrare in base agli attributi di input e ai relativi valori e osservare graficamente come influiscono sugli output. Nel visualizzatore, le descrizioni comando mostrano la probabilità e il lift associati a ogni coppia di input e valori di output. Per ulteriori informazioni, consultare Visualizzare un modello utilizzando Microsoft Neural Network Viewer.

Per esplorare la struttura degli input e delle subnet e per visualizzare statistiche dettagliate, è possibile usare microsoft Generic Content Tree Viewer. È possibile fare clic su qualsiasi nodo per espanderlo e visualizzare i nodi figlio oppure visualizzare i pesi e altre statistiche contenute nel nodo.

Contenuto del modello per un modello di regressione logistica

In questa sezione vengono forniti dettagli ed esempi solo per le colonne nel contenuto del modello di data mining con particolare rilevanza per la regressione logistica. Il contenuto del modello è quasi identico a quello di un modello di rete neurale, ma le descrizioni applicabili ai modelli di rete neurale possono essere ripetute in questa tabella per praticità.

Per informazioni sulle colonne per utilizzo generico nel set di righe dello schema, ad esempio MODEL_CATALOG e MODEL_NAME, non descritte qui o per spiegazioni della terminologia del modello di data mining, vedere Contenuto del modello di data mining (Analysis Services - Data mining).

Catalogo dei Modelli
Nome del database in cui è archiviato il modello.

MODEL_NAME
Nome del modello.

ATTRIBUTE_NAME
Nomi dell'attributo che corrisponde a questo nodo.

nodo Contenuto
Radice del modello Vuoto
Statistiche marginali Vuoto
Livello di input Vuoto
Nodo di input Nome attributo di input
Livello nascosto Vuoto
Livello di output Vuoto
Nodo di output Nome dell'attributo di output

NOME_DEL_NODO
Il nome del nodo. Attualmente, questa colonna contiene lo stesso valore di NODE_UNIQUE_NAME, anche se questa potrebbe cambiare nelle versioni future.

NODE_UNIQUE_NAME
Nome univoco del nodo.

Per altre informazioni sul modo in cui i nomi e gli ID forniscono informazioni strutturali sul modello, vedere la sezione Uso di nomi e ID dei nodi.

TIPO_DI_NODO
Un modello di regressione logistica restituisce i tipi di nodo seguenti:

ID del tipo di nodo Descrizione
1 Modello.
17 Nodo organizzatore per la sottorete.
18 Nodo organizzatore per il livello di input.
19 Nodo organizzatore per il livello nascosto. Il livello nascosto è vuoto.
20 Nodo organizzatore per il livello di output.
21 Nodo attributo di input.
23 Nodo attributo di uscita.
24 Nodo delle statistiche marginali.

NODE_CAPTION
Etichetta o didascalia associata al nodo. Nei modelli di regressione logistica, sempre vuoto.

CARDINALITÀ_BAMBINI
Una stima del numero di figli che il nodo ha.

nodo Contenuto
Radice del modello Indica il numero di nodi figlio, che include almeno 1 rete, 1 nodo marginale richiesto e 1 livello di input richiesto. Ad esempio, se il valore è 5, sono presenti 3 subnet.
Statistiche marginali Sempre 0.
Livello di input Indica il numero di coppie di valori di attributo di input usate dal modello.
Nodo di input Sempre 0.
Livello nascosto In un modello di regressione logistica, sempre 0.
Livello di output Indica il numero di valori di output.
Nodo di uscita Sempre 0.

PARENT_NOME_UNICO
Nome univoco del genitore del nodo. Null viene restituito per tutti i nodi a livello radice.

Per altre informazioni sul modo in cui i nomi e gli ID forniscono informazioni strutturali sul modello, vedere la sezione Uso di nomi e ID dei nodi.

DESCRIZIONE_NODO
Descrizione facile da usare del nodo.

nodo Contenuto
Radice del modello Vuoto
Statistiche marginali Vuoto
Livello di input Vuoto
Nodo di input Nome di attributo di input
Livello nascosto Vuoto
Livello di output Vuoto
Nodo di uscita Se l'attributo di output è continuo, esso comprende il nome dell'attributo stesso.

Se l'attributo di output è discreto o discretizzato, contiene il nome dell'attributo e il valore.

REGOLA_NODO
Descrizione XML della regola incorporata nel nodo.

nodo Contenuto
Radice del modello Vuoto
Statistiche marginali Vuoto
Livello di input Vuoto
Nodo di input Frammento XML contenente le stesse informazioni della colonna NODE_DESCRIPTION.
Livello nascosto Vuoto
Livello di output Vuoto
Nodo di output Frammento XML contenente le stesse informazioni della colonna NODE_DESCRIPTION.

REGOLA_MARGINALE
Per i modelli di regressione logistica, sempre vuoto.

PROBABILITÀ_NODO
Probabilità associata a questo nodo. Per i modelli di regressione logistica, sempre 0.

PROBABILITÀ MARGINALE
Probabilità di raggiungere il nodo dal nodo padre. Per i modelli di regressione logistica, sempre 0.

Distribuzione_Nodo
Tabella nidificata che contiene informazioni statistiche per il nodo. Per informazioni dettagliate sul contenuto di questa tabella per ogni tipo di nodo, vedere la sezione Informazioni sulla tabella NODE_DISTRIBUTION, nel contenuto del modello di data mining per i modelli di rete neurale (Analysis Services - Data mining).

NODE_SUPPORT
Per i modelli di regressione logistica, sempre 0.

Annotazioni

Le probabilità di supporto sono sempre 0 perché l'output di questo tipo di modello non è probabilistico. L'unica cosa che è significativa per l'algoritmo è i pesi; pertanto, l'algoritmo non calcola probabilità, supporto o varianza.

Per ottenere informazioni sul supporto nei casi di training per valori specifici, vedere il nodo delle statistiche marginali.

MSOLAP_MODEL_COLUMN
|Nodo |Contenuto |
|----------|-------------|
|Radice del modello |Vuoto|
|Statistiche marginali |Vuoto|
|Livello di input |Vuoto|
|Nodo di input|Nome dell'attributo di input.|
|Livello nascosto |Vuoto|
|Livello di output |Vuoto|
|Nodo di output |Nome attributo di input.|

MSOLAP_NODE_SCORE
Nei modelli di regressione logistica, sempre 0.

MSOLAP_NODE_SHORT_CAPTION
Nei modelli di regressione logistica, sempre vuoto.

Uso di nomi e ID dei nodi

La denominazione dei nodi in un modello di regressione logistica fornisce informazioni aggiuntive sulle relazioni tra nodi nel modello. La tabella seguente illustra le convenzioni per gli ID assegnati ai nodi in ogni livello.

Tipo di nodo Convenzione per l'ID del nodo
Radice del modello (1) 00000000000000000.
Nodo delle statistiche marginali (24) 10000000000000000
Livello di input (18) 30000000000000000
Nodo di input (21) Inizia da 60000000000000000
Sottorete (17) 20000000000000000
Livello nascosto (19) 40000000000000000
Strato di output (20) 50000000000000000
Nodo di output (23) Inizia da 80.000.000.000.000.000

È possibile usare questi ID per determinare in che modo gli attributi di output sono correlati a attributi specifici del livello di input visualizzando la tabella NODE_DISTRIBUTION del nodo di output. Ogni riga della tabella contiene un ID che punta a un nodo dell'attributo di input specifico. La tabella NODE_DISTRIBUTION contiene anche il coefficiente per la coppia di input-output.

Vedere anche

Algoritmo di Regressione Logistica Microsoft
Contenuti dei modelli di data mining per i modelli di rete neurale (Analysis Services - Data Mining)
Esempi di query sul modello di regressione logistica
Riferimento tecnico per l'algoritmo Microsoft Logistic Regression