SELECT DISTINCT FROM <model > (DMX)
Si applica a: SQL Server Analysis Services
Restituisce tutti gli stati possibili della colonna selezionata nel modello. I valori restituiti variano a seconda che la colonna specificata contenga valori discreti, valori numerici discretizzati o valori numerici continui.
Sintassi
SELECT [FLATTENED] DISTINCT [TOP <n>] <expression list> FROM <model>
[WHERE <condition list>][ORDER BY <expression>]
Argomenti
n
Facoltativo. Valore intero che specifica il numero di righe da restituire.
elenco di espressioni
Elenco delimitato da virgole contenente espressioni o identificatori di colonne correlate (derivati dal modello).
model
Identificatore del modello.
elenco di condizioni
Condizione per limitare i valori restituiti dall'elenco di colonne.
expression
Facoltativo. Espressione che restituisce un valore scalare.
Osservazioni:
L'istruzione SELECT DISTINCT FROM funziona solo con una singola colonna o con un set di colonne correlate. Non è possibile utilizzare questa clausola con un set di colonne non correlate.
L'istruzione SELECT DISTINCT FROM consente di fare riferimento direttamente a una colonna all'interno di una tabella nidificata. Ad esempio:
<model>.<table column reference>.<column reference>
I risultati dell'istruzione del modello> SELECT DISTINCT FROM <variano a seconda del tipo di colonna. Nella tabella seguente sono descritti i tipi di colonna supportati e l'output dell'istruzione.
Tipo di colonna | Output |
---|---|
Discrete | Valori univoci nella colonna. |
Discretizzato | Punto medio di ogni bucket discretizzato nella colonna. |
Continuo | Punto medio dei valori nella colonna. |
Esempio con una colonna discreta
L'esempio di codice seguente si basa sul [TM Decision Tree]
modello creato nell'esercitazione di base sul data mining. La query restituisce i valori univoci presenti nella colonna discreta Gender
.
SELECT DISTINCT [Gender]
FROM [TM Decision Tree]
Risultati dell'esempio:
Genere |
---|
F |
M |
Per le colonne che contengono valori discreti, i risultati includono sempre lo stato Missing, mostrato come valore null.
Esempio con una colonna continua
L'esempio di codice seguente restituisce il punto medio e l'età massima e minima per tutti i valori nella colonna.
SELECT DISTINCT [Age] AS [Midpoint Age],
RangeMin([Age]) AS [Minimum Age],
RangeMax([Age]) AS [Maximum Age]
FROM [TM Decision Tree]
Risultati dell'esempio:
Midpoint Age | Minimum Age | Maximum Age |
---|---|---|
62 | 26 | 97 |
La query restituisce inoltre una singola riga di valori null per rappresentare valori mancanti.
Esempio con una colonna discretizzata
Nell'esempio di codice seguente vengono restituiti i valori medio, massimo e minimo per ogni bucket creato dall'algoritmo per la colonna . [Yearly Income]
Per riprodurre i risultati per questo esempio è necessario creare una nuova struttura di data mining che corrisponde a [Targeted Mailing]
. Nella procedura guidata modificare il tipo di contenuto della Yearly Income
colonna da Continuous a Discretized.
Nota
È anche possibile modificare il modello di data mining creato in Basic Mining Tutorial per discretizzare la colonna della struttura di data mining, [Yearly Income]
. Per informazioni su come eseguire questa operazione, vedere Modificare la discretizzazione di una colonna in un modello di data mining. Tuttavia, quando si modifica la discretizzazione della colonna, viene forzata la rielaborazione della struttura di data mining modificando i risultati degli altri modelli compilati utilizzando tale struttura.
SELECT DISTINCT [Yearly Income] AS [Bucket Average],
RangeMin([Yearly Income]) AS [Bucket Minimum],
RangeMax([Yearly Income]) AS [Bucket Maximum]
FROM [TM Decision Tree]
Risultati dell'esempio:
Bucket Average | Bucket Minimum | Bucket Maximum |
---|---|---|
24610.7 | 10000 | 39221.41 |
55115.73 | 39221.41 | 71010.05 |
84821.54 | 71010.05 | 98633.04 |
111633.9 | 98633.04 | 124634.7 |
147317.4 | 124634.7 | 170000 |
È possibile notare che i valori della [Yearly Income]
colonna sono stati discretizzati in cinque bucket, oltre a una riga aggiuntiva di valori Null, per rappresentare i valori mancanti.
Il numero di posizioni decimali nei risultati dipende dal client utilizzato per l'esecuzione delle query. In questo caso sono stati arrotondati a due posizioni decimali, sia per semplicità che per riflettere i valori visualizzati in SQL Server Data Tools (SSDT).
Ad esempio, se si esplora il modello mediante il visualizzatore Microsoft Decision Trees e si seleziona un nodo contenente i clienti raggruppati in base al reddito, nella descrizione comandi vengono visualizzate le seguenti proprietà del nodo:
Età >=69 AND Yearly Income < 39221.41
Nota
Il valore minimo del bucket minimo e il valore massimo del bucket massimo rappresentano i valori minimo e massimo osservati. Tutti i valori che non rientrano in questo intervallo osservato vengono considerati appartenenti ai bucket minimo e massimo.
Vedi anche
SELECT (DMX)
Istruzioni di manipolazione dei dati DMX (Data Mining Extensions)
Riferimento all'istruzione DMX (estensione di data mining)