Compartilhar via


SELECT DISTINCT FROM <modelo > (DMX)

Retorna todos os possíveis estados para a coluna selecionada no modelo. Os valores retornados variam dependendo se a coluna especificada contém valores discretos, valores numéricos diferenciados ou valores numéricos contínuos.

Sintaxe

SELECT [FLATTENED] DISTINCT [TOP <n>] <expression list> FROM <model> 
[WHERE <condition list>][ORDER BY <expression>]

Argumentos

  • n
    Opcional. Número inteiro que especifica quantas linhas serão retornadas.

  • expression list
    Lista de identificadores, separada por vírgulas, de colunas ou expressões relacionadas (derivadas do modelo).

  • model
    Identificador de modelo.

  • condition list
    Uma condição para restringir os valores retornados da lista de colunas.

  • expression
    Opcional. Expressão que retorna um valor escalar.

Comentários

A instrução SELECT DISTINCT FROM funciona apenas com uma única coluna ou com um conjunto de colunas relacionadas. Essa cláusula não funciona com um conjunto de colunas não relacionadas.

A instrução SELECT DISTINCT FROM permite que você faça referência direta a uma coluna dentro de uma tabela aninhada. Por exemplo:

<model>.<table column reference>.<column reference>

Os resultados da instrução SELECT DISTINCT FROM <model> podem variar, dependendo do tipo de coluna. A tabela a seguir descreve os tipos de coluna com suporte e a saída da instrução.

Tipo de coluna

Saída

Distintos

Valores únicos na coluna.

Diferenciado

Ponto central de cada partição diferenciada na coluna.

Contínuo

Ponto central para os valores da coluna.

Exemplo de coluna Discrete

O exemplo de código a seguir se baseia no modelo [TM Decision Tree] criado no Tutorial de mineração de dados básico. A consulta retorna os valores exclusivos que existem na coluna discreta Gender.

SELECT DISTINCT [Gender]
FROM [TM Decision Tree]

Resultados do exemplo:

Sexo

  

F

M

Para colunas que contêm valores discretos, os resultados incluem sempre o estado Ausente, mostrado como um valor nulo.

Exemplo de coluna Continuous

O exemplo de código a seguir retorna os valores de ponto central, idade máxima e idade mínima para todos os valores na coluna.

SELECT DISTINCT [Age] AS [Midpoint Age], 
    RangeMin([Age]) AS [Minimum Age], 
    RangeMax([Age]) AS [Maximum Age]
FROM [TM Decision Tree]

Resultados do exemplo:

Idade de ponto médio

Idade mínima

Idade máxima

  

  

  

62

26

97

A consulta também retorna uma única linha de valores nulos, para representar valores ausentes.

Exemplo de coluna Discretized

O exemplo de código a seguir retorna os valores de ponto médio, máximo e mínimo de cada bucket criado pelo algoritmo para a coluna, [Yearly Income]. Para reproduzir os resultados deste exemplo, crie uma nova estrutura de mineração igual à de [Targeted Mailing]. No assistente, altere o tipo de conteúdo da coluna Yearly Income de Continuous para Discretized.

ObservaçãoObservação

Também é possível alterar o modelo de mineração criado no Tutorial Mineração Básica para diferenciar a coluna da estrutura de mineração, [Yearly Income]. Para obter informações sobre como fazer isso, consulte Alterar a diferenciação de uma coluna em um modelo de mineração. No entanto, quando você altera a diferenciação da coluna, isso força a estrutura de mineração a ser reprocessada, o que altera os resultados dos outros modelos criados com o uso dessa estrutura.

SELECT DISTINCT [Yearly Income] AS [Bucket Average], 
    RangeMin([Yearly Income]) AS [Bucket Minimum], 
    RangeMax([Yearly Income]) AS [Bucket Maximum]
FROM [TM Decision Tree]

Resultados do exemplo:

Média de bucket

Mínimo de bucket

Máximo de bucket

  

  

  

24610.7

10000

39221.41

55115.73

39221.41

71010.05

84821.54

71010.05

98633.04

111633.9

98633.04

124634.7

147317.4

124634.7

170000

Você pode observar que os valores da coluna [Renda Anual] foram diferenciados em cinco buckets, mais uma linha adicional de valores nulos, para representar valores ausentes.

O número de casas decimais nos resultados depende do cliente usado para a consulta. Aqui, elas foram arredondadas para duas casas decimais, para simplificar e refletir os valores exibidos no SSDT (SQL Server Data Tools).

Por exemplo, se você procurar o modelo usando o visualizador de Árvore de Decisão e clicar em um nó que contenha os clientes agrupados por renda, as propriedades de nó a seguir serão exibidas na Dica de Ferramenta:

Idade >=69 AND renda Anual < 39221.41

ObservaçãoObservação

O valor mínimo do bucket mínimo e o valor máximo do bucket máximo são apenas os valores mais alto e mais baixo observados. Os valores dentro desse intervalo observado são considerados como pertencentes aos buckets mínimo e máximo.

Consulte também

Referência

SELECT (DMX)

Instruções de manipulação de dados DMX (Data Mining Extensions)

Referência de instrução DMX (Data Mining Extensions)