Compartilhar via


SystemGetAccuracyResults (Analysis Services - Data Mining)

Retorna métricas de precisão de validação cruzada para uma estrutura de mineração e todos os modelos relacionados, excluindo modelos de clustering.

Esse procedimento armazenado retorna métrica para todo o conjunto de dados como uma única partição. Para particionar conjunto de dados em seções transversais e retornar métricas para cada partição, use SystemGetCrossValidationResults (Analysis Services - Data Mining).

ObservaçãoObservação

Esse procedimento armazenado não tem suporte para modelos criados com o Microsoftalgoritmo MTS ou o Microsoft algoritmo MSC. Além disso, para modelos de clustering, use o procedimento armazenado separado SystemGetClusterAccuracyResults (Analysis Services - Data Mining).

Sintaxe

SystemGetAccuracyResults(<mining structure>, 
[,<mining model list>]
,<data set>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])

Argumentos

  • mining structure
    Nome de uma estrutura de mineração no banco de dados atual.

    (Obrigatória)

  • model list
    Lista separada por vírgulas de modelos para validar.

    O padrão é null. Isso significa que todos os modelos aplicáveis são usados. Quando o padrão é usado, modelos de clustering são excluídos automaticamente da lista de candidatos para processamento.

    (opcional)

  • data set
    Um valor inteiro que indica qual partição na estrutura de mineração é usada para teste. O valor é derivado de uma máscara de bits que representa a soma dos valores seguintes, onde qualquer valor único é opcional:

    Casos de treinamento

    0x0001

    Casos de teste

    0x0002

    Filtro do modelo

    0x0004

    Para obter uma lista completa de valores possíveis, consulte a seção Comentários mais adiante neste tópico.

    (Obrigatória)

  • target attribute
    Cadeia de caracteres que contém o nome de um objeto previsível. Um objeto previsível pode ser uma coluna, coluna de tabela aninhada ou coluna de chave de tabela aninhada de um modelo de mineração.

    (Obrigatória)

  • target state
    Cadeia de caracteres que contém um valor específico para prever.

    Se um valor for especificado, as métricas serão coletadas para aquele estado específico.

    Se nenhum valor for especificado ou se nulo for especificado, as métricas serão computadas para o estado mais provável para cada previsão.

    O padrão é null.

    (opcional)

  • target threshold
    Número entre 0.0 e 1 que especifica a probabilidade mínima em que o valor de previsão foi contado como correto.

    O padrão é null, o que significa que todas as previsões são contadas como corretas.

    (opcional)

  • test list
    Uma cadeia de caracteres que especifica opções de teste. Esse parâmetro é reservado para uso futuro.

    (opcional)

Tipo de retorno

O conjunto de linhas que é retornado contém pontuações para cada partição e agregações para todos os modelos.

A tabela a seguir lista as colunas retornadas por GetValidationResults.

Nome da Coluna

Descrição

Modelo

O nome do modelo que foi testado. Tudo indica que o resultado é uma agregação para todos os modelos.

AttributeName

O nome da coluna previsível.

AttributeState

Um valor de destino na coluna previsível.

Se essa coluna contiver um valor, só serão coletadas métrica para o estado especificado.

Se esse valor não for especificado ou for nulo, as métrica são computadas para o estado mais provável para cada previsão.

PartitionIndex

Denota a partição à qual o resultado se aplica.

Para esse procedimento, sempre 0.

PartitionCases

Um inteiro que indica o número de linhas no conjunto de casos baseado no parâmetro <data set>.

Teste

O tipo de teste que foi executado.

Medida

Nome da medida retornada pelo teste. Medidas para cada modelo dependem do tipo modelo e do tipo do valor previsível.

Para obter uma lista de medidas retornadas para cada tipo previsível, consulte Relatório de validação cruzada (Analysis Services - Mineração de dados).

Para obter uma definição de cada medida, consulte Validação cruzada (Analysis Services - Mineração de dados).

Valor

O valor para a medida especificada.

Comentários

A tabela a seguir fornece exemplos dos valores que você pode usar para especificar os dados na estrutura de mineração usados para validação cruzada. Se você desejar usar casos de teste para validação cruzada, a estrutura de mineração já deverá conter um conjunto de dados para teste. Para obter informações sobre como definir um conjunto de dados de teste ao criar uma estrutura de mineração, consulte Particionando dados em conjuntos de treinamento e teste (Analysis Services - Mineração de dados).

Valor inteiro

Descrição

1

Somente casos de treinamento são usados.

2

Somente os casos de teste são usados.

3

Somente os casos de teste e de treinamento são usados.

4

Combinação inválida.

5

Somente casos de teste são usados e o filtro de modelo é aplicado.

6

Somente casos de teste são usados e o filtro de modelo é aplicado.

7

Os casos de teste e de treinamento são usados e o filtro de modelo é aplicado.

Para obter mais informações sobre os cenários nos quais você usaria validação cruzada, consulte Validando modelos de mineração de dados [Analysis Services - Mineração de Dados].

Exemplos

Esse exemplo retorna medidas de precisão para um único modelo da árvore de decisão, v Target Mail DT, que é associado com a estrutura de mineração vTargetMail. O código da linha quatro indica que os resultados devem ser baseados nos casos de teste, filtrados para cada modelo por filtro específico para ele. [Bike Buyer] especifica a coluna que deverá ser prevista e o 1 na linha a seguir indica que o modelo deverá ser avaliado somente para o valor específico 1, que significa “Sim, comprarei”.

A linha final do código especifica que o valor do limite de estado é 0.5. Isso significa que previsões com uma probabilidade maior que 50% devem ser contados como previsões “boas” no cálculo da previsão.

CALL SystemGetAccuracyResults (
[vTargetMail],
[vTargetMail DT],
6,
'Bike Buyer',
1,
0.5
)

Resultados do exemplo:

ModelName

AttributeName

AttributeState

PartitionIndex

PartitionSize

Teste

Medida

Valor

v Target Mail DT

Comprador da bicicleta

1

0

1638

Classificação

Verdadeiro Positivo

605

v Target Mail DT

Comprador da bicicleta

1

0

1638

Classificação

Falso Positivo

177

v Target Mail DT

Comprador da bicicleta

1

0

1638

Classificação

Verdadeiro Negativo

501

v Target Mail DT

Comprador da bicicleta

1

0

1638

Classificação

Falso Negativo

355

v Target Mail DT

Comprador da bicicleta

1

0

1638

Probabilidade

Pontuação de log

-0.598454638753028

v Target Mail DT

Comprador da bicicleta

1

0

1638

Probabilidade

Comparação de Precisão

0.0936717116894395

v Target Mail DT

Comprador da bicicleta

1

0

1638

Probabilidade

Erro de Raiz Quadrada Média

0.361630800104946

Requisitos

A validação cruzada só está disponível em SQL Server 2008 Enterprise.