SystemGetAccuracyResults (Analysis Services - Data Mining)
Retorna métricas de precisão de validação cruzada para uma estrutura de mineração e todos os modelos relacionados, excluindo modelos de clustering.
Esse procedimento armazenado retorna métrica para todo o conjunto de dados como uma única partição. Para particionar conjunto de dados em seções transversais e retornar métricas para cada partição, use SystemGetCrossValidationResults (Analysis Services - Data Mining).
Observação |
---|
Esse procedimento armazenado não tem suporte para modelos criados com o Microsoftalgoritmo MTS ou o Microsoft algoritmo MSC. Além disso, para modelos de clustering, use o procedimento armazenado separado SystemGetClusterAccuracyResults (Analysis Services - Data Mining). |
Sintaxe
SystemGetAccuracyResults(<mining structure>,
[,<mining model list>]
,<data set>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])
Argumentos
mining structure
Nome de uma estrutura de mineração no banco de dados atual.(Obrigatória)
model list
Lista separada por vírgulas de modelos para validar.O padrão é null. Isso significa que todos os modelos aplicáveis são usados. Quando o padrão é usado, modelos de clustering são excluídos automaticamente da lista de candidatos para processamento.
(opcional)
data set
Um valor inteiro que indica qual partição na estrutura de mineração é usada para teste. O valor é derivado de uma máscara de bits que representa a soma dos valores seguintes, onde qualquer valor único é opcional:Casos de treinamento
0x0001
Casos de teste
0x0002
Filtro do modelo
0x0004
Para obter uma lista completa de valores possíveis, consulte a seção Comentários mais adiante neste tópico.
(Obrigatória)
target attribute
Cadeia de caracteres que contém o nome de um objeto previsível. Um objeto previsível pode ser uma coluna, coluna de tabela aninhada ou coluna de chave de tabela aninhada de um modelo de mineração.(Obrigatória)
target state
Cadeia de caracteres que contém um valor específico para prever.Se um valor for especificado, as métricas serão coletadas para aquele estado específico.
Se nenhum valor for especificado ou se nulo for especificado, as métricas serão computadas para o estado mais provável para cada previsão.
O padrão é null.
(opcional)
target threshold
Número entre 0.0 e 1 que especifica a probabilidade mínima em que o valor de previsão foi contado como correto.O padrão é null, o que significa que todas as previsões são contadas como corretas.
(opcional)
test list
Uma cadeia de caracteres que especifica opções de teste. Esse parâmetro é reservado para uso futuro.(opcional)
Tipo de retorno
O conjunto de linhas que é retornado contém pontuações para cada partição e agregações para todos os modelos.
A tabela a seguir lista as colunas retornadas por GetValidationResults.
Nome da Coluna |
Descrição |
---|---|
Modelo |
O nome do modelo que foi testado. Tudo indica que o resultado é uma agregação para todos os modelos. |
AttributeName |
O nome da coluna previsível. |
AttributeState |
Um valor de destino na coluna previsível. Se essa coluna contiver um valor, só serão coletadas métrica para o estado especificado. Se esse valor não for especificado ou for nulo, as métrica são computadas para o estado mais provável para cada previsão. |
PartitionIndex |
Denota a partição à qual o resultado se aplica. Para esse procedimento, sempre 0. |
PartitionCases |
Um inteiro que indica o número de linhas no conjunto de casos baseado no parâmetro <data set>. |
Teste |
O tipo de teste que foi executado. |
Medida |
Nome da medida retornada pelo teste. Medidas para cada modelo dependem do tipo modelo e do tipo do valor previsível. Para obter uma lista de medidas retornadas para cada tipo previsível, consulte Relatório de validação cruzada (Analysis Services - Mineração de dados). Para obter uma definição de cada medida, consulte Validação cruzada (Analysis Services - Mineração de dados). |
Valor |
O valor para a medida especificada. |
Comentários
A tabela a seguir fornece exemplos dos valores que você pode usar para especificar os dados na estrutura de mineração usados para validação cruzada. Se você desejar usar casos de teste para validação cruzada, a estrutura de mineração já deverá conter um conjunto de dados para teste. Para obter informações sobre como definir um conjunto de dados de teste ao criar uma estrutura de mineração, consulte Particionando dados em conjuntos de treinamento e teste (Analysis Services - Mineração de dados).
Valor inteiro |
Descrição |
---|---|
1 |
Somente casos de treinamento são usados. |
2 |
Somente os casos de teste são usados. |
3 |
Somente os casos de teste e de treinamento são usados. |
4 |
Combinação inválida. |
5 |
Somente casos de teste são usados e o filtro de modelo é aplicado. |
6 |
Somente casos de teste são usados e o filtro de modelo é aplicado. |
7 |
Os casos de teste e de treinamento são usados e o filtro de modelo é aplicado. |
Para obter mais informações sobre os cenários nos quais você usaria validação cruzada, consulte Validando modelos de mineração de dados [Analysis Services - Mineração de Dados].
Exemplos
Esse exemplo retorna medidas de precisão para um único modelo da árvore de decisão, v Target Mail DT, que é associado com a estrutura de mineração vTargetMail. O código da linha quatro indica que os resultados devem ser baseados nos casos de teste, filtrados para cada modelo por filtro específico para ele. [Bike Buyer] especifica a coluna que deverá ser prevista e o 1 na linha a seguir indica que o modelo deverá ser avaliado somente para o valor específico 1, que significa “Sim, comprarei”.
A linha final do código especifica que o valor do limite de estado é 0.5. Isso significa que previsões com uma probabilidade maior que 50% devem ser contados como previsões “boas” no cálculo da previsão.
CALL SystemGetAccuracyResults (
[vTargetMail],
[vTargetMail DT],
6,
'Bike Buyer',
1,
0.5
)
Resultados do exemplo:
ModelName |
AttributeName |
AttributeState |
PartitionIndex |
PartitionSize |
Teste |
Medida |
Valor |
---|---|---|---|---|---|---|---|
v Target Mail DT |
Comprador da bicicleta |
1 |
0 |
1638 |
Classificação |
Verdadeiro Positivo |
605 |
v Target Mail DT |
Comprador da bicicleta |
1 |
0 |
1638 |
Classificação |
Falso Positivo |
177 |
v Target Mail DT |
Comprador da bicicleta |
1 |
0 |
1638 |
Classificação |
Verdadeiro Negativo |
501 |
v Target Mail DT |
Comprador da bicicleta |
1 |
0 |
1638 |
Classificação |
Falso Negativo |
355 |
v Target Mail DT |
Comprador da bicicleta |
1 |
0 |
1638 |
Probabilidade |
Pontuação de log |
-0.598454638753028 |
v Target Mail DT |
Comprador da bicicleta |
1 |
0 |
1638 |
Probabilidade |
Comparação de Precisão |
0.0936717116894395 |
v Target Mail DT |
Comprador da bicicleta |
1 |
0 |
1638 |
Probabilidade |
Erro de Raiz Quadrada Média |
0.361630800104946 |
Requisitos
A validação cruzada só está disponível em SQL Server 2008 Enterprise.