Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Você pode usar a matriz de classificação para avaliar a precisão de um modelo para previsão. Para gerar uma matriz de classificação, você executa um conjunto de dados de teste por meio do modelo e a ferramenta de matriz de classificação compara os valores reais do conjunto de testes com as previsões feitas pelo modelo. Olhando para a matriz, você pode ver rapidamente a frequência com que o modelo está correto e com que frequência ele prevê incorretamente.
Nesses suplementos, use o assistente de Matriz de Classificação para selecionar um modelo, especificar os dados de teste e, em seguida, gerar uma matriz de resultados.
Como ler uma matriz de classificação
Vamos supor que seu objetivo é criar um programa de fidelidade do cliente e, em seguida, atribuir clientes a categorias apropriadas, para que você possa fornecer a eles o nível apropriado de incentivos. Você implementou três níveis para o programa de recompensa - bronze, prata e ouro - e os deu aos clientes em uma fase de avaliação. Você também projetou um modelo que analisa os clientes e prevê as categorias corretas. Agora você usará a matriz de classificação nos dados de avaliação para determinar o quão bom o modelo foi ao prever a oferta correta para todos os clientes.
A tabela da matriz de classificação informa quantos clientes seriam atribuídos a cada categoria com base no modelo e compara esse resultado com o número de clientes que realmente se inscreveram para cada nível de recompensa.
| Bronze (Atual) | Ouro (Atual) | Prata (à vista) | |
|---|---|---|---|
| Bronze | 94,45% | 15.18% | 1,70% |
| Ouro | 2,72% | 84,82% | 0,00% |
| Prata | 1,84% | 0,00% | 93,80% |
| Correto | 95.45% | 84,82% | 98.30% |
| Classificado incorretamente | 4,55% | 15.18% | 1,70% |
Cada coluna mostra os valores reais no conjunto de dados de teste.
Cada linha mostra os valores previstos.
Os valores em negrito, que vão diagonalmente do canto superior esquerdo até o canto inferior direito da matriz, indicam o que o modelo acertou.
Todos os outros valores fora da diagonal representam erros. Alguns erros são falsos positivos, o que significa que o modelo previu que o cliente ingressaria no programa gold, mas estava errado. Dependendo do seu domínio, falsos positivos podem ser muito caros.
Outros são falsos negativos, o que significa que o modelo previu que o cliente não estaria interessado, embora ele tenha ingressado no programa. Novamente, dependendo do domínio do problema, esse custo de oportunidade perdido pode ser significativo.
Usando o Assistente de Matriz de Classificação
Selecione o modelo de mineração no qual basear previsões.
Selecione uma fonte de novos dados de teste ou use dados de teste que foram salvos com a estrutura.
Selecione a coluna para a qual você deseja avaliar a precisão. Você pode escolher apenas uma coluna ao criar uma matriz, mas a coluna pode ter vários valores.
Dica: pode ser difícil interpretar uma matriz de classificação se sua coluna previsível tiver muitas colunas a serem comparadas.
Na página Selecionar Colunas para Prever , você também pode especificar se deseja exibir a contagem de valores incorretos e incorretos ou exibir uma porcentagem.
Na página Selecionar Dados de Origem, indique se você está usando dados de teste externos ou os dados de teste salvos com o modelo.
Se você usar dados de teste externos, será necessário mapear o modelo para as colunas de entrada na página Especificar Relação do assistente.
Se você usar o conjunto de dados de teste inserido, o mapeamento será feito para você
Clique em Concluir para executar previsões no modelo e gerar a matriz de classificação.
O assistente cria um relatório que contém a matriz de classificação e outros detalhes sobre a análise. Este relatório é salvo como uma tabela no Excel, com um resumo acima do relatório que indica quantos casos foram previstos corretamente e quantas previsões estavam erradas.
Requisitos
Para criar uma matriz de classificação, você deve ter acesso a um modelo de mineração existente que dê suporte à medida de precisão. Modelos de previsão e modelos de associação não podem ser medidos usando essa ferramenta.
O modelo que você está medindo precisa prever um valor que seja discreto ou que já tenha sido discretizado.
Se você não usou a opção para salvar um conjunto de testes junto com sua estrutura ou modelo, será necessário obter um conjunto de dados de entrada que tenha essencialmente o mesmo número de colunas, com tipos de dados correspondentes, como os usados no modelo.
Tanto o modelo de mineração de dados quanto os novos dados que você está usando para teste devem conter pelo menos uma coluna que possa ser prevista e as colunas devem conter o mesmo tipo de dados.
Problemas conhecidos
No SQL Server 2012 e no SQL Server 2014, a capacidade de mapear o conjunto de dados de teste interno para o modelo não está funcionando na ferramenta Matriz de Classificação . No entanto, você pode especificar um conjunto de dados externo e selecionar o conjunto de treinamento como a entrada para determinar o erro no conjunto de dados original.
Consulte Também
Validando modelos e usando modelos de previsão (suplementos de mineração de dados para Excel)
Explorar dados (suplementos de mineração de dados do SQL Server)
Detectar categorias (Ferramentas de Análise de Tabela para Excel)