Conteúdo do modelo de mineração para modelos de associação (Analysis Services – Mineração de Dados)
Este tópico descreve o conteúdo do modelo de mineração específico para modelos que usam o algoritmo Regras de Associação da Microsoft. Para obter uma explicação geral e sobre a terminologia estatística relacionada ao conteúdo do modelo de mineração que se aplica a todos os tipos de modelo, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).
Entendendo a estrutura de um modelo de associação
Um modelo de associação tem uma estrutura simples. Cada modelo tem um único nó pai que representa o modelo e seus metadados, e cada nó pai possui uma lista simples de conjuntos de itens e regras. Os conjuntos de itens e as regras não são organizados em árvores, são ordenados com os conjuntos de itens primeiro e depois as regras, como mostra o diagrama a seguir.
Cada conjunto de item é contido em seu próprio nó (NODE_TYPE = 7). O nó inclui a definição do conjunto de itens, o número de casos que contém esse conjunto de itens e outras informações.
Cada regra também é contida em seu próprio nó (NODE_TYPE = 8). Uma regra descreve um padrão geral de como os itens são associados. Uma regra é como uma instrução IF-THEN. O lado esquerdo da regra mostra uma condição existente ou um conjunto de condições. O lado direito da regra mostra o item em seu conjunto de dados que geralmente é associado às condições à esquerda.
Observação Para extrair regras ou conjuntos de itens, você pode usar uma consulta para retornar somente os tipos de nós desejados. Para obter mais informações, consulte Consultando um modelo de associação (Analysis Services - Mineração de dados).
Conteúdo de um modelo de associação
Esta seção fornece detalhes e exemplos somente para as colunas de conteúdo do modelo de mineração que são relevantes para os modelos de associação.
Para obter informações sobre as colunas de uso general no conjunto de linhas de esquema, como MODEL_CATALOG e MODEL_NAME, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).
MODEL_CATALOG
Nome do banco de dados no qual o modelo é armazenado.MODEL_NAME
O nome do modelo.ATTRIBUTE_NAME
Nomes dos atributos que correspondem a esse nó.NODE_NAME
Nome do nó. Em um modelo de associação, essa coluna contém o mesmo valor que NODE_UNIQUE_NAME.NODE_UNIQUE_NAME
Nome exclusivo do nó.NODE_TYPE
O modelo de associação produz apenas os seguintes tipos de nó:ID do tipo de nó
Tipo
1 (Modelo)
Raiz ou nó pai.
7 (Conjunto de itens)
Um conjunto de itens ou coleção de pares atributo-valor. Exemplos:
Product 1 = Existing, Product 2 = Existing
ou
Gender = Male.
8 (Regra)
Uma regra que define como itens relacionam-se entre si.
Exemplo:
Product 1 = Existing, Product 2 = Existing -> Product 3 = Existing.
NODE_CAPTION
Um rótulo ou uma legenda associada ao nó.Nó do conjunto de itens Uma lista de itens separada por vírgula.
Nó de regra Contém os lados esquerdo e direito da regra.
CHILDREN_CARDINALITY
Indica o número de filhos do nó atual.Nó pai Indica o número total de conjuntos de itens mais regras.
Observação Para obter uma análise da contagem de conjuntos de itens e regras, consulte NODE_DESCRIPTION do nó raiz do modelo.
Nó do conjunto de itens ou da regra Sempre 0.
PARENT_UNIQUE_NAME
Nome exclusivo pai do nó.Nó pai Sempre NULL.
Nó do conjunto de itens ou da regra Sempre 0.
NODE_DESCRIPTION
Uma descrição amigável do conteúdo do nó.Pai nó Inclui uma lista separada por vírgula das seguintes informações sobre o modelo:
Item
Descrição
ITEMSET_COUNT
Contagem de todos os conjuntos de itens do modelo.
RULE_COUNT
Contagem de todas as regras do modelo.
MIN_SUPPORT
O suporte mínimo localizado para qualquer conjunto de itens único.
Observação Esse valor pode ser diferente daquele que você definiu para o parâmetro MINIMUM _SUPPORT.
MAX_SUPPORT
O suporte máximo localizado para qualquer conjunto de itens único.
Observação Esse valor pode ser diferente daquele que você definiu para o parâmetro MAXIMUM_SUPPORT.
MIN_ITEMSET_SIZE
O tamanho do menor conjunto de itens, representado por uma contagem de itens.
Um valor de 0 indica que o estado Missing foi tratado como um item independente.
Observação O valor padrão do parâmetro MINIMUM_ITEMSET_SIZE é 1.
MAX_ITEMSET_SIZE
Indica o tamanho do maior conjunto de dados localizado.
Observação Esse valor é restrito pelo valor que você definiu para o parâmetro MAX_ITEMSET_SIZE ao criar o modelo. Esse valor nunca pode exceder aquele valor; no entanto, pode ser menor. O valor padrão é 3.
MIN_PROBABILITY
A probabilidade mínima detectada para qualquer conjunto de itens único ou regra do modelo.
Exemplo: 0,400390625
Observação Para conjuntos de itens, esse valor é sempre maior que valor que você definiu para o parâmetro MINIMUM_PROBABILITY ao criar o modelo.
MAX_PROBABILITY
A probabilidade máxima detectada para qualquer conjunto de itens único ou regra do modelo.
Exemplo: 1
Observação Não há nenhum parâmetro para restringir a probabilidade máxima de conjuntos de itens. Para eliminar itens que são muito frequentes, use o parâmetro MAXIMUM_SUPPORT em seu lugar.
MIN_LIFT
O valor mínimo de comparação de precisão fornecido pelo modelo para qualquer conjunto de itens.
Exemplo: 0,14309369632511
ObservaçãoSaber o valor mínimo de comparação de precisão pode ajudar a determinar se a comparação de precisão de qualquer conjunto de dados é significante.MAX_LIFT
O valor máximo de comparação de precisão fornecido pelo modelo para qualquer conjunto de itens.
Exemplo: 1.95758227647523 Observação Saber o valor máximo de comparação de precisão pode ajudar a determinar se a comparação de precisão de qualquer conjunto de dados é significante.
Nó do conjunto de itens Os nós de conjuntos de itens contêm uma lista dos itens, exibida como uma cadeia de caracteres de texto separada por vírgula.
Exemplo:
Touring Tire = Existing, Water Bottle = Existing
Significa que foram comprados juntamente pneus de passeio e garrafas de água.
Nó da regra Os nós de regras contêm um lado esquerdo e um direito, separados por uma seta.
Exemplo: Touring Tire = Existing, Water Bottle = Existing -> Cycling cap = Existing
Significa que, se alguém comprou pneus de passeio e uma garrafa de água, provavelmente vai comprar um boné de ciclismo.
NODE_RULE
Um fragmento XML que descreve a regra ou o conjunto de itens que foi incorporado ao nó.Nó pai Em branco.
Nó do conjunto de itens Em branco.
Nó da regra O fragmento XML inclui informações adicionais úteis sobre a regra, como suporte, confiança e o número de itens, e a ID do nó que representa o lado esquerdo da regra.
MARGINAL_RULE
Em branco.NODE_PROBABILITY
Uma pontuação de probabilidade ou confiança associada ao conjunto de itens ou à regra.Nó pai Sempre 0.
Nó do conjunto de itens Probabilidade do conjunto de itens.
Nó da regra Valor de confiança da regra.
MARGINAL_PROBABILITY
Mesmo que NODE_PROBABILITY.NODE_DISTRIBUTION
A tabela contém informações muito diferentes, dependendo de o nó ser um conjunto de itens ou uma regra.Nó pai Em branco.
Nó do conjunto de itens Lista cada item do conjunto de itens com uma probabilidade e um valor de suporte. Por exemplo, se o conjunto de itens contiver dois produtos, o nome de cada um será listado juntamente com a contagem de casos que incluem esses produtos.
Nó da regra Contém duas linhas. A primeira mostra o atributo do lado direito da regra, que é o item do predicado, com uma pontuação de confiança.
A segunda linha é exclusiva em modelos de associação e contém um ponteiro para o conjunto de itens no lado direito da regra. O ponteiro é representado na coluna ATTRIBUTE_VALUE como uma ID do conjunto de itens que contém apenas o item do lado direito.
Por exemplo, se a regra for If {A,B} Then {C}, a tabela conterá o nome do item {C} e a ID do nó que só contém o conjunto de itens do item C.
Esse ponteiro é útil pois é possível determinar a partir do nó do conjunto de itens entre todos os casos quantos contêm o produto no lado direito. Os casos sujeitos à regra If {A,B} Then {C} formam um subconjunto dos casos listados no conjunto de itens para {C}.
NODE_SUPPORT
Número de casos que suportam esse nó.Nó pai Número de casos no modelo.
Nó do conjunto de itens Número de casos que contém todos os itens do conjunto de itens.
Nó de regra O número de casos que contém todos os itens incluídos na regra.
MSOLAP_MODEL_COLUMN
Contém informações diferentes que dependem de o nó se um conjunto de itens ou uma regra.Nó pai Em branco.
Nó do conjunto de itens Em branco.
Nó da regra A ID do conjunto de itens que contém os itens do lado esquerdo da regra. Por exemplo, se a regra for If {A,B} Then {C}, essa coluna conterá a ID do conjunto de itens que contém apenas {A,B}.
MSOLAP_NODE_SCORE
Nó pai Em branco.Nó do conjunto de itens Pontuação de importância do conjunto de itens.
Nó da regra Pontuação de importância da regra.
Observação A importância é calculada de forma diferente para conjuntos de itens e regras. Para obter mais informações, consulte Referência técnica do algoritmo de associação da Microsoft.
MSOLAP_NODE_SHORT_CAPTION
Em branco.