Compartilhar via


Conteúdo do modelo de mineração para modelos de regressão logística (Analysis Services – Mineração de Dados)

Este tópico descreve o conteúdo do modelo de mineração que é específico para modelos que usam o algoritmo Regressão Logística da Microsoft. Para obter uma explicação de como interpretar as estatísticas e a estrutura compartilhada por todos os tipos de modelo e definições gerais dos termos relacionados ao conteúdo do modelo de mineração, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).

Entendendo a estrutura de um modelo de regressão logística

Um modelo de regressão logística é criado usando o algoritmo Rede Neural da Microsoft com parâmetros que restringem o modelo para eliminar o nó oculto. Portanto, a estrutura geral de um modelo de regressão logística é quase idêntica à de um modelo de rede neural: cada modelo tem um único nó pai que representa o modelo e seus metadados e um nó de estatísticas marginais especial (NODE_TYPE = 24) que fornece estatísticas descritivas sobre as entradas usadas no modelo.

Além disso, o modelo contém uma sub-rede (NODE_TYPE = 17) para cada atributo previsível. Exatamente como em um modelo de rede neural, cada sub-rede sempre contém duas ramificações: uma para a camada de entrada e outra que contém a camada oculta (NODE_TYPE = 19) e a camada de saída (NODE_TYPE = 20) da rede. A mesma sub-rede pode ser usada para diversos atributos se eles forem especificados como somente para previsão. Os atributos previsíveis que também são entradas podem não ser exibidos na mesma sub-rede.

Porém, em um modelo de regressão logística, o nó que representa a camada oculta está vazio e não tem nenhum filho. Sendo assim, o modelo contém nós que representam saídas individuais (NODE_TYPE = 23) e entradas individuais (NODE_TYPE = 21), mas não nós ocultos individuais.

estrutura de conteúdo do modelo de regressão logística

Por padrão, um modelo de regressão logística é exibido no Visualizador de Rede Neural da Microsoft. Com esse visualizador personalizado, você pode filtrar os atributos de entrada e seus valores e visualizar, graficamente, como eles afetam as saídas. As dicas de ferramentas no visualizador mostram a probabilidade e a comparação de precisão associadas a cada par de valores de entrada e saída. Para obter mais informações, consulte Exibindo um modelo de mineração com o Visualizador de Rede Neural da Microsoft.

Para explorar a estrutura de entradas e sub-redes e visualizar estatísticas detalhadas, você pode usar o Visualizador de Árvore de Conteúdo Genérica da Microsoft. É possível clicar em qualquer nó para expandi-lo e visualizar os nós filho ou exibir as ponderações e outras estatísticas contidas no nó.

Conteúdo de um modelo de regressão logística

Esta seção fornece detalhes e exemplos somente para as colunas do conteúdo do modelo de mineração que são relevantes para a regressão logística. O conteúdo do modelo é praticamente idêntico ao de um modelo de rede neural, porém as descrições que se aplicam aos modelos de rede neural podem ser repetidas aqui por conveniência.

Para obter informações sobre colunas de fins gerais no conjunto de linhas de esquema, como MODEL_CATALOG e MODEL_NAME, que não são descritas aqui ou para obter explicações da terminologia do modelo de mineração, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).

  • MODEL_CATALOG
    Nome do banco de dados onde o modelo é armazenado.

  • MODEL_NAME
    Nome do modelo.

  • ATTRIBUTE_NAME
    O nome do atributo que corresponde a esse nó.

    Conteúdo

    Raiz do modelo

    Em branco

    Estatísticas marginais

    Em branco

    Camada de entrada

    Em branco

    Nó de entrada

    Nome do atributo de entrada

    Camada oculta

    Em branco

    Camada de saída

    Em branco

    Nó de saída

    Nome do atributo de saída

  • NODE_NAME
    O nome do nó. Atualmente, esta coluna contém o mesmo valor de NODE_UNIQUE_NAME, embora isso possa mudar em versões futuras.

  • NODE_UNIQUE_NAME
    Nome exclusivo do nó.

    Para obter mais informações sobre como os nomes e as IDs fornecem dados estruturais sobre o modelo, consulte a seção Usando nomes e IDs de nós.

  • NODE_TYPE
    Um modelo de regressão logística gera os seguintes tipos de nó:

    Identificador do tipo de nó

    Descrição

    1

    Modelo.

    17

    Nó do organizador para a sub-rede.

    18

    Nó do organizador da camada de entrada.

    19

    Nó do organizador da camada oculta. A camada oculta é vazia.

    20

    Nó do organizador da camada de saída.

    21

    Nó do atributo de entrada.

    23

    Nó do atributo de saída.

    24

    Nó de estatísticas marginais.

  • NODE_CAPTION
    Um rótulo ou uma legenda associada ao nó. Em modelos de regressão logística, sempre em branco.

  • CHILDREN_CARDINALITY
    Uma estimativa do número de filhos do nó.

    Conteúdo

    Raiz do modelo

    Indica a contagem de nós filho, que inclui pelo menos 1 rede, 1 nó marginal necessário e 1 camada de entrada necessária. Por exemplo, se o valor for 5, haverá 3 sub-redes.

    Estatísticas marginais

    Sempre 0.

    Camada de entrada

    Indica o número de pares de atributo-valores de entrada usados pelo modelo.

    Nó de entrada

    Sempre 0.

    Camada oculta

    Em um modelo de regressão logística, sempre 0.

    Camada de saída

    Indica o número de valores de saída.

    Nó de saída

    Sempre 0.

  • PARENT_UNIQUE_NAME
    Nome exclusivo do pai do nó. NULL é retornado para todos os nós em nível raiz.

    Para obter mais informações sobre como os nomes e as IDs fornecem dados estruturais sobre o modelo, consulte a seção, Usando nomes e IDs de nós.

  • NODE_DESCRIPTION
    Uma descrição amigável do nó.

    Conteúdo

    Raiz do modelo

    Em branco

    Estatísticas marginais

    Em branco

    Camada de entrada

    Em branco

    Nó de entrada

    Nome do atributo de entrada

    Camada oculta

    Em branco

    Camada de saída

    Em branco

    Nó de saída

    Se o atributo de saída for contínuo, conterá o nome do atributo de saída.

    Se o atributo de saída for discreto ou diferenciado, contém o nome do atributo e o valor.

  • NODE_RULE
    Uma descrição XML da regra é incorporada ao nó.

    Conteúdo

    Raiz do modelo

    Em branco

    Estatísticas marginais

    Em branco

    Camada de entrada

    Em branco

    Nó de entrada

    Um fragmento de XML que contém as mesmas informações que a coluna NODE_DESCRIPTION.

    Camada oculta

    Em branco

    Camada de saída

    Em branco

    Nó de saída

    Um fragmento de XML que contém as mesmas informações que a coluna NODE_DESCRIPTION.

  • MARGINAL_RULE
    Em modelos de regressão logística, sempre em branco.

  • NODE_PROBABILITY
    A probabilidade associada a este nó. Em modelos de regressão logística, sempre 0.

  • MARGINAL_PROBABILITY
    Probabilidade de que o nó seja alcançado a partir do nó pai. Em modelos de regressão logística, sempre 0.

  • NODE_DISTRIBUTION
    Uma tabela aninhada que contém informações estatísticas sobre o nó. Para obter informações detalhadas sobre o conteúdo dessa tabela em cada tipo de nó, consulte a seção Entendendo a tabela NODE_DISTRIBUTION em Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de Dados).

  • NODE_SUPPORT
    Em modelos de regressão logística, sempre 0.

    ObservaçãoObservação

    O suporte a probabilidades é sempre 0 porque a saída desse tipo modelo não é probabilística. A única coisa significativa para esse algoritmo são as ponderações. Sendo assim, o algoritmo não computa probabilidade, suporte ou variação.

    Para obter informações sobre o suporte nos casos de treinamento para valores específicos, consulte o nó de estatísticas marginais.

  • MSOLAP_MODEL_COLUMN

    Conteúdo

    Raiz do modelo

    Em branco

    Estatísticas marginais

    Em branco

    Camada de entrada

    Em branco

    Nó de entrada

    Nome do atributo de entrada.

    Camada oculta

    Em branco

    Camada de saída

    Em branco

    Nó de saída

    Nome do atributo de entrada.

  • MSOLAP_NODE_SCORE
    Em modelos de regressão logística, sempre 0.

  • MSOLAP_NODE_SHORT_CAPTION
    Em modelos de regressão logística, sempre em branco.

Usando nomes e IDs de nós

A nomenclatura dos nós em um modelo de regressão logística fornece mais informações sobre os tipos de relações entre os nós no modelo. A tabela a seguir mostra as convenções para as IDs atribuídas aos nós em cada camada.

Tipo de nó

Convenção da ID de nó

Raiz do modelo (1)

00000000000000000.

Nó de estatísticas marginais (24)

10000000000000000

Camada de entrada (18)

30000000000000000

Nó de entrada (21)

Inicia às 60000000000000000

Sub-rede (17)

20000000000000000

Camada oculta (19)

40000000000000000

Camada de saída (20)

50000000000000000

Nó de saída (23)

Inicia em 80000000000000000

Você pode usar essas IDs para determinar como os atributos de saída são relacionados a atributos específicos da camada de entrada exibindo a tabela NODE_DISTRIBUTION no nó de saída. Cada linha nessa tabela contém uma ID que indica um nó de atributo de entrada específico. A tabela NODE_DISTRIBUTION também contém o coeficiente para o par de entrada-saída.