Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Ao criar uma consulta em relação a um modelo de mineração de dados, você pode criar uma consulta de conteúdo, que fornece detalhes sobre os padrões descobertos na análise ou uma consulta de previsão, que usa os padrões no modelo para fazer previsões para novos dados. Por exemplo, uma consulta de conteúdo para um modelo de rede neural pode recuperar metadados de modelo, como o número de camadas ocultas. Como alternativa, uma consulta de previsão pode sugerir classificações com base em uma entrada e, opcionalmente, fornecer probabilidades para cada classificação.
Esta seção explica como criar consultas para modelos baseados no algoritmo da Rede Neural da Microsoft.
Consultas de conteúdo
Obtendo metadados de modelo usando DMX
Recuperando metadados de modelo do conjunto de linhas de esquema
Recuperando os atributos de entrada para o modelo
Recuperando pesos da camada oculta
Consultas de previsão
Criando uma previsão singleton
Localizando informações sobre um modelo de rede neural
Todos os modelos de mineração expõem o conteúdo aprendido pelo algoritmo de acordo com um esquema padronizado, o conjunto de linhas do esquema do modelo de mineração. Essas informações fornecem detalhes sobre o modelo e incluem os metadados básicos, as estruturas descobertas na análise e os parâmetros usados durante o processamento. Você pode criar consultas no conteúdo do modelo usando instruções DMX (Extensão de Mineração de Dados).
Consulta de exemplo 1: Obtendo metadados de modelo usando DMX
A consulta a seguir retorna alguns metadados básicos sobre um modelo criado usando o algoritmo Microsoft Neural Network. Em um modelo de rede neural, o nó pai do modelo contém apenas o nome do modelo, o nome do banco de dados em que o modelo é armazenado e o número de nós filhos. No entanto, o nó de estatísticas marginais (NODE_TYPE = 24) fornece esses metadados básicos e algumas estatísticas derivadas sobre as colunas de entrada usadas no modelo.
A consulta de exemplo a seguir baseia-se no modelo de mineração criado no Tutorial de Mineração de Dados Intermediário, chamado Call Center Default NN. O modelo usa dados de um call center para explorar possíveis correlações entre o pessoal e o número de chamadas, pedidos e problemas. A instrução DMX recupera dados do nó de estatísticas marginais do modelo de rede neural. A consulta inclui a palavra-chave FLATTENED, pois as estatísticas de atributo de entrada de interesse são armazenadas em uma tabela aninhada, NODE_DISTRIBUTION. No entanto, se o provedor de consulta der suporte a conjuntos de linhas hierárquicos, você não precisará usar a palavra-chave FLATTENED.
SELECT FLATTENED MODEL_CATALOG, MODEL_NAME,
( SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE,
[SUPPORT], [PROBABILITY], VALUETYPE
FROM NODE_DISTRIBUTION
) AS t
FROM [Call Center Default NN].CONTENT
WHERE NODE_TYPE = 24
Observação
Você deve colocar os nomes das colunas de tabela aninhadas [SUPPORT] e [PROBABILITY] entre colchetes para distingui-los das palavras-chave reservadas de mesmo nome.
Resultados do exemplo:
| CATÁLOGO_DE_MODELOS | MODEL_NAME | t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE | t.SUPPORT | t.PROBABILIDADE | t.VALUETYPE |
|---|---|---|---|---|---|---|
| Adventure Works DW Multidimensional 2012 | Central de Atendimento NN | Tempo médio por problema | Em falta | 0 | 0 | 1 |
| Adventure Works DW Multidimensional 2012 | Central de Atendimento NN | Tempo médio por problema | < 64.7094100096 | 11 | 0.407407407 | 5 |
Para obter uma definição do que as colunas no conjunto de linhas de esquema significam no contexto de um modelo de rede neural, consulte o Conteúdo do Modelo de Mineração para Modelos de Rede Neural (Analysis Services – Mineração de Dados).
Consulta de exemplo 2: recuperando metadados de modelo do conjunto de linhas de esquema
Você pode encontrar as mesmas informações retornadas em uma consulta de conteúdo DMX consultando o conjunto de linhas do esquema de mineração de dados. No entanto, o conjunto de linhas de esquema fornece algumas colunas adicionais. A consulta de exemplo a seguir retorna a data em que o modelo foi criado, a data em que foi modificado e a data em que o modelo foi processado pela última vez. A consulta também retorna as colunas previsíveis, que não estão facilmente disponíveis no conteúdo do modelo e os parâmetros que foram usados para criar o modelo. Essas informações podem ser úteis para documentar o modelo.
SELECT MODEL_NAME, DATE_CREATED, LAST_PROCESSED, PREDICTION_ENTITY, MINING_PARAMETERS
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center Default NN'
Resultados do exemplo:
| MODEL_NAME | Call Center Padrão NN |
| DATE_CREATED | 1/10/2008 17:07:38 PM |
| Último_Processado | 1/10/2008 17:24:02 PM |
| PREDICTION_ENTITY | Tempo médio por questão Grau de serviço, Número de pedidos |
| PARÂMETROS_DE_MINERAÇÃO | HOLDOUT_PERCENTAGE=30, HOLDOUT_SEED=0, MAXIMUM_INPUT_ATTRIBUTES=255, MAXIMUM_OUTPUT_ATTRIBUTES=255, ESTADOS_MÁXIMOS=100, TAMANHO_AMOSTRA=10000, RAZÃO_NÓ_OCULTO=4 |
Consulta de exemplo 3: recuperando os atributos de entrada para o modelo
Você pode recuperar os pares atributo-valor de entrada que foram usados para criar o modelo consultando os nós filho (NODE_TYPE = 20) da camada de entrada (NODE_TYPE = 18). A consulta a seguir retorna uma lista de atributos de entrada das descrições dos nós.
SELECT NODE_DESCRIPTION
FROM [Call Center Default NN].CONTENT
WHERE NODE_TYPE = 2
Resultados do exemplo:
| NODE_DESCRIPTION |
|---|
| Tempo Médio por Problema=64,7094100096 - 77,4002099712 |
| Dia da Semana=Sexta. |
| Operadores de nível 1 |
Apenas algumas linhas representativas dos resultados são mostradas aqui. No entanto, você pode ver que o NODE_DESCRIPTION fornece informações ligeiramente diferentes, dependendo do tipo de dados do atributo de entrada.
Se o atributo for um valor discreto ou discretizado, o atributo e seu valor ou seu intervalo discretizado serão retornados.
Se o atributo for um tipo de dados numérico contínuo, o NODE_DESCRIPTION conterá apenas o nome do atributo. No entanto, você pode recuperar a tabela de NODE_DISTRIBUTION aninhada para obter a média ou retornar o NODE_RULE para obter os valores mínimo e máximo do intervalo numérico.
A consulta a seguir mostra como consultar a tabela de NODE_DISTRIBUTION aninhada para retornar os atributos em uma coluna e seus valores em outra coluna. Para atributos contínuos, o valor do atributo é representado por sua média.
SELECT FLATTENED
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE
FROM NODE_DISTRIBUTION) as t
FROM [Call Center Default NN -- Predict Service and Orders].CONTENT
WHERE NODE_TYPE = 21
Resultados do exemplo:
| t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE |
|---|---|
| Tempo médio por problema | 64.7094100096 - 77.4002099712 |
| Dia da Semana | Sex. |
| Operadores de nível 1 | 3.2962962962963 |
Os valores de intervalo mínimo e máximo são armazenados na coluna NODE_RULE e são representados como um fragmento XML, conforme mostrado no exemplo a seguir:
<NormContinuous field="Level 1 Operators">
<LinearNorm orig="2.83967303681711" norm="-1" />
<LinearNorm orig="3.75291955577548" norm="1" />
</NormContinuous>
Consulta de exemplo 4: recuperando pesos da camada oculta
O conteúdo do modelo de um modelo de rede neural é estruturado de uma maneira que facilita a recuperação de detalhes sobre qualquer nó na rede. Além disso, os números de identificação dos nós fornecem informações que ajudam você a identificar as relações entre os tipos de nó.
A consulta a seguir demonstra como recuperar os coeficientes armazenados em um nó específico da camada oculta. A camada oculta consiste em um nó organizador (NODE_TYPE = 19), que contém apenas metadados e vários nós filho (NODE_TYPE = 22), que contêm os coeficientes para as várias combinações de atributos e valores. Essa consulta retorna apenas os nós de coeficiente.
SELECT FLATTENED TOP 1 NODE_UNIQUE_NAME,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, VALUETYPE
FROM NODE_DISTRIBUTION) as t
FROM [Call Center Default NN -- Predict Service and Orders].CONTENT
WHERE NODE_TYPE = 22
AND [PARENT_UNIQUE_NAME] = '40000000200000000' FROM [Call Center Default NN].CONTENT
Resultados do exemplo:
| NOME_UNICO_DO_NÓ | t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE | t.VALUETYPE |
|---|---|---|---|
| 70000000200000000 | 6000000000000000a | -0.178616518 | 7 |
| 70000000200000000 | 6000000000000000b | -0.267561918 | 7 |
| 70000000200000000 | 6000000000000000c | 0.11069497 | 7 |
| 70000000200000000 | 6000000000000000d | 0.123757712 | 7 |
| 70000000200000000 | 6000000000000000e | 0.294565343 | 7 |
| 70000000200000000 | 6000000000000000f | 0.22245318 | 7 |
| 70000000200000000 | 0.188805045 | 7 |
Os resultados parciais mostrados aqui demonstram como o conteúdo do modelo de rede neural relaciona o nó oculto aos nós de entrada.
Os nomes exclusivos de nós na camada oculta sempre começam com 70000000.
Os nomes exclusivos de nós na camada de entrada sempre começam com 60000000.
Portanto, esses resultados informam que o nó denotado pelo ID 70000000200000000 tinha seis coeficientes diferentes (VALUETYPE = 7) atribuídos a ele. Os valores dos coeficientes estão na coluna ATTRIBUTE_VALUE. Você pode determinar exatamente a qual atributo de entrada o coeficiente corresponde usando o ID do nó na coluna ATTRIBUTE_NAME. Por exemplo, a ID do nó 6000000000000000a refere-se ao atributo de entrada e ao valor, Day of Week = 'Tue.' você pode usar a ID do nó para criar uma consulta ou navegar até o nó usando o Visualizador de Árvore de Conteúdo Genérico da Microsoft.
Da mesma forma, se você consultar a tabela NODE_DISTRIBUTION dos nós na camada de saída (NODE_TYPE = 23), poderá ver os coeficientes para cada valor de saída. No entanto, na camada de saída, os ponteiros fazem referência aos nós da camada oculta. Para obter mais informações, consulte Conteúdo do Modelo de Mineração para Modelos de Rede Neural (Analysis Services – Mineração de Dados).
Usando um modelo de rede neural para fazer previsões
O algoritmo de Rede Neural da Microsoft dá suporte à classificação e à regressão. Você pode usar funções de previsão com esses modelos para fornecer novos dados e criar previsões singleton ou em lote.
Consulta de exemplo 5: criando uma previsão singular
A maneira mais fácil de criar uma consulta de previsão em um modelo de rede neural é usar o Construtor de Consultas de Previsão, disponível na guia Previsão de Mineração do Designer de Mineração de Dados no SQL Server Management Studio e no SSDT (SQL Server Data Tools). Você pode procurar o modelo no Visualizador de Rede Neural da Microsoft para filtrar atributos de interesse e tendências de exibição e, em seguida, alternar para a guia Previsão de Mineração para criar uma consulta e prever novos valores para essas tendências.
Por exemplo, você pode procurar o modelo de call center para exibir correlações entre os volumes de pedidos e outros atributos. Para fazer isso, abra o modelo no visualizador e, para Entrada, selecione <Tudo>. Em seguida, para Saída, selecione Número de Pedidos. Para o Valor 1, selecione o intervalo que representa a maioria dos pedidos e, para o Valor 2, selecione o intervalo que representa o menor número de pedidos. Em seguida, você pode ver rapidamente todos os atributos que o modelo correlaciona com o volume de pedidos.
Ao navegar pelos resultados no visualizador, você descobre que determinados dias da semana têm volumes de pedidos baixos e que um aumento no número de operadores parece estar correlacionado com vendas mais altas. Em seguida, você pode usar uma consulta de previsão no modelo para testar uma hipótese de "e se" e perguntar se aumentar o número de operadores de nível 2 em um dia de baixo volume aumentaria os pedidos. Para fazer isso, crie uma consulta como a seguinte:
SELECT Predict([Call Center Default NN].[Number of Orders]) AS [Predicted Orders],
PredictProbability([Call Center Default NN].[Number of Orders]) AS [Probability]
FROM [Call Center Default NN]
NATURAL PREDICTION JOIN
(SELECT 'Tue.' AS [Day of Week],
13 AS [Level 2 Operators]) AS t
Resultados do exemplo:
| Ordens previstas | Probabilidade |
|---|---|
| 364 | 0.9532... |
O volume de vendas previsto é maior do que o intervalo atual de vendas para terça-feira, e a probabilidade da previsão é muito alta. No entanto, talvez você queira criar várias previsões usando um processo em lote para testar uma variedade de hipóteses no modelo.
Observação
Os assistentes de regressão logística da Mineração de Dados Add-Ins do Excel 2007 facilitam responder a perguntas complexas, como quantos Operadores de Nível Dois seriam necessários para melhorar a qualidade do serviço a um nível-alvo para um turno específico. Os suplementos de mineração de dados são um download gratuito e incluem assistentes baseados na rede neural e/ou algoritmos de regressão logística. Para obter mais informações, consulte o site Suplementos de Mineração de Dados para Office 2007.
Lista de funções de previsão
Todos os algoritmos da Microsoft dão suporte a um conjunto comum de funções. Não há funções de previsão específicas para o algoritmo de Rede Neural da Microsoft; no entanto, o algoritmo dá suporte às funções listadas na tabela a seguir.
| Função de previsão | Uso |
| IsDescendant (DMX) | Determina se um nó é filho de outro nó no grafo de rede neural. |
| PredictAdjustedProbability (DMX) | Retorna a probabilidade ponderada. |
| PredictHistogram (DMX) | Retorna uma tabela de valores relacionada ao valor previsto atual. |
| PredictVariance (DMX) | Retorna a variância para o valor previsto. |
| PredictProbability (DMX) | Retorna a probabilidade para o valor previsto. |
| PredictStdev (DMX) | Retorna o desvio padrão para o valor previsto. |
| PredictSupport (DMX) | Para modelos de regressão logística e de rede neural, retorna um único valor que representa o tamanho do conjunto de treinamento para todo o modelo. |
Para obter a sintaxe de funções específicas, consulte Referência de função DMX (Extensões de Mineração de Dados).
Consulte Também
Algoritmo de rede neural da Microsoft
Referência técnica do algoritmo de rede neural da Microsoft
Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de dados)
Lição 5: Criando modelos de regressão logística e de rede neural (Tutorial de mineração de dados intermediário)