Partilhar via


Sinalizadores de modelagem (mineração de dados)

Você pode usar sinalizadores de modelagem no SQL Server Analysis Services para fornecer informações adicionais a um algoritmo de mineração de dados sobre os dados definidos em uma tabela de casos. O algoritmo pode usar essas informações para criar um modelo de mineração de dados mais preciso.

Alguns sinalizadores de modelagem são definidos no nível da estrutura de mineração, enquanto outros são definidos no nível da coluna do modelo de mineração. Por exemplo, o NOT NULL sinalizador de modelagem é usado com colunas de estrutura de mineração. Você pode definir sinalizadores de modelagem adicionais nas colunas do modelo de mineração, dependendo do algoritmo usado para criar o modelo.

Observação

Plug-ins de terceiros podem ter outros sinalizadores de modelagem, além daqueles predefinidos pelo Analysis Services.

Lista de sinalizadores de modelagem

A lista a seguir descreve os sinalizadores de modelagem com suporte no Analysis Services. Para obter informações sobre sinalizadores de modelagem compatíveis com algoritmos específicos, consulte o tópico de referência técnica do algoritmo que foi usado para criar o modelo.

NOT NULL
Indica que os valores da coluna de atributo nunca devem conter um valor nulo. Ocorrerá um erro se o Analysis Services encontrar um valor nulo para essa coluna de atributo durante o processo de treinamento do modelo.

MODEL_EXISTENCE_ONLY
Indica que a coluna será tratada como tendo dois estados: Missing e Existing. Se o valor for NULL, ele será tratado como Ausente. O sinalizador MODEL_EXISTENCE_ONLY é aplicado ao atributo previsível e tem suporte da maioria dos algoritmos.

Na verdade, definir o sinalizador MODEL_EXISTENCE_ONLY para True alterar a representação dos valores de modo que haja apenas dois estados: Missing e Existing. Todos os estados não ausentes são combinados em um único Existing valor.

Um uso típico para esse sinalizador de modelagem seria em atributos para os quais o NULL estado tem um significado implícito, e o valor explícito do NOT NULL estado pode não ser tão importante quanto o fato de que a coluna tem qualquer valor. Por exemplo, uma coluna [DateContractSigned] pode ser NULL se um contrato nunca foi assinado e NOT NULL se o contrato foi assinado. Portanto, se a finalidade do modelo for prever se um contrato será assinado, você pode usar o sinalizador MODEL_EXISTENCE_ONLY para ignorar o valor exato da data nos casos em NOT NULL e distinguir somente entre os casos em que um contrato é Missing ou Existing.

Observação

"Ausente" é um estado especial usado pelo algoritmo e difere do valor literal "Ausente" em uma coluna. Para obter mais informações, consulte Valores Ausentes (Analysis Services – Mineração de Dados).

REGRESSOR
Indica que a coluna é uma candidata a ser usada como um regressor durante o processamento. Esse sinalizador é definido em uma coluna de modelo de mineração e só pode ser aplicado a colunas que têm um tipo de dados numérico contínuo. Para obter mais informações sobre o uso desse sinalizador, consulte a seção neste tópico, Usos do Sinalizador de Modelagem REGRESSOR.

Exibindo e alterando marcadores de modelagem

Você pode exibir os sinalizadores de modelagem associados a uma coluna de estrutura de mineração ou coluna de modelo no Designer de Mineração de Dados exibindo as propriedades da estrutura ou modelo.

Para determinar quais sinalizadores de modelagem foram aplicados à estrutura de mineração atual, você pode criar uma consulta no conjunto de linhas do esquema de mineração de dados que retorna os sinalizadores de modelagem apenas para as colunas de estrutura usando uma consulta como a seguinte:

SELECT COLUMN_NAME, MODELING_FLAG  
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS  
WHERE STRUCTURE_NAME = '<structure name>'  

Você pode adicionar ou alterar os sinalizadores de modelagem usados em um modelo usando o Designer de Mineração de Dados e editando as propriedades das colunas associadas. Essas alterações exigem que a estrutura ou o modelo seja reprocessado.

Você pode especificar sinalizadores de modelagem em uma nova estrutura de mineração ou modelo de mineração usando DMX ou usando scripts AMO ou XMLA. No entanto, você não pode alterar os sinalizadores de modelagem usados em um modelo e estrutura de mineração existentes usando DMX. Você deve criar um novo modelo de mineração usando a sintaxe. ALTER MINING STRUCTURE....ADD MINING MODEL

Usos do indicador de modelagem REGRESSOR

Ao definir o sinalizador de modelagem REGRESSOR em uma coluna, você está indicando para o algoritmo que a coluna contém potenciais regressores. Os regressores reais usados no modelo são determinados pelo algoritmo. Um regressor potencial poderá ser descartado se não modelar o atributo previsível.

Quando você cria um modelo usando o assistente de Mineração de Dados, todas as colunas de entrada contínuas são sinalizadas como regressores possíveis. Portanto, mesmo que você não defina explicitamente o sinalizador REGRESSOR em uma coluna, a coluna poderá ser usada como um regressor no modelo.

Você pode determinar os regressores que foram realmente usados no modelo processado executando uma consulta no conjunto de linhas de esquema para o modelo de mineração, conforme mostrado no exemplo a seguir:

SELECT COLUMN_NAME, MODELING_FLAG  
FROM $system.DMSCHEMA_MINING_COLUMNS  
WHERE MODEL_NAME = '<model name>'  

Nota Se você modificar um modelo de mineração e alterar o tipo de conteúdo de uma coluna de contínua para discreta, deverá alterar manualmente o sinalizador na coluna de mineração e, em seguida, reprocessar o modelo.

Regressores em modelos de regressão linear

Os modelos de regressão linear baseiam-se no algoritmo Árvores de Decisão da Microsoft. Mesmo que você não use o algoritmo regressão linear da Microsoft, qualquer modelo de árvore de decisão poderá conter uma árvore ou nós que representem uma regressão em um atributo contínuo.

Portanto, nesses modelos você não precisa especificar que uma coluna contínua represente um regressor. O algoritmo Árvores de Decisão da Microsoft particionará o conjunto de dados em regiões com padrões significativos, mesmo se você não definir o sinalizador REGRESSOR na coluna. A diferença é que, quando você define o sinalizador de modelagem, o algoritmo tentará encontrar equações de regressão da seguinte forma para encaixar os padrões nos nós da árvore.

a*C1 + b*C2 + ...

Em seguida, a soma dos resíduos é calculada e, se o desvio for muito grande, uma divisão será forçada na árvore.

Por exemplo, se você estiver prevendo o comportamento de compra do cliente usando Income como um atributo e definir o sinalizador REGRESSOR de modelagem na coluna, o algoritmo primeiro tentará ajustar os valores de Income usando uma fórmula de regressão padrão. Se o desvio for muito grande, a fórmula de regressão será abandonada e a árvore será dividida em algum outro atributo. O algoritmo de árvore de decisão tentaria ajustar um regressor para obter renda em cada uma das ramificações após a divisão.

Você pode usar o parâmetro FORCE_REGRESSOR para garantir que o algoritmo usará um regressor específico. Esse parâmetro pode ser usado com o algoritmo Árvores de Decisão e o algoritmo regressão linear.

Use os links a seguir para saber mais sobre como usar sinalizadores de modelagem.

Tarefa Tópico
Editar sinalizadores de modelagem usando o Designer de Mineração de Dados Exibir ou alterar sinalizadores de modelagem (mineração de dados)
Especificar uma dica para o algoritmo para recomendar regressores prováveis Especificar uma coluna a ser usada como regressor em um modelo
Consulte os sinalizadores de modelagem compatíveis com algoritmos específicos (na seção Sinalizadores de Modelagem para cada tópico de referência de algoritmo) Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)
Saiba mais sobre as colunas da estrutura de mineração e as propriedades que você pode definir nelas Colunas da estrutura de mineração
Saiba mais sobre colunas de modelo de mineração e sinalizadores de modelagem que podem ser aplicados no nível do modelo Colunas de modelo de mineração
Confira a sintaxe para trabalhar com sinalizadores de modelagem em instruções DMX Sinalizadores de modelagem (DMX)
Entender os valores ausentes e como trabalhar com eles Valores ausentes (Analysis Services – Mineração de Dados)
Saiba mais sobre como gerenciar modelos e estruturas e definir propriedades de uso Movendo objetos de mineração de dados