Requisitos e considerações de processamento (mineração de dados)

2023-12-23

Aplica-se a: SQL Server 2019 e anteriores do Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

A mineração de dados foi preterida no SQL Server 2017 Analysis Services e agora foi descontinuada no SQL Server 2022 Analysis Services. A documentação não foi atualizada para recursos preteridos e descontinuados. Para saber mais, confira Compatibilidade com versões anteriores do Analysis Services.

Este tópico descreve algumas considerações técnicas para lembrar ao processar objetos de mineração de dados. Para obter uma explicação geral do que é processamento e como isso se aplica à mineração de dados, consulte Processando objetos de Data Mining.

Consultas em repositório relacional

Processando estruturas de mineração

Processando modelos de mineração

Consultas no repositório relacional durante o processamento

Para a mineração de dados, o processamento tem três fases: consultar a fonte de dados, determinar estatísticas brutas e usar a definição e o algoritmo do modelo para treinar o modelo de mineração.

O servidor SQL Server Analysis Services emite consultas ao banco de dados que fornece os dados brutos. Esse banco de dados pode ser uma instância do SQL Server 2017 ou uma versão anterior do mecanismo de banco de dados SQL Server. Quando você processa uma estrutura de mineração de dados, os dados da fonte são transferidos para a estrutura de mineração e mantidos no disco em um novo formato compactado. Nem todas as colunas da fonte de dados são processadas; apenas as colunas incluídas na estrutura de mineração, de acordo com as associações.

Usando esses dados, SQL Server Analysis Services cria um índice de todos os dados e colunas discretas e cria um índice separado para colunas contínuas. É emitida uma consulta para cada tabela aninhada a fim de criar o índice, e uma consulta adicional por tabela aninhada é gerada para processar relações entre cada par de tabela aninhada e de tabela de casos. O motivo para a criação de várias consultas é processar um repositório de dados multidimensional interno especial. Você pode limitar o número de consultas que SQL Server Analysis Services envia ao repositório relacional definindo a propriedade do servidor, DatabaseConnectionPoolMax. Para obter mais informações, consulte Propriedades OLAP.

Quando você processa um modelo, ele não relê os dados da fonte de dados. Em vez disso, ele obtém o resumo dos dados da estrutura de mineração. Com o uso do cubo criado, junto com o cache do índice e os dados de caso em cache, o servidor cria threads independentes para treinar os modelos.

Para obter mais informações sobre as edições de SQL Server que dão suporte ao Processamento de Modelo Paralelo, consulte Recursos compatíveis com as edições do SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473).

Processando estruturas de mineração

Uma estrutura de mineração pode ser processada junto com todos os modelos dependentes, ou separadamente. Processar uma estrutura de mineração separadamente de modelos pode ser útil quando é esperado que alguns modelos levem muito tempo para processar e você deseja adiar essa operação.

Para obter mais informações, consulte Processar uma estrutura de mineração.

Se você estiver preocupado em conservar espaço em disco rígido, observe que SQL Server Analysis Services retém caches de estrutura de mineração localmente. Ou seja, ela grava todos os dados de treinamento no seu disco rígido local. Se não quiser que seus dados sejam armazenados em cache, poderá alterar o padrão configurando a propriedade MiningStructureCacheMode na estrutura de mineração como ClearAfterProcessing. Isso destruirá o cache após o processamento dos modelos. No entanto, também desabilitará a análise na estrutura de mineração. Para obter mais informações, consulte Consultas de detalhamento (mineração de dados).

Além disso, se limpar o cache, não poderá usar o conjunto de testes de validação, se houver definido um, e a definição da partição do conjunto de testes será perdida. Para obter mais informações sobre conjuntos de testes de espera, consulte Conjuntos de Dados de Treinamento e Teste.

Processando os modelos de mineração

Você pode processar um modelo de mineração separadamente de sua estrutura de mineração associada ou pode processar todos os modelos que estão baseados na estrutura, junto com a estrutura.

Para obter mais informações, consulte Processar um modelo de mineração.

No entanto, em SQL Server Data Tools e SQL Server Management Studio, não é possível selecionar modelos de mineração multissessão para processar com a estrutura. Se você precisar controlar quais modelos são processados, terá que selecioná-los individualmente ou usar XMLA ou DMX para processar modelos em série.

Quando o reprocessamento é necessário

Você deve processar os modelos de SQL Server Analysis Services que você define antes de começar a trabalhar com eles. Também deve processar novamente os modelos de mineração sempre que mudar a estrutura do modelo de mineração, atualizar os dados de treinamento, alterar um modelo de mineração existente ou adicionar um novo modelo de mineração à estrutura.

Os modelos de mineração também são processados nestes cenários:

Implantação de um projeto: dependendo das configurações do projeto e do estado atual do projeto, os modelos de mineração no projeto são geralmente processados completamente quando o projeto é implantado.

Quando você inicia a implantação, o processamento é iniciado automaticamente, a menos que haja uma versão processada anteriormente no servidor SQL Server Analysis Services e não tenha havido alterações estruturais. É possível implantar um projeto selecionando Implantar solução na lista suspensa ou pressionando a tecla F5. É possível

Para obter mais informações sobre como definir SQL Server Analysis Services propriedades de implantação que controlam como os modelos de mineração são implantados, consulte Implantação de soluções de mineração de dados.

Movendo um modelo de mineração: quando você move um modelo de mineração usando o comando EXPORT, somente a definição do modelo é exportada, incluindo o nome da estrutura de mineração que é esperada que forneça dados ao modelo.

Reprocessando requisitos para os cenários a seguir usando os comandos EXPORT e IMPORT:

A estrutura de mineração existe na instância de destino e a estrutura de mineração está em um estado não processado.

A estrutura e o modelo devem ser reprocessados.
A estrutura de mineração existe na instância de destino e a estrutura de mineração foi processada. Somente o modelo de mineração foi exportado.

O modelo pode ser usado sem processamento.
A definição de estrutura de mineração também foi exportada usando a palavra-chave WITH DEPENDENCIES.

A estrutura e o modelo devem ser reprocessados.

Para obter mais informações, consulte Exportar e importar objetos de Data Mining.

Consulte Também

Estruturas de mineração (Analysis Services – Mineração de dados)
Estruturas de mineração (Analysis Services – Mineração de dados)
Processando um modelo multidimensional (Analysis Services)

Partilhar via

Requisitos e considerações de processamento (mineração de dados)

Consultas no repositório relacional durante o processamento

Processando estruturas de mineração

Processando os modelos de mineração

Quando o reprocessamento é necessário

Consulte Também

Comentários

Recursos adicionais