Partilhar via


Lição 5: Automatizando a limpeza e a correspondência usando o SSIS

Na Lição 1, você criou a base de conhecimento de fornecedores e a usou para limpar dados na Lição 2 e fazer correspondência de dados na Lição 3 com a ferramenta DQS Client. Em um cenário do mundo real, talvez seja necessário extrair dados de uma fonte que o DQS não dá suporte ou automatizar o processo de limpeza e correspondência sem precisar usar a ferramenta Cliente DQS. O SSIS (SQL Server Integration Services) tem componentes que você pode usar para integrar dados de várias fontes heterogêneas e um componente DQS Cleansing Transform para invocar a funcionalidade de limpeza exposta pelo DQS. Atualmente, o DQS não expõe a funcionalidade correspondente para uso do SSIS, mas você pode usar a Transformação de Agrupamento Difuso para identificar duplicatas nos dados.

Você pode carregar dados no MDS usando a funcionalidade de preparação baseada em entidade. Quando você cria uma entidade no MDS, as tabelas de preparo correspondentes e os procedimentos armazenados são criados automaticamente. Por exemplo, quando você criou a entidade Fornecedor, a tabela stg.supplier_Leaf e o procedimento armazenado stg.udp_Supplier_Leaf foram criados automaticamente. Você usa as tabelas de estágio e os procedimentos para criar, atualizar e excluir membros da entidade. Nesta lição, você criará novos membros de entidade para a Entidade fornecedora. Para carregar dados no servidor MDS, o pacote SSIS primeiro carrega os dados na tabela de preparo stg.supplier_Leaf e, em seguida, dispara o procedimento armazenado associado stg.udp_Supplier_Leaf. Consulte Importar Dados para obter mais detalhes.

Nesta lição, você executará as seguintes tarefas:

  1. Remova os dados do fornecedor no MDS (se você já passou por quatro lições anteriores). O pacote SSIS que você cria nesta lição carrega os dados no MDS automaticamente. Anteriormente, você carregou os dados do fornecedor limpos e correspondentes ao servidor MDS manualmente usando o cliente DQS.

  2. Crie uma exibição de assinatura na entidade Supplier para expor dados na entidade a outros aplicativos. Essa ação cria uma exibição SQL que você verificará usando o SQL Server Management Studio. Você não consumirá essa exibição nesta versão do tutorial.

  3. Crie e execute um projeto do SSIS usando o SQL Server Data Tools. O projeto usa a transformação Limpeza de Dados para enviar uma solicitação de limpeza para o servidor DQS. O DQS ainda não expõe a funcionalidade correspondente, portanto, você usará a transformação Agrupamento Difuso para identificar duplicatas.

  4. Verifique se os dados são criados no MDS usando o Master Data Manger.

  5. Examine os resultados do projeto de limpeza do DQS criado pelo pacote SSIS e, opcionalmente, execute a limpeza interativa para criar ainda mais a base de dados de conhecimento.

Próxima Etapa

Tarefa 1 (Pré-requisito): Remoção de dados do fornecedor no MDS