Compartilhar via


Adicionando uma exibição da fonte de dados com tabelas aninhadas (Tutorial de mineração de dados intermediário)

Para criar o modelo de mineração que será usado para a análise da cesta de mercado, você deve criar uma nova exibição da fonte de dados. Essa fonte de dados também será usada para o cenário de clustering de seqüências.

Esta exibição da fonte de dados é diferente de outras com as quais você talvez tenha trabalhado porque contém uma tabela aninhada. Uma tabela aninhada é uma tabela que contém várias linhas de informações sobre uma única linha da tabela de casos. Por exemplo, se o seu modelo analisasse o comportamento de compra de clientes, normalmente você usaria uma tabela com uma linha exclusiva para cada cliente como a tabela de casos. No entanto, cada cliente pode fazer várias compras e talvez você queira analisar a seqüência de compras ou os produtos comprados juntos com freqüência. Para representar logicamente essas compras no modelo, adicione outra tabela à exibição da fonte de dados que lista as compras para cada cliente. Essa tabela de compras aninhada tem um relacionamento muitos para um com a tabela do cliente. A tabela aninhada pode conter várias linhas para cada cliente, cada linha com um único produto comprado, talvez com informações adicionais sobre o pedido em que as compras foram feitas, o preço no momento do pedido ou qualquer promoção aplicável. Você pode usar as informações da tabela aninhada como entradas par ao modelo ou como o atributo previsível.

Nesta lição, você adicionará uma nova exibição à fonte de dados AdventureWorksDW2008, adicionará o caso e as tabelas aninhadas a ela e especificará a relação muitos para um entre o caso e a tabela aninhada. Há duas partes nesse processo:

  • Primeiro, você define o relacionamento entre a tabela de casos e a tabela aninhada.

  • Segundo, define como as colunas de dados serão usadas no modelo.

É importante especificar corretamente a relação entre a tabela de casos e a tabela aninhada, para evitar erros ao processar o modelo. Para obter mais informações sobre como trabalhar com tabelas aninhadas e de casos e sobre como escolher uma chave de tabela aninhada, consulte Tabelas aninhadas (Analysis Services - Mineração de Dados).

Para adicionar uma exibição da fonte de dados

  1. No Gerenciador de Soluções, clique com o botão direito do mouse em Exibições da Fonte de Dados e selecione Nova Exibição da Fonte de Dados.

    O Assistente de Exibição da Fonte de Dados é exibido.

  2. Na página Bem-vindo ao Assistente de Exibição da Fonte de Dados, clique em Avançar.

  3. Na página Selecionar uma Fonte de Dados, em Fontes de dados relacionais selecione a fonte de dados Adventure Works DW2008, criada no Tutorial de mineração de dados básico. Clique em Avançar.

  4. Na página Selecionar Tabelas e Exibições, selecione as tabelas a seguir e clique na seta para a direita a fim de incluí-las na nova exibição da fonte de dados:

    • vAssocSeqOrders

    • vAssocSeqLineItems

  5. Clique em Avançar.

  6. Por padrão, na página Concluindo o Assistente a exibição da fonte de dados é chamada de Adventure Works DW2008. Mude-a para Pedidos e clique em Concluir.

    O Designer de Exibição da Fonte de Dados será aberto para mostrar a exibição da fonte de dados Pedidos.

Para criar uma nova relação entre tabelas

  1. No Designer da Exibição da Fonte de Dados, posicione as duas tabelas para que elas se alinhem horizontalmente, com a tabela vAssocSeqLineItems no lado esquerdo e a tabela vAssocSeqOrders no lado direito.

  2. Selecione a coluna OrderNumber na tabela vAssocSeqLineItems.

  3. Arraste a coluna para a tabela vAssocSeqOrders e coloque-a na coluna OrderNumber.

    Observação importanteImportante

    Certifique-se de estar arrastando a coluna OrderNumber da tabela aninhada vAssocSeqLineItems, que representa os vários lados da junção, para a tabela de casos vAssocSeqOrders, que representa um lado da junção.

    Agora existe uma nova relação muitos para um entre as tabelas vAssocSeqLineItems e vAssocSeqOrders. Se você uniu as tabelas corretamente, a exibição da fonte de dados deverá ser parecida com esta:

    esperada junção muitos-para-um em tabelas aninhadas e de caso