Udostępnij za pośrednictwem


Zagnieżdżone tabele (Analysis Services - wyszukiwania danych)

In SQL Server Usługi Analysis Services, data must be fed to a data mining algorithm as a series of cases that are contained within a case table.Jednak nie wszystkie przypadki może być opisany przez pojedynczy wiersz danych.Na przykład przypadek może pochodzić z dwóch tabel: tabela zawierającą informacje o nabywcy i inną tabela, która zawiera zakupów nabywcy.A single customer in the customer information table might have multiple items in the customer purchases table, which makes it difficult to describe the data by using a single row.Usługi Analysis Services provides a unique method for handling these cases, by using nested tables.Pojęcie tabela zagnieżdżonej jest wykazane na poniższej ilustracji.

Dwie tabele połączone przy użyciu tabeli zagnieżdżonej

W tym diagramie pierwsza tabela jest tabelą nadrzędną, zawiera informacje o klientach i kojarzy identyfikator unikatowy dla każdego odbiorcy.Druga tabela podrzędność table, zawiera zakupów dla każdego odbiorcy.Zakupy w podrzędność tabela powiązanych z tabela nadrzędnej przez identyfikator unikatowy CustomerKey kolumna.Trzecia tabela w diagramie przedstawiono dwie tabele połączone.

Zagnieżdżona tabela jest reprezentowany przypadek tabeli specjalnej kolumna, która ma typ danych tabeli.Dla konkretnego wiersza przypadków tego rodzaju kolumna zawiera wybrane wiersze z podrzędność tabela, które odnoszą się do tabela nadrzędnej.

Dane w tabela zagnieżdżonej można dla przewidywanie lub wprowadzania lub obu.Na przykład może mieć dwie kolumny tabela zagnieżdżonej w modelu: Prawdopodobnie jedna kolumna tabela zagnieżdżonej może zawierać listę produktów, które nabyła klienta, podczas gdy inne kolumny tabela zagnieżdżonej zawiera informacje o nabywcy hobby i zainteresowaniach, uzyskane z badania.W tym scenariuszu można użyć hobby i zainteresowaniach nabywcy jako dane wejściowe dla analizy zakupów zachowanie i przewidywaniu prawdopodobnego zakupów.

Łączenie tabel sprawy i tabel zagnieżdżonych

W celu utworzenia tabela zagnieżdżonej, źródło dwóch tabel musi zawierać zdefiniowanej relacji tak, aby elementy w jednej tabela może być powiązane z inną tabelą.W Business Intelligence Development Studio, można określić tę relację w widok źródło danych.Aby uzyskać więcej informacji na temat sposobu definiowania relacji między dwiema tabelami, zobacz Jak Dodawanie, usuwanie widoku lub modyfikowanie relacji logicznych przy użyciu projektanta widoku źródła danych (Analysis Services).

Ostrzeżenie

CustomerKey pole jest relacyjna klucz, który jest używany do łączenia tabeli przypadek i tabela zagnieżdżona wewnątrz definicji widok źródło danych oraz do ustanowienia relacji kolumny w struktura wyszukiwania.Jednak zwykle nie należy używać tego klucz relacyjnej w modelach górnictwa, oparte na tej struktury.Zazwyczaj najlepiej pominąć relacyjnej kolumna klucz z model wyszukiwania Jeśli służy tylko do łączyć, a nie dostarcza informacji, które są interesujące dla analizy.

Można tworzyć tabele zagnieżdżone programowo przez albo przy użyciu danych górnictwa rozszerzenia (DMX) lub Analysis Management Objects (AMO) lub można użyć Kreatora wyszukiwania danych i projektanta wyszukiwania danych w Business Intelligence Development Studio.

Aby uzyskać więcej informacji: Projektant wyszukiwania danych, Kreator wyszukiwania danych (Analysis Services - wyszukiwania danych), UTWÓRZ MODEL GÓRNICTWA (DMX), TWORZENIE STRUKTURY GÓRNICTWA (DMX)

Za pomocą kolumny tabeli zagnieżdżonej w modelu górnictwo

przypadek tabela klucz jest często identyfikator klienta, nazwa produktu lub data w serii: dane, które jednoznacznie identyfikuje wiersz w tabela..However, in nested tables, the key is typically not the relational key (or foreign key) but rather the column that represents the attribute that you are modeling.

Na przykład jeśli zawiera przypadek tabela zamówienia i tabela zagnieżdżonej zawiera elementy w kolejności, mogłyby Cię zainteresować modelowania relacji między elementy przechowywane w tabela zagnieżdżonej w wielu zamówień, które są przechowywane przypadek tabela.Dlatego chociaż elementów tabela zagnieżdżonej jest przyłączony do zamówień tabela przypadek przez klucz relacyjnej IDZamówienia, nie należy używać IDZamówienia jako klucz tabela zagnieżdżonej.Zamiast tego należy zaznaczyć elementów kolumny jako tabela zagnieżdżoną klucz, ponieważ kolumna zawiera dane, które chcesz modelować.W większości przypadków można bezpiecznie zignorować IDZamówienia w model wyszukiwania, ponieważ relacji między tabelą przypadek i tabela zagnieżdżonej jest już ustanowione przez definicję widok źródło danych.

Po wybraniu kolumna jako klucz tabela zagnieżdżonej należy się upewnić, że wartości w tej kolumnie są unikatowe dla każdego przypadek.Na przykład przypadek tabeli reprezentuje klientów, a tabela zagnieżdżona przedmiotów zakupionych przez klienta, należy się upewnić że żaden element znajduje się więcej niż jeden czas na klienta.Jeśli klient nabyła takie same więcej niż jeden element czas, warto utworzyć inny widok zawierający kolumna, agregujący licznik zakupów dla każdego produktu unikatowy.

Jak zdecydować obsługiwać zduplikowane wartości w tabela zagnieżdżonej zależy od model wyszukiwania tworzonej i są rozwiązywania problemu biznesowego.W niektórych scenariuszach może nie opieki jak wiele razy odbiorca nabyła określonego produktu, ale chcesz sprawdzić, czy istnieje przynajmniej jeden zakupu.W innych scenariuszach może być bardzo ważne ilości i sekwencji zakupów.

Jeśli ważna jest kolejność elementów, może być konieczne dodatkowe kolumna, która wskazuje sekwencję.Podczas tworzenia modelu za pomocą sekwencji klastrowanie algorytm należy wybrać dodatkowe klucz sekwencji kolumna reprezentują kolejność elementów.kolumna sekwencja klawiszy jest specjalnym rodzajem zagnieżdżonych klucz, który jest używany tylko w sekwencji klastrowanie modeli i wymaga unikatowe dane typu numerycznego.Na przykład, dat i liczb całkowitych zarówno można jako klucz kolejność kolumn, ale wszystkie wartości sekwencji musi być unikatowa.Oprócz kolumna sekwencja klawiszy sekwencji klastrowanie model ma także klucz tabela zagnieżdżonej, reprezentujący atrybut, który jest jest modelowana, takich jak produkty, które zostały zakupione.

Przy użyciu klucza nie zagnieżdżone kolumn z tabeli zagnieżdżonej

Po zdefiniowaniu łączyć między tabelą przypadek i tabela zagnieżdżonej i wybrano kolumna, która zawiera atrybuty interesujące i unikatowe jako klucz tabela zagnieżdżonej, może zawierać innych kolumn z tabela zagnieżdżonej jako dane wejściowe do modelu.Wszystkie kolumny z tabela zagnieżdżonej można input, przewidywanie i input lub tylko przewidywanie.

Na przykład, jeśli tabela zagnieżdżona zawiera kolumny produktu, ProductQuantity, i ProductPrice, można wybrać produktu jako klucz tabeli zagnieżdżonej, ale Dodaj ProductQuantity do struktura wyszukiwania jako danych wejściowych.

Filtrowanie danych tabeli zagnieżdżonej

W SQL Server 2008, na dane używane do szkolić lub testowania danych można tworzyć filtry model wyszukiwania.Polecenia filer można wpływać na skład modelu lub badanie modelu podzbiór spraw.Filtry można stosować także do tabel zagnieżdżonych.Jednak istnieją ograniczenia dotyczące składni, która może być używana z tabel zagnieżdżonych.

Często po zastosowaniu filtru do tabela zagnieżdżonej są badania na występowanie lub Brak atrybut.Na przykład można zastosować filtr, który ogranicza przypadkach używane w modelu do tych przypadków, które mają określoną wartość w tabela zagnieżdżonej.Lub mogą ograniczać przypadkach używane w modelu do klientów, którzy nie zakupiono określonego element.

Po utworzeniu filtrów w tabela zagnieżdżonej można również użyć operatorów takich jak większa lub mniejsza niż.Na przykład, można ograniczyć przypadkach używane w modelu do klientów, którzy nabywany co najmniej n jednostek produktu miejsce docelowe.Możliwość filtrowania atrybutów tabela zagnieżdżonej zapewnia elastyczność dostosowywania modeli.

Aby uzyskać więcej informacji na temat tworzenia i używania filtrów modelu, zobacz Tworzenie filtrów dla modeli wyszukiwania (Analysis Services - wyszukiwania danych).