Struktury datového dolování (Analysis Services - Dolování dat)

Platí pro: SQL Server 2019 a starší služby Analysis Services Azure Analysis Services Fabric/ Power BI Premium

Důležité

Dolování dat bylo v SQL Serveru 2017 Analysis Services zastaralé a nyní ukončeno ve službě SQL Server 2022 Analysis Services. Dokumentace se neaktualizuje pro zastaralé a ukončené funkce. Další informace najdete v tématu Zpětná kompatibilita služby Analysis Services.

Struktura těžby dat definuje data, ze kterých jsou vytvořeny modely těžby dat: určuje zobrazení zdrojových dat, počet a typ sloupců a volitelné rozdělení na trénovací a testovací sady. Jedna struktura dolování může podporovat více těžebních modelů, které sdílejí stejnou doménu. Následující diagram znázorňuje vztah struktury dolování dat ke zdroji dat a k základním modelům dolování dat.

Zpracování dat: zdroj ke struktuře do modelu

Struktura dolování v diagramu je založená na zdroji dat, který obsahuje více tabulek nebo zobrazení spojených s polem CustomerID. Jedna tabulka obsahuje informace o zákaznících, například o zeměpisné oblasti, věku, příjmu a pohlaví, zatímco související vnořená tabulka obsahuje několik řádků dalších informací o jednotlivých zákaznících, jako jsou produkty, které zákazník zakoupil. Diagram znázorňuje, že na jedné těžební struktuře lze vytvořit více modelů, a že modely mohou používat různé sloupce ze struktury.

Model 1 Používá ID zákazníka, příjem, věk, oblast a filtruje data v oblasti.

Model 2 Používá ID zákazníka, příjem, věk, oblast a filtruje data podle věku.

Model 3 Používá ID zákazníka, věk, pohlaví a vnořenou tabulku bez filtru.

Vzhledem k tomu, že modely používají pro vstup různé sloupce a vzhledem k tomu, že dva modely navíc omezují data použitá v modelu použitím filtru, můžou mít modely velmi odlišné výsledky, i když jsou založené na stejných datech. Všimněte si, že sloupec CustomerID se vyžaduje ve všech modelech, protože se jedná o jediný dostupný sloupec, který lze použít jako klíč případu.

Tato část vysvětluje základní architekturu struktur dolování dat: jak definujete strukturu dolování, jak ji naplníte daty a jak ji používáte k vytváření modelů. Další informace o správě nebo exportu existujících struktur dolování dat naleznete v tématu Správa řešení a objektů dolování dat.

Definování struktury dolování

Nastavení struktury dolování dat zahrnuje následující kroky:

Definujte zdroj dat.
Vyberte sloupce dat, které se mají zahrnout do struktury (ne všechny sloupce musí být přidány do modelu) a definování klíče.
Definujte klíč pro strukturu, včetně klíče pro nejlepší tabulku( pokud je to možné).
Určete, jestli mají být zdrojová data oddělená do trénovací sady a testovací sady. Tento krok je volitelný.
Zpracování struktury

Tyto kroky jsou podrobněji popsány v následujících částech.

Zdroje dat pro dolování struktur

Při definování struktury dolování použijete sloupce, které jsou k dispozici v existujícím zobrazení zdroje dat. Zobrazení zdroje dat je sdílený objekt, který umožňuje kombinovat více zdrojů dat a používat je jako jeden zdroj. Původní zdroje dat nejsou viditelné pro klientské aplikace a pomocí vlastností zobrazení zdroje dat můžete upravovat datové typy, vytvářet agregace nebo sloupce aliasů.

Pokud vytváříte více modelů dolování ze stejné dolovací struktury, mohou modely používat různé sloupce ze struktury. Můžete například vytvořit jednu strukturu a pak vytvořit od ní samostatné rozhodovací stromy a modely clusteringu, přičemž každý model používá různé sloupce a predikuje různé atributy.

Každý model navíc může sloupce ze struktury používat různými způsoby. Zobrazení zdroje dat může například obsahovat sloupec Příjem, který můžete pro různé modely použít různými způsoby.

Struktura dolování dat ukládá definici zdroje dat a sloupce v ní ve formě vazeb na zdrojová data. Další informace o vazbách zdroje dat najdete v tématu Zdroje dat a vazby (multidimenzionální SSAS). Mějte však na paměti, že můžete také vytvořit strukturu dolování dat bez vazby ke konkrétnímu zdroji dat pomocí příkazu DMX CREATE MINING STRUCTURE (DMX).

Sloupce struktury dolování

Základní stavební prvky těžební struktury jsou sloupce těžební struktury, které popisují data, která obsahuje zdroj dat. Tyto sloupce obsahují informace, jako je datový typ, typ obsahu a způsob distribuce dat. Struktura dolování neobsahuje informace o tom, jak se sloupce používají pro konkrétní model dolování nebo o typu algoritmu, který se používá k sestavení modelu; tyto informace jsou definovány v samotném modelu těžby.

Datová těžební struktura může také obsahovat vnořené tabulky. Vnořená tabulka představuje vztah jedna-ku-více mezi entitou případu a příslušnými atributy. Pokud se například informace popisované zákazníkem nacházejí v jedné tabulce a nákupy zákazníka se nacházejí v jiné tabulce, můžete informace zkombinovat do jednoho případu pomocí vnořených tabulek. Identifikátor zákazníka je entita a nákupy jsou související atributy. Další informace o tom, kdy použít vnořené tabulky, naleznete v tématu Vnořené tabulky (Analysis Services – Dolování dat).

Pokud chcete vytvořit model dolování dat v nástrojích SQL Server Data Tools, musíte nejprve vytvořit strukturu dolování dat. Průvodce dolováním dat vás provede procesem vytvoření dolování struktury, výběru dat a přidání modelu dolování.

Pokud vytvoříte model dolování pomocí rozšíření dmX (Data Mining Extensions), můžete určit model a sloupce v něm a DMX automaticky vytvoří požadovanou dolování strukturu. Další informace naleznete v tématu CREATE MINING MODEL (DMX).

Další informace naleznete v tématu Dolování struktury sloupce.

Rozdělení dat na trénovací a testovací sady

Když definujete data pro těžební strukturu, můžete také určit, že některá data budou použita pro učení a některá pro testování. Proto již není nutné oddělit data předem při vytváření struktury dolování dat. Místo toho můžete při vytváření modelu určit, že se určité procento dat bude uchovávat pro testování a zbytek použitý pro trénování, nebo můžete určit určitý počet případů, které se mají použít jako testovací datová sada. Informace o trénovacích a testovacích datových sadách jsou uloženy do mezipaměti se strukturou dolování a v důsledku toho lze stejnou testovací sadu použít se všemi modely, které jsou založené na této struktuře.

Další informace najdete v tématu trénování a testování datových sad.

Povolení podrobné analýzy (Drillthrough)

Sloupce můžete přidat do struktury dolování, i když neplánujete použít sloupec v konkrétním těžebním modelu. To je užitečné, pokud například chcete načíst e-mailové adresy zákazníků v modelu clusteringu bez použití e-mailové adresy během procesu analýzy. Pokud chcete sloupec ignorovat během fáze analýzy a předpovědi, přidáte ho do struktury, ale nezadáte použití sloupce nebo nastavíte příznak použití na Ignorovat. Data označená tímto způsobem se dají dál používat v dotazech, pokud je u modelu dolování povolená podrobná analýza, a pokud máte příslušná oprávnění. Můžete například zkontrolovat clustery, které jsou výsledkem analýzy všech zákazníků, a pak pomocí dotazu podrobné analýzy získat jména a e-mailové adresy zákazníků v konkrétním clusteru, i když se tyto sloupce dat nepoužívaly k sestavení modelu.

Další informace najdete v tématu Podrobné dotazy (dolování dat).

Zpracování dolování struktury

Datová těžební struktura pouze slouží jako kontejner metadat, dokud není zpracována. Při zpracování struktury dolování dat, SQL Server Analysis Services vytváří mezipaměť, která ukládá statistiky o datech, informace o tom, jak jsou jakékoliv spojité atributy diskretizovány, a další informace, které jsou později používány modely dolování. Samotný model dolování neukládá tyto souhrnné informace, ale odkazuje na informace, které byly uloženy v mezipaměti při zpracování struktury dolování. Proto není nutné znovu zpracovat strukturu pokaždé, když přidáte nový model do existující struktury; můžete zpracovat pouze model.

Tuto mezipaměť můžete po zpracování zahodit, pokud je mezipaměť velmi velká nebo chcete odebrat podrobná data. Pokud nechcete, aby byla data uložena do mezipaměti, můžete změnit Vlastnost CacheMode struktury dolování na ClearAfterProcessing. Po zpracování všech modelů dojde ke zničení mezipaměti. Nastavení vlastnosti CacheMode na ClearAfterProcessing zakáže získání podrobností z dataminingového modelu.

Po zničení mezipaměti však nebudete schopni přidat nové modely do těžební struktury. Pokud do struktury dolování přidáte nový model dolování nebo změníte vlastnosti stávajících modelů, budete muset nejprve znovu zpracovat strukturu dolování. Další informace najdete v tématu Požadavky na zpracování a důležité informace (dolování dat).

Zobrazení datových struktur pro dolování

Pomocí prohlížečů nelze procházet data ve struktuře dolování. V nástrojích SQL Server Data Tools však můžete pomocí karty Struktura dolování Data Mining Designer zobrazit sloupce struktury a jejich definice. Další informace naleznete v tématu Návrhář dolování dat.

Pokud chcete zkontrolovat data ve struktuře dolování, můžete vytvářet dotazy pomocí rozšíření DMX (Data Mining Extensions). Například příkaz SELECT * FROM <structure>.CASES vrátí všechna data ve struktuře dolování. Aby bylo možné tyto informace načíst, musí být dolovací struktura zpracována a výsledky zpracování musí být uloženy do mezipaměti.

SELECT * FROM <model>.CASES Příkaz vrátí stejné sloupce, ale pouze pro případy v daném modelu. Další informace naleznete ve SELECT FROM <structure>.CASES a SELECT FROM <model>.CASES (DMX).

Použití modelů dolování dat se strukturami dolování dat

Model dolování dat používá algoritmus modelu dolování na data reprezentovaná dolováním struktury. Model dolování je objekt, který patří do určité dolování struktury, a model dědí všechny hodnoty vlastností, které jsou definovány strukturou dolování. Model může použít všechny sloupce, které dolování obsahuje, nebo podmnožinu sloupců. Do struktury můžete přidat více kopií sloupce struktury. Do modelu můžete také přidat více kopií sloupce struktury a pak přiřadit různé názvy nebo aliasy ke každému sloupci struktury v modelu. Další informace o sloupcích struktury aliasingu naleznete v tématu Vytvoření aliasu pro sloupec modelu a vlastnosti modelu dolování.

Další informace o architektuře modelů dolování dat naleznete v tématu Modely dolování (Analysis Services - Data Mining).

Pomocí zde poskytnutých odkazů se dozvíte více o tom, jak definovat, spravovat a používat struktury těžby.

Tasks	Links
Práce s relačními těžebními strukturami	Vytvoření nové relační dolování struktury Přidání vnořené tabulky do struktury dolování
Práce s dolovacími strukturami založenými na OLAP krychlích	Vytvoření nové struktury dolování OLAP
Práce se sloupci ve struktuře dolování	Přidání sloupců do dolování struktury Odebrání sloupců ze struktury dolování
Změna nebo dotazování vlastností struktury a dat dolování	Změna vlastností dolování struktury
Práce s podkladovými zdroji dat a aktualizací zdrojových dat	Úprava zobrazení zdroje dat používaného pro dolování struktury Zpracování dolování struktury

Viz také

Databázové objekty (Analysis Services – Multidimenzionální data)
Modely dolování (Analysis Services – Dolování dat)

Váš názor

Byla tato stránka užitečná?

Last updated on 2026-02-03