Typy obsahu (dolování dat)

Platí pro: SQL Server 2019 a starší služby Analysis Services Azure Analysis Services Fabric/ Power BI Premium

Důležité

Dolování dat bylo v SQL Serveru 2017 Analysis Services zastaralé a nyní ukončeno ve službě SQL Server 2022 Analysis Services. Dokumentace se neaktualizuje pro zastaralé a ukončené funkce. Další informace najdete v tématu Zpětná kompatibilita služby Analysis Services.

Ve službě Microsoft SQL Server SQL Server Analysis Services můžete definovat fyzický datový typ pro sloupec ve struktuře dolování a logický typ obsahu pro sloupec při použití v modelu.

Datový typ určuje, jak algoritmy zpracovávají data v těchto sloupcích při vytváření dolování modelů. Definování datového typu sloupce poskytuje algoritmus informace o typu dat ve sloupcích a způsob zpracování dat. Každý datový typ ve službě SQL Server Analysis Services podporuje jeden nebo více typů obsahu pro dolování dat.

Typ obsahu popisuje chování obsahu, který sloupec obsahuje. Pokud se například obsah ve sloupci opakuje v určitém intervalu, například ve dnech v týdnu, můžete určit typ obsahu tohoto sloupce jako cyklický.

Některé algoritmy vyžadují správné fungování konkrétních datových typů a konkrétních typů obsahu. Například algoritmus Microsoft Naive Bayes nemůže jako vstup používat souvislé sloupce a nemůže předpovědět souvislé hodnoty. Některé typy obsahu, jako je například posloupnost klíčů, se používají pouze konkrétním algoritmem. Seznam algoritmů a typů obsahu, které každý podporuje, najdete v tématu Algoritmy dolování dat (Analysis Services – Dolování dat).

Následující seznam popisuje typy obsahu, které se používají při dolování dat, a identifikuje datové typy, které podporují jednotlivé typy.

Diskrétní

Diskrétní znamená, že sloupec obsahuje konečný počet hodnot bez kontinua mezi hodnotami. Například sloupec pohlaví je typický samostatný sloupec atributu v tom, že data představují určitý počet kategorií.

Hodnoty ve sloupci diskrétního atributu nemohou znamenat řazení, i když jsou hodnoty číselné. Navíc, i když jsou hodnoty použité pro diskrétní sloupec číselné, desetinné hodnoty nelze vypočítat. Telefonní čísla jsou dobrým příkladem diskrétních dat, která jsou číselná.

Diskrétní typ obsahu je podporován všemi datovými typy dolování dat.

Nepřetržité

Nepřetržitě znamená, že sloupec obsahuje hodnoty, které představují číselná data ve škále, která umožňuje dočasné hodnoty. Na rozdíl od diskrétního sloupce, který představuje konečný počet dat, souvislý sloupec představuje škálovatelné měření a data mohou obsahovat neomezený počet desetinných hodnot. Sloupec teplot je příkladem sloupce spojitého atributu.

Pokud sloupec obsahuje souvislá číselná data a víte, jak se mají data distribuovat, můžete potenciálně zlepšit přesnost analýzy zadáním očekávaného rozdělení hodnot. Zadáte rozdělení sloupců na úrovni struktury dolování dat. Nastavení se proto vztahuje na všechny modely založené na struktuře. Další informace naleznete v tématu Distribuce sloupců (Dolování dat).

Typ průběžného obsahu podporuje následující datové typy: Datum, Double a Long.

Discretized

Diskretizace je proces vložení hodnot souvislé sady dat do kbelíků, aby byl omezený počet možných hodnot. Diskretizovat můžete pouze číselná data.

Diskretizovaný typ obsahu tedy označuje, že sloupec obsahuje hodnoty představující skupiny nebo kontejnery hodnot odvozených z souvislého sloupce. Kontejnery se považují za seřazené a diskrétní hodnoty.

Data můžete diskretizovat ručně, abyste měli jistotu, že získáte požadované kontejnery, nebo můžete použít metody diskretizace poskytované ve službě SQL Server Analysis Services. Některé algoritmy provádějí diskretizaci automaticky. Další informace naleznete v tématu Změna diskretizace sloupce v modelu dolování.

Diskretizovaný typ obsahu je podporován následujícími datovými typy: Datum, Double, Long a Text.

Key

Typ klíčového obsahu znamená, že sloupec jednoznačně identifikuje řádek. V případě tabulky je obvykle klíčovým sloupcem číselný nebo textový identifikátor. Typ obsahu nastavíte na klíč , který označuje, že sloupec by se neměl používat pro analýzu, pouze pro sledování záznamů.

Vnořené tabulky mají také klíče, ale použití vnořeného klíče tabulky je trochu jiné. Typ obsahu nastavíte na klíč v vnořené tabulce, pokud je sloupec atributem, který chcete analyzovat. Hodnoty v vnořeném klíči tabulky musí být pro každý případ jedinečné, ale v celé sadě případů můžou být duplicitní.

Pokud například analyzujete produkty, které zákazníci kupují, nastavíte typ obsahu na klíč pro sloupec CustomerID v tabulce případu a typ obsahu znovu nastavíte na klíč pro sloupec PurchaseProducts v vnořené tabulce.

Poznámka:

Vnořené tabulky jsou dostupné jenom v případě, že používáte data z externího zdroje dat, který je definovaný jako zobrazení zdroje dat Analysis Services.

Tento typ obsahu podporuje následující datové typy: Datum, Double, Long a Text.

Posloupnost kláves

Typ obsahu sekvence klíčů lze použít pouze v modelech sekvenčního clusteringu. Když nastavíte typ obsahu na posloupnost klíčů, znamená to, že sloupec obsahuje hodnoty, které představují posloupnost událostí. Hodnoty jsou seřazené, ale nemusí se jednat o stejnou vzdálenost od sebe.

Tento typ obsahu podporuje následující datové typy: Double, Long, Text a Date.

Klíčový čas

Typ obsahu klíčového času lze použít pouze v modelech časových řad. Když nastavíte typ obsahu na čas klíče, znamená to, že hodnoty jsou seřazené a představují časové měřítko.

Tento typ obsahu podporuje následující datové typy: Double, Long a Date.

Table

Typ obsahu tabulky označuje, že sloupec obsahuje jinou tabulku dat s jedním nebo více sloupci a jedním nebo více řádky. Pro každý konkrétní řádek v tabulce případů může tento sloupec obsahovat více hodnot, které všechny souvisí s rodičovským záznamem případu. Pokud například tabulka hlavních případů obsahuje seznam zákazníků, můžete mít několik sloupců, které obsahují vnořené tabulky, například sloupec ProductsPurchased , kde vnořená tabulka uvádí produkty zakoupené tímto zákazníkem v minulosti a sloupec Koníčky , který uvádí zájmy zákazníka.

Datový typ tohoto sloupce je vždy Tabulka.

Cyklické

Typ cyklického obsahu znamená, že sloupec obsahuje hodnoty, které představují cyklickou uspořádanou sadu. Například číslované dny v týdnu tvoří cyklickou seřazenou sadu, protože den číslo jedna následuje po dni číslo sedm.

Cyklické sloupce jsou považovány za seřazené i diskrétní z hlediska typu obsahu.

Tento typ obsahu podporuje všechny datové typy dolování dat ve službě SQL Server Analysis Services. Většina algoritmů ale považuje cyklické hodnoty za diskrétní hodnoty a neprovádí speciální zpracování.

Objednáno

Typ uspořádaného obsahu také označuje, že sloupec obsahuje hodnoty, které definují posloupnost nebo pořadí. V tomto typu obsahu však hodnoty použité pro řazení neznamenají žádný vztah vzdálenosti nebo rozsahu mezi hodnotami v sadě. Pokud například seřazený sloupec atributu obsahuje informace o úrovních dovedností v pořadí od jednoho do pěti, neexistují žádné předpokládané informace v vzdálenosti mezi úrovněmi dovedností; úroveň dovednosti 5 nemusí být nutně pětkrát lepší než úroveň dovednosti jedné.

Sloupce seřazených atributů jsou považovány za diskrétní z hlediska typu obsahu.

Tento typ obsahu podporuje všechny datové typy dolování dat ve službě SQL Server Analysis Services. Většina algoritmů ale považuje seřazené hodnoty za diskrétní hodnoty a neprovádí speciální zpracování.

Klasifikovány

Kromě předchozích typů obsahu, které se běžně používají se všemi modely, můžete pro některé datové typy použít klasifikované sloupce k definování typů obsahu. Další informace o klasifikovaných sloupcích najdete v tématu Klasifikované sloupce (dolování dat).

Viz také

Typy obsahu (DMX)
Datové typy (dolování dat)
Datové typy (DMX)
Změna vlastností těžební struktury
Sloupce struktury dolování