Scénáře a případy použití počítaných tabulek

Používání počítaných tabulek v toku dat má několik výhod. Tento článek popisuje případy použití pro počítané tabulky a popisuje, jak fungují na pozadí.

Co je počítaná tabulka?

Tabulka představuje výstup dat dotazu vytvořeného v toku dat po aktualizaci toku dat. Představuje data ze zdroje a volitelně transformace, které se na něj použily. Někdy můžete chtít vytvořit nové tabulky, které jsou funkcí dříve ingestované tabulky.

I když je možné opakovat dotazy, které vytvořily tabulku a aplikovat na ně nové transformace, má tento přístup nevýhody: data se ingestují dvakrát a zatížení zdroje dat se zdvojnásobí.

Vypočítané tabulky řeší oba problémy. Počítané tabulky se podobají jiným tabulkám v tom, že získávají data ze zdroje a můžete je vytvořit pomocí dalších transformací. Jejich data ale pocházejí z použitého toku dat úložiště, nikoli z původního zdroje dat. To znamená, že byly dříve vytvořeny tokem dat a následně znovu použity.

Počítané tabulky je možné vytvořit odkazováním na tabulku ve stejném toku dat nebo odkazováním na tabulku vytvořenou v jiném toku dat.

Snímek obrazovky s důrazem na počítanou tabulku

Proč používat počítanou tabulku?

Provádění všech kroků transformace v jedné tabulce může být pomalé. K tomuto zpomalení může dojít z mnoha důvodů – zdroj dat může být pomalý nebo transformace, které děláte, je potřeba replikovat ve dvou nebo více dotazech. Může být výhodné nejprve ingestovat data ze zdroje a pak je znovu použít v jedné nebo více tabulkách. Vtakovýchch datech se můžete rozhodnout vytvořit dvě tabulky: jednu, která získává data ze zdroje dat, a druhou počítanou tabulku, která používá více transformací na data, která jsou už zapsaná do datového jezera používaného tokem dat. Tato změna může zvýšit výkon a opětovnou použitelnost dat, což šetří čas a prostředky.

Pokud například dvě tabulky sdílejí i část logiky transformace bez počítané tabulky, musí být transformace provedena dvakrát.

Obrázek znázorňující transformaci dat, ke kterým dochází dvakrát

Pokud se ale použije počítaná tabulka, zpracuje se společná (sdílená) část transformace jednou a uloží se ve službě Azure Data Lake Storage. Zbývající transformace se pak zpracují z výstupu společné transformace. Celkově je toto zpracování mnohem rychlejší.

Obrázek znázorňující běžné transformace provedené jednou ve vypočítané tabulce a uložených v datovém jezeře a zbývající jedinečné transformace, ke kterým dochází později

Počítaná tabulka poskytuje jedno místo jako zdrojový kód transformace a zrychluje transformaci, protože je potřeba ji provést jenom jednou místo vícekrát. Také se snižuje zatížení zdroje dat.

Ukázkový scénář použití počítané tabulky

Pokud vytváříte agregovanou tabulku v Power BI pro urychlení datového modelu, můžete agregovanou tabulku sestavit tak, že na ni odkazujete na původní tabulku a použijete na ni další transformace. Pomocí tohoto přístupu nemusíte replikovat transformaci ze zdroje (část, která je z původní tabulky).

Například následující obrázek znázorňuje tabulku Objednávky.

Snímek obrazovky s tabulkou Objednávky

Pomocí odkazu z této tabulky můžete vytvořit počítanou tabulku.

Vytvoření počítané tabulky

Snímek obrazovky znázorňující, jak vytvořit počítanou tabulku z tabulky Objednávky Nejprve klikněte pravým tlačítkem myši na tabulku Objednávky v podokně Dotazy a v rozevírací nabídce vyberte možnost Odkaz. Tato akce vytvoří vypočítanou tabulku, která se tady přejmenuje na Agregované objednávky.

Počítaná tabulka může mít další transformace. Pomocí funkce Seskupit podle můžete například agregovat data na úrovni zákazníka.

Snímek obrazovky agregované tabulky Objednávky se zvýrazněným sloupcem Zákazník

To znamená, že agregovaná tabulka Objednávky získává data z tabulky Objednávky, a ne ze zdroje dat znovu. Vzhledem k tomu, že některé transformace, které je potřeba udělat, už byly provedeny v tabulce Objednávky, je výkon lepší a transformace dat je rychlejší.

Vypočítaná tabulka v jiných tocích dat

Můžete také vytvořit počítanou tabulku v jiných tocích dat. Můžete ho vytvořit získáním dat z toku dat pomocí konektoru toku dat Microsoft Power Platform.

Získejte data z toků dat Power Platform.

Obrázek zvýrazňuje konektor toků dat Power Platform z okna Pro výběr zdroje dat Power Query. Součástí je také popis, který uvádí, že jedna tabulka toku dat může být postavena nad daty z jiné tabulky toku dat, která je již uložena v úložišti.

Koncept počítané tabulky spočívá v zachování tabulky v úložišti a dalších tabulek, které z ní pocházejí, abyste mohli zkrátit dobu čtení ze zdroje dat a sdílet některé běžné transformace. Toto snížení lze dosáhnout získáním dat z jiných toků dat prostřednictvím konektoru toku dat nebo odkazováním na jiný dotaz ve stejném toku dat.

Počítaná tabulka: S transformacemi nebo bez?

Teď, když víte, že počítané tabulky jsou skvělé pro zlepšení výkonu transformace dat, je dobrou otázkou, jestli se transformace mají vždy odložit do počítané tabulky nebo jestli by se měly použít na zdrojovou tabulku. To znamená, že by se data měla vždy ingestovat do jedné tabulky a pak je transformovat ve vypočítané tabulce? Jaké jsou výhody a nevýhody?

Načtení dat bez transformace pro soubory Text/CSV

Pokud zdroj dat nepodporuje posouvání dotazů (například textové soubory nebo soubory CSV), je při získávání dat ze zdroje málo výhod použití transformací, zejména pokud jsou objemy dat velké. Zdrojová tabulka by měla načítat data ze souboru Text/CSV bez použití transformací. Počítané tabulky pak můžou získat data ze zdrojové tabulky a provést transformaci nad přijatými daty.

Můžete se zeptat, jaká je hodnota vytvoření zdrojové tabulky, která pouze ingestuje data? Taková tabulka může být stále užitečná, protože pokud se data ze zdroje používají ve více než jedné tabulce, snižuje zatížení zdroje dat. Kromě toho je teď možné data znovu použít jinými lidmi a toky dat. Počítané tabulky jsou zvláště užitečné ve scénářích, kdy je objem dat velký nebo když je zdroj dat přístupný přes místní bránu dat, protože snižují provoz z brány a zatížení zdrojů dat za nimi.

Provádění některých běžných transformací pro tabulku SQL

Pokud váš zdroj dat podporuje posouvání dotazů, je vhodné provést některé transformace ve zdrojové tabulce, protože dotaz je přeložený do zdroje dat a z ní se načítají jenom transformovaná data. Tyto změny zlepšují celkový výkon. Ve zdrojové tabulce by se měla použít sada transformací, které jsou společné v podřízených počítaných tabulkách, aby je bylo možné přeložit do zdroje. Další transformace, které platí jenom pro podřízené tabulky, by se měly provádět ve počítaných tabulkách.