Megosztás a következőn keresztül:


Számított táblaforgatókönyvek és használati esetek

Az adatfolyamokban a számított táblák használatának számos előnye van. Ez a cikk a számítási táblák használati eseteit ismerteti, és ismerteti, hogyan működnek a színfalak mögött.

Mi az a számított tábla?

A tábla egy adatfolyamban létrehozott lekérdezés adatkimenetét jelöli az adatfolyam frissítése után. A forrásból származó adatokat, és opcionálisan a rá alkalmazott átalakításokat jelöli. Előfordulhat, hogy olyan új táblákat szeretne létrehozni, amelyek egy korábban betöltött tábla függvényei.

Bár meg lehet ismételni a táblát létrehozó lekérdezéseket, és új átalakításokat alkalmazni rájuk, ennek a megközelítésnek hátrányai vannak: az adatok kétszer töltődnek be, és az adatforrás terhelése megkétszereződik.

A számított táblák mindkét problémát megoldják. A számított táblák hasonlóak a többi táblához, mivel adatokat kapnak egy forrásból, és további átalakításokat alkalmazhat a létrehozásukhoz. Az adatok azonban a használt tárolási adatfolyamból származnak, nem pedig az eredeti adatforrásból. Vagyis korábban egy adatfolyam hozta létre őket, majd újra felhasználták őket.

A számított táblák úgy hozhatók létre, hogy ugyanabban az adatfolyamban hivatkoznak egy táblára, vagy egy másik adatfolyamban létrehozott táblára hivatkoznak.

Egy számított táblázatot kiemelő képernyőkép.

Miért érdemes számított táblát használni?

Az összes átalakítási lépés végrehajtása egy táblában lassú lehet. Ennek a lassulásnak számos oka lehet – előfordulhat, hogy az adatforrás lassú, vagy az éppen végzett átalakításokat két vagy több lekérdezésben kell replikálni. Előnyös lehet, ha először betölti az adatokat a forrásból, majd újra felhasználja egy vagy több táblában. Ilyen esetekben két táblát hozhat létre: az egyiket az adatforrásból, a másikat pedig egy számított táblát, amely több átalakítást alkalmaz az adatfolyam által használt data lake-be írt adatokra. Ez a változás növelheti az adatok teljesítményét és újrafelhasználhatóságát, így időt és erőforrásokat takaríthat meg.

Ha például két tábla átalakítási logikájának egy részét is megosztja, számított tábla nélkül, az átalakítást kétszer kell elvégezni.

A kétszer előforduló adatok átalakítását ábrázoló kép.

Ha azonban számítási táblát használ, akkor az átalakítás közös (megosztott) része egyszer lesz feldolgozva, és az Azure Data Lake Storage-ban lesz tárolva. A fennmaradó átalakítások ezután a közös átalakítás kimenetéből lesznek feldolgozva. Összességében ez a feldolgozás sokkal gyorsabb.

A data lake-ben tárolt, egyszer végrehajtott, a számítási táblában végrehajtott gyakori átalakításokat, valamint a fennmaradó egyedi átalakításokat bemutató kép.

A számított táblák egy helyet biztosítanak az átalakítás forráskódjaként, és felgyorsítják az átalakítást, mert csak egyszer kell elvégezni, nem pedig többször. Az adatforrás terhelése is csökken.

Példaforgatókönyv számított tábla használatára

Ha összesített táblát készít a Power BI-ban az adatmodell felgyorsításához, létrehozhatja az összesített táblát úgy, hogy az eredeti táblára hivatkozik, és további átalakításokat alkalmaz rá. Ezzel a módszerrel nem kell replikálnia az átalakítást a forrásból (az eredeti táblából származó részből).

Az alábbi ábrán például egy Rendelések tábla látható.

Képernyőkép a Rendelések tábláról.

Ebből a táblából származó hivatkozással számítási táblát hozhat létre.

Számított tábla létrehozása.

Képernyőkép arról, hogyan hozhat létre számított táblát az Orders táblából. Először kattintson a jobb gombbal az Orders (Rendelések) táblára a Lekérdezések panelen, majd válassza a Hivatkozás lehetőséget a legördülő menüből. Ez a művelet létrehozza a számított táblát, amelyet itt a rendelések összesítve neveznek át.

A számított tábla további átalakításokkal is rendelkezhet. A Group By használatával például összesítheti az adatokat az ügyfél szintjén.

Képernyőkép a Rendelések összesített tábláról a Vevő oszlop kiemelésével.

Ez azt jelenti, hogy a Rendelések összesített tábla adatokat kap a Rendelések táblából, és nem az adatforrásból. Mivel a szükséges átalakítások némelyike már megtörtént a Rendelések táblában, a teljesítmény jobb, az adatátalakítás pedig gyorsabb.

Számított tábla más adatfolyamokban

Számítási táblát más adatfolyamokban is létrehozhat. Létrehozható úgy, hogy adatokat kap egy adatfolyamból a Microsoft Power Platform adatfolyam-összekötőjével.

Adatok lekérése Power Platform-adatfolyamokból.

A kép kiemeli a Power Platform adatfolyam-összekötőt a Power Query adatforrás-kiválasztása ablakából. Tartalmaz egy leírást is, amely azt állítja, hogy egy adatfolyamtábla egy másik adatfolyamtáblából származó adatokra építhető, amely már megőrződött a tárolóban.

A számított tábla fogalma az, hogy egy tábla megmaradjon a tárolóban, és más táblák is származzanak belőle, így csökkentheti az adatforrás olvasási idejét, és megoszthatja a gyakori átalakításokat. Ez a csökkentés úgy érhető el, hogy adatokat kap más adatfolyamokból az adatfolyam-összekötőn keresztül, vagy egy másik lekérdezésre hivatkozik ugyanabban az adatfolyamban.

Számított tábla: Átalakításokkal vagy anélkül?

Most, hogy már tudja, hogy a számított táblák kiválóan alkalmasak az adatátalakítás teljesítményének javítására, érdemes feltenni a kérdést, hogy az átalakításokat mindig a számított táblára kell-e halasztani, vagy a forrástáblára kell-e alkalmazni őket. Vagyis az adatokat mindig egy táblába kell beemésztni, majd egy számított táblában átalakítani? Mik az előnyei és hátrányai?

Adatok betöltése átalakítás nélkül szöveg-/CSV-fájlok esetén

Ha egy adatforrás nem támogatja a lekérdezések összecsukását (például Text/CSV-fájlokat), az átalakítások alkalmazása kevés előnyt jelent a forrásból származó adatok lekérésekor, különösen akkor, ha az adatmennyiségek nagyok. A forrástáblának egyszerűen be kell töltenie az adatokat a Text/CSV fájlból átalakítások alkalmazása nélkül. Ezután a számított táblák adatokat kérhetnek le a forrástáblából, és végrehajthatják az átalakítást a betöltött adatok tetején.

Felmerülhet a kérdés, hogy mi az az érték, ha olyan forrástáblát hoz létre, amely csak adatokat használ fel? Az ilyen táblák továbbra is hasznosak lehetnek, mert ha a forrásból származó adatokat több táblában is használják, az csökkenti az adatforrás terhelését. Emellett az adatokat mostantól más személyek és adatfolyamok is újra felhasználhatják. A számított táblák különösen hasznosak olyan esetekben, amikor az adatmennyiség nagy, vagy amikor egy adatforráshoz helyszíni adatátjárón keresztül férnek hozzá, mivel csökkentik az átjáróból érkező forgalmat és a mögöttes adatforrások terhelését.

SQL-tábla néhány gyakori átalakításának elvégzése

Ha az adatforrás támogatja a lekérdezések összecsukását, érdemes elvégezni a forrástáblában lévő átalakítások egy részét, mert a lekérdezés az adatforráshoz van hajtva, és csak az átalakított adatok lesznek lekérve. Ezek a módosítások javítják az általános teljesítményt. Az alsóbb rétegbeli számított táblákban gyakori átalakításokat a forrástáblában kell alkalmazni, hogy azok a forráshoz legyenek hajtva. A csak az alsóbb rétegbeli táblákra vonatkozó egyéb átalakításokat számítási táblákban kell elvégezni.