Share via


Power BI használati forgatókönyvek: Speciális adatelőkészítés

Feljegyzés

Ez a cikk a Power BI implementációtervezési cikksorozatának része. Ez a sorozat elsősorban a Microsoft Fabricen belüli Power BI-számítási feladatokra összpontosít. A sorozat bemutatása: Power BI implementációtervezés.

Az adat-előkészítés (más néven ETL, amely a kinyerési , átalakítási és betöltési tevékenységek rövidítése) gyakran nagy erőfeszítést igényel. Az adatok gyűjtésével, tisztításával, kombinálásával és bővítésével kapcsolatos idő, képesség és munka a forrásadatok minőségétől és szerkezetétől függ.

A központosított adat-előkészítéshez szükséges idő és erőfeszítés a következőkben segít:

  • Az újrahasználhatóság javítása és az adat-előkészítési erőfeszítések maximális értékének növelése.
  • A konzisztens adatok több csapat számára való biztosításának képességének javítása.
  • Csökkentse a többi tartalomkészítő által igényelt erőfeszítést.
  • Skálázás és teljesítmény elérése.

A speciális adatelőkészítési használati forgatókönyv kibővül az önkiszolgáló adat-előkészítési forgatókönyvvel . A fejlett adatelőkészítés az adatfolyamok több felhasználó általi újrafelhasználásának növeléséről szól különböző csapatokban és különböző használati esetekben.

Az adatfolyamok céljára szervezett különálló munkaterületek akkor hasznosak, ha az adatfolyam kimenetét több szemantikai modell (korábban adathalmaz) létrehozója biztosítja, különösen akkor, ha a szervezet különböző csapataiban vannak. A különálló munkaterületek akkor is hasznosak a biztonsági szerepkörök kezelésében, ha az adatfolyamokat létrehozó és kezelő személyek eltérnek a felhasználók által használttól.

Feljegyzés

A speciális adat-előkészítési forgatókönyv az adatelőkészítési forgatókönyvek második része. Ez a forgatókönyv az önkiszolgáló adat-előkészítési forgatókönyvben leírt központosított adatfolyamokkal elvégezhető feladatokra épül.

A speciális adat-előkészítési forgatókönyv az önkiszolgáló BI-forgatókönyvek egyike. A központosított csapattagok azonban a felügyelt önkiszolgáló BI-forgatókönyvben leírtakhoz hasonlóan használhatják a technikákat. Az önkiszolgáló forgatókönyvek teljes listáját a Power BI használati forgatókönyveit ismertető cikkben találja.

A rövidség kedvéért a jelen cikk nem foglalkozik a tartalom-együttműködési és kézbesítési forgatókönyvek témakörében ismertetett néhány szempontmal. A teljes lefedettség érdekében először olvassa el ezeket a cikkeket.

Forgatókönyv-diagram

Tipp.

Javasoljuk, hogy tekintse át az önkiszolgáló adatelőkészítés használati forgatókönyvét, ha még nem ismeri. A speciális önkiszolgáló adat-előkészítési forgatókönyv erre a forgatókönyvre épül.

Ennek a speciális adat-előkészítési forgatókönyvnek a fókusza a következő:

  • Külön adatfolyamok használata cél alapján: előkészítés, átalakítás vagy végleges. Azt javasoljuk , hogy több különböző kombinációban használjon összeszerelhető építőelemeket az egyes felhasználói követelmények támogatására. A összeállítható építőelemeket a cikk későbbi részében ismertetjük.
  • Az adatfolyam-létrehozókat vagy adatfolyam-fogyasztókat támogató különálló munkaterületek használata. Az adatfolyamokat használó adatmodellezők különböző csapatokban lehetnek, és/vagy eltérő használati esetekkel rendelkeznek.
  • A csatolt táblák (más néven csatolt entitások), a számított táblák (más néven számított entitások) és a továbbfejlesztett számítási motor használata.

Feljegyzés

Néha a szemantikai modell és az adatmodell kifejezések felcserélhetők. Általában Power BI szolgáltatás szemantikai modellnek nevezzük. Fejlesztési szempontból adatmodellnek (röviden modellnek) nevezzük. Ebben a cikkben mindkét kifejezésnek ugyanaz a jelentése. Hasonlóképpen, egy szemantikai modell létrehozójának és egy adatmodellezőnek is ugyanaz a jelentése.

Az alábbi ábra a speciális adat-előkészítési forgatókönyvet támogató leggyakoribb felhasználói műveletek és Power BI-összetevők magas szintű áttekintését mutatja be.

Az ábra a fejlett adatelőkészítést mutatja be, amely az adatfolyamok elérésének és újrafelhasználhatóságának javításáról szól. A diagram elemeit az alábbi táblázat ismerteti.

Tipp.

Javasoljuk, hogy töltse le a forgatókönyv-diagramot , ha be szeretné ágyazni a bemutatóba, a dokumentációba vagy a blogbejegyzésbe, vagy nyomtassa ki fali plakátként. Mivel ez egy méretezhető vektorgrafika (SVG) kép, minőségromlás nélkül skálázhatja fel vagy le.

A forgatókönyv-diagram a következő felhasználói műveleteket, eszközöket és funkciókat ábrázolja:

Cikk Leírás
1. elem. Az adatfolyam létrehozója táblák gyűjteményét fejleszti ki egy adatfolyamon belül. Az újrafelhasználásra szánt adatfolyamok esetében gyakori (de nem kötelező), hogy az alkotó egy olyan központosított csapathoz tartozik, amely a szervezet határain (például az informatikai részlegen, a vállalati BI-n vagy a Kiválósági Központon) keresztül támogatja a felhasználókat.
2. elem. Az adatfolyam egy vagy több adatforrásból származó adatokhoz csatlakozik.
3. elem. Egyes adatforrásokhoz helyszíni adatátjáróra vagy VNet-átjáróra lehet szükség az adatfrissítéshez, például a magánhálózaton belül találhatóakhoz. Ezek az átjárók az adatfolyam Power Query Online-ban való létrehozásához és az adatfolyam frissítéséhez egyaránt használhatók.
4. elem. Az összes érintett munkaterület licencmódja Fabric-kapacitásra, Prémium kapacitásra, Felhasználónkénti prémiumra vagy Embeddedre van állítva. Ezek a licencmódok lehetővé teszik a csatolt táblák és a számított táblák használatát a munkaterületeken, amelyekre ebben a forgatókönyvben szükség van.
5. elem. Az adatfolyam-létrehozók adatfolyamokat fejlesztenek a Power Query Online használatával, amely a Power Query webalapú verziója.
6. elem. Átmeneti adatfolyam jön létre egy olyan munkaterületen, amely az adatfolyamok központosított felügyeletére van kijelölve. Az átmeneti adatfolyam a forrásból másolja át a nyers adatokat. Ha vannak ilyenek, kevés átalakítás lesz alkalmazva.
7. elem. Egy átalakítási adatfolyam (más néven tisztított adatfolyam) jön létre ugyanabban a munkaterületen. Az előkészítési adatfolyamhoz csatolt tábla(ok) használatával adatforrásokat hoz létre. A számított táblák olyan átalakítási lépéseket tartalmaznak, amelyek előkészítik , megtisztítják és átalakítják az adatokat.
8. elem. Az adatfolyam-létrehozók hozzáféréssel rendelkeznek az adatfolyamok központosított kezelésére dedikált munkaterületen lévő tartalmak kezeléséhez.
9. elem. Létezik egy vagy több olyan munkaterület, amely hozzáférést kíván biztosítani a végső adatfolyamhoz, amely éles üzemre kész adatokat biztosít az adatmodelleknek.
10. tétel. A végső adatfolyam egy olyan munkaterületen jön létre, amely az adatmodellezők számára érhető el. Az átalakítási adatfolyamhoz csatolt tábla(ok) használatával adatforrásokat hoz létre. A számított tábla(ok) a munkaterület-megtekintői szerepkörrel rendelkező adatmodellezők számára látható előkészített kimenetet jelölik.
11. tétel. A szemantikai modell létrehozói (akik az adatfolyam kimenetét használják) megtekintői hozzáféréssel rendelkeznek a végső adatfolyam-kimenetet tartalmazó munkaterülethez. Az adatfolyam-létrehozók a munkaterületen lévő tartalmak kezeléséhez és közzétételéhez is hozzáférhetnek (a forgatókönyv-diagramon nem látható).
12. elem. A szemantikai modellek létrehozói a végső adatfolyamot használják adatforráskéntegy adatmodell power BI Desktopban történő fejlesztésekor. Ha elkészült, a szemantikai modell létrehozója közzéteszi az adatmodellt tartalmazó Power BI Desktop-fájlt (.pbix) a Power BI szolgáltatás (a forgatókönyvdiagramon nem látható).
13. tétel. A hálógazdák a Rendszergazda portálon kezelhetik a beállításokat.
14. tétel. A Rendszergazda portálon a Power BI-rendszergazdák Azure-kapcsolatokat állíthatnak be az adatfolyam-adatok Azure Data Lake Storage Gen2 (ADLS Gen2) fiókjában való tárolásához. Gépház például bérlőszintű tárfiókot rendelhet hozzá, és engedélyezheti a munkaterületszintű tárterület-engedélyeket.
15. tétel. Alapértelmezés szerint az adatfolyamok a Power BI szolgáltatás által felügyelt belső tároló használatával tárolják az adatokat. Az adatfolyam által előállított adatok tárolhatók a szervezet ADLS Gen2-fiókjában.
16. tétel. A hálógazdák felügyelik és figyelik a fabricportál tevékenységeit.

Kulcsfontosságú pontok

Az alábbiakban néhány fontos szempontot emelünk ki a speciális adat-előkészítési forgatókönyvről.

Adatfolyamok

Az adatfolyam táblák (más néven entitások) gyűjteményéből áll. Minden táblát egy lekérdezés határoz meg, amely tartalmazza a tábla adatokkal való betöltéséhez szükséges adat-előkészítési lépéseket. Az adatfolyamok létrehozásához szükséges összes munka a Power Query Online-ban történik. Több termékben is létrehozhat adatfolyamot, például a Power Appsben, a Dynamics 365 Ügyfél Elemzések és a Power BI-ban.

Feljegyzés

A Power BI szolgáltatás személyes munkaterületén nem hozhat létre adatfolyamokat.

Adatfolyamok típusai

A összeállítható építőelemek használata olyan tervezési alapelv, amely lehetővé teszi a rendszerösszetevők kezelését, üzembe helyezését és védelmét, majd különböző kombinációkban való használatát. Ajánlott eljárás a célnak megfelelő moduláris, önálló adatfolyamok létrehozása. Segítenek az adatok újrafelhasználásában és a nagyvállalati skálázásban. A moduláris adatfolyamok kezelése és tesztelése is egyszerűbb.

A forgatókönyv-diagram három adatfolyamtípust jelenít meg: átmeneti adatfolyamot, átalakítási adatfolyamot és végső adatfolyamot.

Átmeneti adatfolyam

Az átmeneti adatfolyamok (más néven adatkinyerési adatfolyamok) nyers adatokat másolnak a forrásból. A nyers adatok minimális átalakítással történő kinyerése azt jelenti, hogy az alsóbb rétegbeli átalakítási adatfolyamok (a következő szakaszban ismertetettek) az átmeneti adatfolyamot használhatják forrásként. Ez a modularitás akkor hasznos, ha:

  • Az adatforrásokhoz való hozzáférés szűk időre és/vagy néhány felhasználóra korlátozódik.
  • Az időbeli konzisztenciára azért van szükség, hogy az összes alsóbb rétegbeli adatfolyam (és a kapcsolódó szemantikai modellek) az adatforrásból egyszerre kinyert adatokat nyújtsanak.
  • Az adatforrásnak küldött lekérdezések számának csökkentése a forrásrendszer korlátozásai vagy az elemzési lekérdezések támogatásának képessége miatt szükséges.
  • A forrásadatok másolata hasznos az egyeztetési folyamatokhoz és az adatminőség-ellenőrzéshez.

Átalakítási adatfolyam

Az átalakítási adatfolyamok (más néven tisztított adatfolyamok) az átmeneti adatfolyamhoz csatlakozó csatolt táblákból származtatják az adatokat. Ajánlott eljárás az átalakítások elkülönítése az adatkinyerési folyamattól.

Az átalakítási adatfolyam tartalmazza az adatok előkészítéséhez és átalakításához szükséges összes átalakítási lépést. Ezen a rétegen azonban továbbra is az újrafelhasználhatóságra összpontosít, hogy az adatfolyam több használati esetre és célra is alkalmas legyen.

Végső adatfolyam

A végleges adatfolyam az előkészített kimenetet jelöli. A használati eset és a cél alapján további átalakítások is előfordulhatnak. Az elemzéshez a csillagsématáblák (dimenzió vagy tény) a végső adatfolyam előnyben részesített kialakítása.

A számított táblák láthatók a munkaterület-megtekintői szerepkört kapó adatmodellezők számára. Ezt a táblázattípust az adatfolyamtáblák alábbi témakörében ismertetjük.

Feljegyzés

A data lake-ekben gyakran vannak zónák, például bronz, ezüst és arany. Az adatfolyamok három típusa hasonló tervezési mintát képvisel. A lehető legjobb adatarchitektúra-döntések meghozatalához gondolja át, hogy ki fogja karbantartani az adatokat, az adatok várható felhasználását és az adatokhoz hozzáférő személyek által megkövetelt készségszintet.

Adatfolyamok munkaterületei

Ha egyetlen munkaterületen hozná létre az összes adatfolyamot, az jelentősen korlátozná az újrafelhasználhatóság mértékét. Ha egyetlen munkaterületet használ, az is korlátozza a rendelkezésre álló biztonsági beállításokat, ha több felhasználótípust támogat a csapatokban és/vagy különböző használati esetekben. Javasoljuk, hogy több munkaterületet használjunk. Nagyobb rugalmasságot biztosítanak, ha a szervezet különböző területeiről származó önkiszolgáló alkotókat kell támogatnia.

A forgatókönyv-diagramon látható munkaterületek két típusa:

  • 1. munkaterület: Központilag felügyelt adatfolyamokat (más néven háttér-munkaterületet) tárol. Az előkészítési és az átalakítási adatfolyamokat is tartalmazza, mert ugyanazok a személyek kezelik őket. Az adatfolyam-létrehozók gyakran egy központosított csapatból származnak, például az informatikai, a bi- vagy a kiválósági központból. Ezeket a munkaterület rendszergazdájához, tagjához vagy közreműködői szerepköréhez kell hozzárendelni.
  • 2. munkaterület: Tárolja és kézbesíti az adatfolyam végső kimenetét az adatok felhasználóinak (más néven felhasználói munkaterületnek). A szemantikus modellek létrehozói gyakran önkiszolgáló elemzők, energiafelhasználók vagy állampolgári adatszakértők. A munkaterület-megtekintő szerepkörhöz kell hozzárendelni őket, mert csak a végső adatfolyam kimenetét kell használniuk. A szervezet különböző területeiről származó szemantikai modellkészítők támogatásához számos ilyen munkaterületet hozhat létre a használati esetek és a biztonsági igények alapján.

Tipp.

Javasoljuk, hogy tekintse át a szemantikai modellek létrehozóinak támogatásának módjait az önkiszolgáló adat-előkészítés használati forgatókönyvében leírtak szerint. Fontos tisztában lenni azzal, hogy a szemantikai modellek létrehozói továbbra is használhatják a Power Query teljes képességeit a Power BI Desktopban. Dönthetnek úgy, hogy lekérdezési lépéseket adnak hozzá az adatfolyam adatainak további átalakításához, vagy egyesíthetik az adatfolyam kimenetét más forrásokkal.

Adatfolyamtáblák típusai

A forgatókönyv-diagram háromféle adatfolyamtáblát (más néven entitást) ábrázol.

  • Standard tábla: Külső adatforrás, például adatbázis lekérdezése. A forgatókönyv-diagramban a standard táblák az átmeneti adatfolyamban jelennek meg.
  • Csatolt tábla: Egy másik adatfolyamból származó táblára hivatkozik. A csatolt táblák nem duplikálják az adatokat. Ehelyett több célra is lehetővé teszi egy standard tábla többszöri újrafelhasználását. A csatolt táblák nem láthatók a munkaterület megtekintői számára, mivel az eredeti adatfolyam engedélyeit öröklik. A forgatókönyv-diagramban a csatolt táblák kétszer jelennek meg:
    • Az átmeneti adatfolyamban lévő adatok elérésére szolgáló átalakítási adatfolyamban.
    • Az átalakítási adatfolyamban lévő adatok elérésére szolgáló végső adatfolyamban.
  • Számított tábla: További számításokat hajt végre egy másik adatfolyam forrásként való használatával. A számított táblák lehetővé teszik a kimenet igény szerinti testreszabását az egyes használati esetekhez. A forgatókönyv-diagramban a számított táblák kétszer jelennek meg:
    • Az átalakítási adatfolyamban a gyakori átalakítások végrehajtásához.
    • A végső adatfolyamban, amely a kimenetet a szemantikai modell létrehozóinak továbbítja. Mivel a számított táblák ismét megőrzik az adatokat (az adatfolyam frissítése után), az adatmodellezők hozzáférhetnek a számított táblákhoz a végső adatfolyamban. Ebben az esetben az adatmodellezőknek hozzáférést kell biztosítani a munkaterületmegjelenítő szerepkörrel.

Feljegyzés

Számos tervezési technika, minta és ajánlott eljárás létezik, amelyek az adatfolyamokat az önkiszolgálótól a vállalati használatra készig képesek átvenni. Emellett a felhasználónkénti Premium vagy Prémium szintű kapacitásra beállított licencmóddal rendelkező munkaterület adatfolyamai is élvezhetik a speciális funkciókat. A csatolt táblák és a számított táblák (más néven entitások) két speciális funkció, amelyek elengedhetetlenek az adatfolyamok újrafelhasználhatóságának növeléséhez.

Továbbfejlesztett számítási motor

A továbbfejlesztett számítási motor egy speciális funkció, amely a Power BI Premiumban érhető el.

Fontos

Ez a cikk időnként a Power BI Premiumra vagy annak kapacitás-előfizetésére (P termékváltozatokra) hivatkozik. Vegye figyelembe, hogy a Microsoft jelenleg összevonja a vásárlási lehetőségeket, és visszavonul a Power BI Premium kapacitásonkénti termékváltozataitól. Az új és a meglévő ügyfeleknek érdemes megfontolni a Fabric-kapacitás-előfizetések (F SKU-k) megvásárlását.

További információ: Fontos frissítés a Power BI Premium licenceléséhez és a Power BI Premiumhoz – gyakori kérdések.

A továbbfejlesztett számítási motor javítja az adatfolyamra hivatkozó csatolt táblák teljesítményét (ugyanazon a munkaterületen belül). A továbbfejlesztett számítási motor előnyeinek maximális kihasználása:

  • Ossza fel az előkészítési és átalakítási adatfolyamokat.
  • Ugyanazt a munkaterületet használja az előkészítési és átalakítási adatfolyamok tárolásához.
  • Összetett műveleteket alkalmazhat, amelyek a lekérdezési lépések korai szakaszában lekérdezhetők. Az összecsukható műveletek rangsorolása segíthet a legjobb frissítési teljesítmény elérésében.
  • Növekményes frissítés használatával csökkentheti a frissítés időtartamát és az erőforrás-felhasználást.
  • A fejlesztési fázisban korán és gyakran végezzen tesztelést.

Adatfolyam és szemantikai modell frissítése

Az adatfolyamok a szemantikai modellek adatforrásai. A legtöbb esetben több adatfrissítési ütemezésről van szó: egy-egy adatfolyamhoz és egy-egy szemantikai modellhez. Azt is megteheti, hogy a DirectQueryt a szemantikai modelltől az adatfolyamig használja, amelyhez a Power BI Premium és a továbbfejlesztett számítási motor szükséges (a forgatókönyv-diagramon nem látható).

Azure Data Lake Storage Gen2

Az ADLS Gen2-fiók az Azure Storage-fiók egy adott típusa, amely engedélyezve van a hierarchikus névtérrel . Az ADLS Gen2 teljesítménybeli, felügyeleti és biztonsági előnyökkel rendelkezik az elemzési számítási feladatok üzemeltetéséhez. A Power BI-adatfolyamok alapértelmezés szerint belső tárolót használnak, amely egy beépített data lake-fiók, amelyet a Power BI szolgáltatás kezel. A szervezetek igény szerint saját data lake-t is hozhatnak, ha a szervezet egy ADLS Gen2-fiókhoz csatlakoznak.

A saját data lake használatának néhány előnye:

  • A felhasználók (vagy folyamatok) közvetlenül hozzáférhetnek a data lake-ben tárolt adatfolyam-adatokhoz. Ez akkor hasznos, ha az adatfolyamok újrafelhasználása a Power BI-on kívül történik. Az Azure Data Factory például hozzáférhet az adatfolyam-adatokhoz.
  • Más eszközök vagy rendszerek kezelhetik az adatokat a data lake-ben. Ebben az esetben a Power BI felhasználhatja az adatokat a kezelés helyett (a forgatókönyv-diagramon nem látható).

Csatolt táblák vagy számított táblák használatakor győződjön meg arról, hogy minden munkaterület ugyanahhoz az ADLS Gen2-tárfiókhoz van rendelve.

Feljegyzés

Az adatfolyam-adatok az ADLS Gen2-ben egy Power BI-specifikus tárolóban találhatók. Ez a tároló az önkiszolgáló adatelőkészítés használati forgatókönyvének diagramjában látható.

Rendszergazda portál beállításai

A Rendszergazda portálon két fontos beállítást kell kezelni:

Átjáró beállítása

Általában helyszíni adatátjáróra van szükség a magánhálózaton vagy virtuális hálózaton belül található adatforrásokhoz való csatlakozáshoz.

Adatátjáróra akkor van szükség, ha:

  • Adatfolyam létrehozása a Power Query Online-ban, amely privát szervezeti adatokhoz csatlakozik.
  • Privát szervezeti adatokhoz csatlakozó adatfolyam frissítése.

Tipp.

Az adatfolyamok központi adatátjárót igényelnek standard módban. A személyes módban lévő átjárók nem támogatottak adatfolyamok használatakor.

Rendszerfelügyelet

A tevékenységnapló rögzíti a Power BI szolgáltatás előforduló felhasználói tevékenységeket. A Power BI-rendszergazdák az összegyűjtött tevékenységnapló-adatokkal naplózást végezhetnek, hogy könnyebben megértsék a használati mintákat és a bevezetést. A tevékenységnapló hasznos az irányítási erőfeszítések, a biztonsági auditok és a megfelelőségi követelmények támogatásához is. A speciális adatelőkészítési forgatókönyvben a tevékenységnapló adatai hasznosak az adatfolyamok felügyeletének és használatának nyomon követéséhez.

A Power BI implementálási döntéseivel kapcsolatos további hasznos forgatókönyvekért tekintse meg a Power BI használati forgatókönyveit ismertető cikket.