Szemantikai modellmódok a Power BI szolgáltatás

Ez a cikk a Power BI szemantikai modell módjainak technikai magyarázatát tartalmazza. Olyan szemantikai modellekre vonatkozik, amelyek élő kapcsolatot jelentenek egy külső üzemeltetésű Analysis Services-modellel, valamint a Power BI Desktopban kifejlesztett modellekre is. A cikk kiemeli az egyes üzemmódok indoklását, valamint a Power BI-kapacitás erőforrásaira gyakorolt lehetséges hatásokat.

A három szemantikai modell mód a következő:

Importálás mód

Az importálási mód a szemantikai modellek fejlesztésének leggyakoribb módja. Ez a mód gyors teljesítményt nyújt a memórián belüli lekérdezésnek köszönhetően. Emellett tervezési rugalmasságot biztosít a modellezők számára, és támogatja az adott Power BI szolgáltatás funkciókat (Q&A, gyors elemzések stb.). Ezen erősségek miatt ez az alapértelmezett mód egy új Power BI Desktop-megoldás létrehozásakor.

Fontos tisztában lenni azzal, hogy az importált adatok tárolása mindig a lemezen történik. Lekérdezés vagy frissítés esetén az adatokat teljes mértékben be kell tölteni a Power BI-kapacitás memóriájába. Ha a memóriában van, az importálási modellek nagyon gyors lekérdezési eredményeket érhetnek el. Fontos tisztában lenni azzal is, hogy az importálási modell nem töltődik be részben a memóriába.

Frissítéskor a VertiPaq tárolómotor tömöríti és optimalizálja az adatokat, majd lemezre tárolja őket. Ha lemezről töltődik be a memóriába, 10-szeres tömörítést láthat. Ezért érdemes arra számítani, hogy 10 GB forrásadat körülbelül 1 GB méretűre tömöríthető. A lemez tárhelymérete 20%-kal csökkentheti a tömörített méretet. A méretkülönbség a Power BI Desktop fájlméretének és a fájl Task Manager-memóriahasználatának összehasonlításával határozható meg.

A tervezési rugalmasság három módon érhető el:

  • Az adatok integrálása adatfolyamokból és külső adatforrásokból származó adatok gyorsítótárazásával, függetlenül az adatforrás típusától vagy formátumától.
  • Az adatelőkészítési lekérdezések létrehozásakor használja a Power Query M képletnyelvének teljes halmazát, más néven M függvényt.
  • Alkalmazza az adatelemzési kifejezések (DAX)-függvények teljes készletét a modell üzleti logikával való továbbfejlesztésekor. Támogatottak a számított oszlopok, a számított táblák és a mértékek.

Az alábbi képen látható módon az importálási modell bármilyen támogatott adatforrástípusból integrálhatja az adatokat.

Diagram shows an Import model can integrate data from any number of external data source types.

Bár az importálási modelleknek vannak lenyűgöző előnyei, hátrányai is vannak:

  • A teljes modellt be kell tölteni a memóriába, mielőtt a Power BI le tudja kérdezni a modellt, ami nyomást helyezhet a rendelkezésre álló kapacitáserőforrásokra, különösen az importálási modellek számának és méretének növekedésével.
  • A modelladatok csak a legújabb frissítéssel azonosak, ezért az importálási modelleket általában ütemezetten kell frissíteni.
  • A teljes frissítés eltávolítja az összes adatot az összes táblából, és újra betölti az adatforrásból. Ez a művelet költséges lehet a Power BI szolgáltatás és az adatforrások számára szükséges idő és erőforrások tekintetében.

Feljegyzés

A Power BI növekményes frissítést érhet el a teljes táblák csonkolásának és újratöltésének elkerülése érdekében. További információ, beleértve a támogatott csomagokat és licencelést, tekintse meg a szemantikai modellek növekményes frissítését és valós idejű adatait.

Az Power BI szolgáltatás erőforrás szempontjából az importálási modellek a következőket igénylik:

  • Elegendő memória a modell lekérdezésekor vagy frissítésekor való betöltéséhez.
  • Erőforrások és további memóriaerőforrások feldolgozása az adatok frissítéséhez.

DirectQuery mód

A DirectQuery mód az Importálás mód alternatíva. A DirectQuery módban fejlesztett modellek nem importálnak adatokat. Ehelyett csak a modell struktúráját meghatározó metaadatokból állnak. A modell lekérdezésekor a rendszer natív lekérdezésekkel kéri le az adatokat az alapul szolgáló adatforrásból.

Diagram shows how DirectQuery model issues native queries to the underlying data source.

A DirectQuery-modell fejlesztésének két fő oka van:

  • Ha az adatmennyiségek túl nagyok, még akkor is, ha adatcsökkentési módszereket alkalmaznak, betöltődnek egy modellbe, vagy gyakorlatilag frissítenek.
  • Amikor a jelentéseknek és irányítópultoknak közel valós idejű adatokat kell szolgáltatnia, az ütemezett frissítési korlátokon belül elérhető értékeken túl. Az ütemezett frissítési korlátok a megosztott kapacitások esetében naponta nyolc alkalommal, prémium szintű kapacitás esetén pedig naponta 48-szor vannak érvényben.

A DirectQuery-modellek számos előnnyel járnak:

  • Az importálási modell méretkorlátjai nem érvényesek.
  • A modellekhez nincs szükség ütemezett adatfrissítésre.
  • A jelentésfelhasználók a legújabb adatokat látják a jelentésszűrők és szeletelők használatakor. Emellett a jelentés felhasználói frissíthetik a teljes jelentést az aktuális adatok lekéréséhez.
  • A valós idejű jelentések az Automatikus oldalfrissítés funkcióval fejleszthetők.
  • A DirectQuery-modelleken alapuló irányítópult-csempék 15 percenként ugyanolyan gyakran frissülhetnek automatikusan, mint 15 percenként.

A DirectQuery-modellekhez azonban van néhány korlátozás:

  • A Power Query/Mashup kifejezések csak olyan függvények lehetnek, amelyek az adatforrás által értelmezett natív lekérdezésekre transzponáltak.
  • A DAX-képletek csak olyan függvényeket használhatnak, amelyek az adatforrás által értelmezett natív lekérdezésekre transzponáltak. A számított táblák nem támogatottak.
  • gyors elemzések funkciók nem támogatottak.

A DirectQuery-modellek Power BI szolgáltatás erőforrás szempontjából a következőket igénylik:

  • Minimális memória a modell (csak metaadatok) betöltéséhez, amikor lekérdezik.
  • Néha a Power BI szolgáltatás jelentős processzorerőforrásokat kell használnia az adatforrásnak küldött lekérdezések létrehozásához és feldolgozásához. Ez a helyzet hatással lehet az átviteli sebességre, különösen akkor, ha egyidejű felhasználók kérdezik le a modellt.

További információ: A DirectQuery használata a Power BI Desktopban.

Összetett mód

Az összetett mód kombinálhatja az Importálás és a DirectQuery módokat, vagy több DirectQuery-adatforrást integrálhat. Az összetett módban fejlesztett modellek támogatják az egyes modelltáblák tárolási módjának konfigurálását. Ez a mód a DAX-tal definiált számított táblákat is támogatja.

A tábla tárolási módja importálás, DirectQuery vagy Kettős módként konfigurálható. A kettős tárolási módként konfigurált táblák importálási és DirectQuery-módban is használhatók, és ez a beállítás lehetővé teszi, hogy a Power BI szolgáltatás a lekérdezések alapján a leghatékonyabb módot határozza meg.

Diagram shows that a Composite model is a combination of Import and DirectQuery storage modes, configured at table level.

Az összetett modellek arra törekszenek, hogy a legjobb importálási és DirectQuery-módokat kínálják. Ha megfelelően van konfigurálva, a memóriabeli modellek magas lekérdezési teljesítményét kombinálhatják a közel valós idejű adatok adatforrásokból való lekérésének lehetőségével.

További információ: Összetett modellek használata a Power BI Desktopban.

Tiszta importálási és DirectQuery-táblák

Az összetett modelleket fejlesztő adatmodellezők valószínűleg dimenzió típusú táblákat konfigurálnak Importálás vagy Kettős tárolási módban, valamint tény típusú táblákat DirectQuery módban. A modelltáblaszerepkörökről további információt a csillagséma ismertetése és a Power BI fontossága című témakörben talál.

Vegyük például a Termék dimenzió típusú táblával rendelkező modellt kettős módban, a Sales tény típusú táblát Pedig DirectQuery módban. A Termék tábla hatékonyan és gyorsan lekérdezhető a memóriából egy jelentésszeletelő megjelenítéséhez. A Sales tábla DirectQuery módban is lekérdezhető a kapcsolódó Termék táblával. Ez utóbbi lekérdezés lehetővé teszi egyetlen hatékony natív SQL-lekérdezés létrehozását, amely a Product és Sales táblákhoz csatlakozik, és a szeletelő értékei alapján szűr.

Hibrid táblák

Az összetett modelleket fejlesztő adatmodellezők a ténytáblákat hibrid táblákként is konfigurálhatják. A hibrid tábla egy vagy több importálási partícióval és egy DirectQuery-partícióval rendelkező tábla. A hibrid táblák előnye, hogy hatékonyan és gyorsan lekérdezhetők a memóriából, ugyanakkor az adatforrás legutóbbi adatváltozásait is beleértve, amelyek az utolsó importálási ciklus után következtek be, ahogyan az alábbi vizualizáció szemlélteti.

Screenshot shows a hybrid table partition with Archived, Incremental refresh, and Real time rows marked.

Hibrid tábla létrehozásának legegyszerűbb módja, ha növekményes frissítési szabályzatot konfigurál a Power BI Desktopban, és engedélyezi a Legújabb adatok valós idejű lekérése a DirectQueryvel (csak Prémium verzió) lehetőséget. Ha a Power BI növekményes frissítési szabályzatot alkalmaz, amely engedélyezi ezt a beállítást, particionálja a táblát, mint az előző ábrán látható particionálási sémát. A megfelelő teljesítmény érdekében konfigurálja a dimenzió típusú táblákat kettős tárolási módban, hogy a Power BI hatékony natív SQL-lekérdezéseket hozzon létre a DirectQuery-partíció lekérdezésekor.

Feljegyzés

A Power BI csak akkor támogatja a hibrid táblákat, ha a szemantikai modellt prémium szintű kapacitásokon lévő munkaterületeken üzemeltetik. Ennek megfelelően fel kell töltenie a szemantikai modellt egy Prémium szintű munkaterületre, ha növekményes frissítési szabályzatot konfigurál azzal a lehetőséggel, hogy valós időben szerezze be a legújabb adatokat a DirectQueryvel. További információ: Növekményes frissítés és valós idejű adatok szemantikai modellekhez.

Az Importálás táblát hibrid táblává is konvertálhatja úgy is, hogy hozzáad egy DirectQuery-partíciót a táblázatos modell szkriptnyelve (TMSL) vagy a táblázatos objektummodell (TOM) használatával, vagy egy harmadik féltől származó eszközzel. Particionálhat például egy ténytáblát úgy, hogy az adatok nagy része az adattárházban marad, miközben a rendszer csak a legfrissebb adatok töredékét importálja. Ez a megközelítés segíthet optimalizálni a teljesítményt, ha az adatok nagy része ritkán elérhető előzményadatok. A hibrid táblák több importálási partícióval is rendelkezhetnek, de csak egy DirectQuery-partícióval.