Zdieľať cez


Sémantický model režimov v služba Power BI

Tento článok poskytuje technické vysvetlenie režimov sémantických modelov v službe Power BI. Vzťahuje sa na sémantické modely, ktoré predstavujú dynamické pripojenie k externe hosťovanému modelu Analysis Services, ako aj k modelom vyvinutým v aplikácii Power BI Desktop. V článku sa zdôrazňuje zdôvodnenie každého režimu a možné vplyvy na kapacitné prostriedky služby Power BI.

Tri sémantické režimy modelu sú:

Režim importu

Režim importu je najbežnejším režimom, ktorý sa používa na vývoj sémantických modelov. Tento režim prináša rýchly výkon vďaka dotazovania v pamäti. Modelovačom tiež ponúka flexibilitu návrhu a podporu konkrétnych funkcií služba Power BI (Q&A, Rýchle prehľady atď.). Z dôvodu jeho silných stránok ide o predvolený režim pri vytváraní nového riešenia v aplikácii Power BI Desktop.

Je dôležité vedieť, že importované údaje sa vždy ukladajú na disk. Pri dotazovaní alebo obnovení sa údaje musia úplne načítať do pamäte v rámci kapacity služby Power BI. Po načítaní do pamäte dosahujú modely importu veľmi rýchle výsledky dotazovania. Tiež je dôležité vedieť, že neexistuje žiadna koncepcia modelu importu, ktorý by sa do pamäte načítal čiastočne.

Pri obnovovaní sa údaje komprimujú a optimalizujú a následne ich uloží na disk nástroj úložiska VertiPaq. Pri načítavaní z disku do pamäte je možná 10-násobná kompresia. Je preto rozumné očakávať, že 10 GB zdrojových údajov sa môže komprimovať na veľkosť približne 1 GB. Môže sa tak dosiahnuť zníženie veľkosti úložiska na disku o 20 %. Rozdiel vo veľkosti sa môže určiť na základe porovnania veľkosti súboru aplikácie Power BI Desktop s pamäťou využitou pre súbor pomocou Správcu úloh.

Flexibilitu návrhu možno dosiahnuť tromi spôsobmi:

  • Integrovať údaje ukladanie údajov do vyrovnávacej pamäte z tokov údajov a externých zdrojov údajov bez ohľadu na typ alebo formát zdroja údajov.
  • Pri vytváraní dotazov prípravy údajov použite celú množinu funkcií jazyka vzorcov Power Query M, označovaných ako M.
  • Použite celú množinu funkcií jazyka DAX (Data Analysis Expressions) pri vylepšovaní modelu o obchodnú logiku. K dispozícii je podpora pre vypočítané stĺpce, vypočítané tabuľky a mierky.

Ako je znázornené na nasledujúcom obrázku, model importu môže integrovať údaje z ľubovoľného počtu podporovaných typov zdrojov údajov.

Diagram shows an Import model can integrate data from any number of external data source types.

Hoci modely importu majú presvedčivé výhody, sú s nimi spojené aj nevýhody:

  • Predtým než môže služba Power BI model dotazovať, musí byť celý model načítaný do pamäte, čo môže vytvárať tlak na dostupné prostriedky, najmä keď počet a veľkosť modelov importu rastie.
  • Údaje modelu sú len také aktuálne ako posledné obnovenie, preto sa musia modely importu obnovovať, zvyčajne plánovaným spôsobom.
  • Úplným obnovením sa odstránia všetky údaje zo všetkých tabuliek a znova sa načíta zo zdroja údajov. To môže byť pre služba Power BI a zdroje údajov veľmi náročné na čas aj prostriedky.

Poznámka

Služba Power BI môže dosiahnuť prírastkové obnovenie, aby sa predišlo skráteniu a opätovnému načítaniu celých tabuliek. Ďalšie informácie vrátane podporovaných plánov a licencií nájdete v téme Prírastkové obnovenie a údaje v reálnom čase pre sémantické modely.

Z služba Power BI hľadiska prostriedkov modely importu vyžadujú:

  • dostatok pamäte na načítanie modelu v prípade jeho dotazovania alebo obnovovania,
  • prostriedky na spracovanie a ďalšie pamäťové prostriedky na obnovenie údajov,

Režim DirectQuery

Režim DirectQuery je alternatívou režimu Import. Modely vyvinuté v režime DirectQuery neimportujú údaje. Namiesto toho pozostávajú iba z metaúdajov definujúcich štruktúru modelu. Pri dotazovaní modelu sa na načítanie údajov zo základného zdroja údajov používajú natívne dotazy.

Diagram shows how DirectQuery model issues native queries to the underlying data source.

Vývoj modelu DirectQuery môžete zvážiť z dvoch hlavných dôvodov:

  • Keď sú objemy údajov príliš veľké, a to aj vtedy, keď sa uplatnia metódy redukcie údajov, na načítanie do modelu alebo na praktické obnovenie.
  • Keď zostavy a tabule musia poskytnúť údaje takmer v reálnom čase , čo prekračuje možnosti obmedzení plánovaného obnovenia. Plánované obnovovanie je obmedzené na osemkrát denne pre zdieľanú kapacitu a 48-krát denne pre kapacitu Premium.

Modely DirectQuery majú niekoľko výhod:

  • Nevzťahujú sa na ne obmedzenia veľkosti modelu importu.
  • Modely nevyžadujú plánované obnovenie údajov.
  • Používateľom zostáv sa pri interakcii s filtrami zostáv a rýchlymi filtrami zobrazujú najnovšie údaje. Používatelia zostáv môžu tiež obnoviť celú zostavu a načítať aktuálne údaje.
  • Zostavy v reálnom čase je možné vyvinúť pomocou funkcie Automatické obnovenie strany.
  • Dlaždice tabule vychádzajúce z modelov DirectQuery sa môžu aktualizovať automaticky až každých 15 minút.

S modelmi DirectQuery sa však spájajú aj určité obmedzenia:

  • Výrazy Power Query/Mashup môžu byť funkcie, ktoré možno transponovať na natívne dotazy pochopiteľné pre zdroj údajov.
  • Vzorce DAX sa obmedzujú na funkcie, ktoré možno transponovať na natívne dotazy pochopiteľné pre zdroj údajov. Vypočítané tabuľky nie sú podporované.
  • Rýchle prehľady funkcie nie sú podporované.

Z hľadiska služba Power BI zdrojov modely DirectQuery vyžadujú:

  • Minimálnu pamäť na načítanie modelu (iba metaúdaje) v prípade jeho dotazu.
  • Niekedy musí služba Power BI na vytvorenie a spracovanie dotazov odoslaných do zdroja údajov použiť významné prostriedky procesora. Keď nastane táto situácia, môže to ovplyvniť priepustnosť, najmä keď súbežní používatelia dotazujú model.

Ďalšie informácie nájdete v téme Použitie režimu DirectQuery v aplikácii Power BI Desktop.

Zložený režim

Zložený režim môže kombinovať režimy Import a DirectQuery alebo integrovať viacero zdrojov údajov DirectQuery. Modely vyvinuté v zloženom režime podporujú konfiguráciu režimu úložiska pre každú tabuľku modelu. Tento režim podporuje aj vypočítavané tabuľky definované pomocou jazyka DAX.

Režim úložiska tabuliek môže byť nakonfigurovaný ako Import, DirectQuery alebo Duálny. Tabuľka nakonfigurovaná ako duálny režim úložiska umožňuje režim importu aj režim DirectQuery. Toto nastavenie umožňuje služba Power BI určiť pre každý dotaz najúčinnejší režim.

Diagram shows that a Composite model is a combination of Import and DirectQuery storage modes, configured at table level.

Zložené modely sa snažia zabezpečiť to najlepšie z režimov importu a DirectQuery. Ak sú správne nakonfigurované, môžu spájať vysoký výkon dotazov dátových modelov v pamäti s možnosťou načítania údajov v takmer reálnom čase zo zdrojov údajov.

Ďalšie informácie nájdete v téme Používanie zložených modelov v aplikácii Power BI Desktop.

Tabuľky Pure Import a DirectQuery

Pri dátovom modelovaní, ktorým sa vyvíjajú zložené modely, sa tabuľky s typom dimenzie nakonfigurujú pravdepodobne v režime importu alebo v duálnom režime úložiska a tabuľky s typom faktu v režime DirectQuery. Ďalšie informácie o rolách tabuľky modelu nájdete v téme Vysvetlenie hviezdicovej schémy a dôležitosti pre Power BI.

Zvážte napríklad model s tabuľkou s typom dimenzie Produkt v duálnom režime a tabuľku s typom faktu Predaj v režime DirectQuery. Tabuľku Produkt možno účinne a rýchlo dotazovať zvnútra pamäte s cieľom vykresliť rýchly filter zostavy. Tabuľku Predaj možno tiež dotazovať v režime DirectQuery so súvisiacou tabuľkou Produkt . Tento dotaz môže umožniť vytvorenie jedného účinného natívneho dotazu SQL na spojenie tabuliek Produkt a Predaj a filtrovanie podľa hodnôt rýchleho filtra.

Hybridné tabuľky

Modelári údajov, ktorí vyvíjajú zložené modely, môžu tiež nakonfigurovať tabuľky faktov ako hybridné tabuľky. Hybridná tabuľka je tabuľka s jednou alebo viacerými oblasťami importu a jednou oblasťou režimu DirectQuery. Výhodou hybridnej tabuľky je to, že by sa dala účinne a rýchlo dotazovať z danej pamäte a zároveň by sa mohli zahrnúť najnovšie zmeny údajov zo zdroja údajov, ku ktorým došlo po poslednom cykle importu, ako znázorňuje nasledujúca vizualizácia.

Screenshot shows a hybrid table partition with Archived, Incremental refresh, and Real time rows marked.

Najjednoduchším spôsobom vytvorenia hybridnej tabuľky je nakonfigurovať politiku prírastkového obnovenia v aplikácii Power BI Desktop a povoliť možnosť Získať najnovšie údaje v reálnom čase pomocou režimu DirectQuery (iba verzia Premium). Keď Power BI použije politiku prírastkového obnovenia, ktorá má túto možnosť povolenú, rozdelí tabuľku na oblasti, ako je napríklad schéma rozdelenia zobrazená v predchádzajúcom diagrame. Ak chcete zabezpečiť dobrý výkon, nakonfigurujte tabuľky dimenzií v duálnom režime úložiska tak, aby služba Power BI mohla pri dotazovaní na oblasť DirectQuery generovať efektívne natívne dotazy SQL.

Poznámka

Power BI podporuje hybridné tabuľky iba v prípade, že je sémantický model hosťovaný v pracovných priestoroch na kapacitách Premium. Ak preto nakonfigurujete politiku prírastkového obnovenia s možnosťou získavania najnovších údajov v reálnom čase pomocou režimu DirectQuery, musíte nahrať sémantický model do pracovného priestoru Premium. Ďalšie informácie nájdete v téme Prírastkové obnovenie a údaje v reálnom čase pre sémantické modely.

Tabuľku importu je tiež možné konvertovať na hybridnú tabuľku pridaním oblasti DirectQuery pomocou jazyka na skriptovanie tabuľkového modelu (TMSL) alebo tabuľkového objektového modelu (TOM) alebo pomocou nástroja tretej strany. Tabuľku faktov môžete napríklad rozdeliť tak, aby sa prevažná časť údajov nachádzala v sklade údajov, zatiaľ čo sa importuje len zlomok najnovších údajov. Tento prístup môže pomôcť optimalizovať výkon, ak vo veľkej časti týchto údajov ide o historické údaje, ku ktorým sa občas pristupuje. Hybridná tabuľka môže mať viacero oblastí importu, ale len jednu oblasť DirectQuery.