Použitie prírastkového obnovenia s tokmi údajov

Pomocou tokov údajov môžete preniesť veľké množstvo údajov do ukladacieho priestoru služby Power BI alebo do poskytnutého úložiska organizácie. V niektorých prípadoch však nie je praktické aktualizovať úplnú kópiu zdrojových údajov v každom obnovení. Dobrou alternatívou je prírastkové obnovenie, ktoré poskytuje pre toky údajov nasledujúce výhody:

  • Obnovenie je rýchlejšie: Iba údaje, ktoré sa zmenia, je potrebné obnoviť. Obnoví sa napríklad len posledných päť dní 10-ročného toku údajov.
  • Obnovenie je spoľahlivejšie: Nie je napríklad potrebné udržiavať dlhodobé pripojenia k nestálym zdrojovým systémom.
  • Spotreba zdroja je znížená: Vďaka menšiemu počtu údajov na obnovu sa znižuje celková spotreba pamäte a ďalších zdrojov.

Prírastkové obnovenie je k dispozícii v tokoch údajov vytvorených v službe Power BI a tokoch údajov vytvorených v službe Power Apps. Tento článok uvádza obrazovky zo služby Power BI, tieto pokyny sa však vzťahujú na toky údajov vytvorené v službe Power BI alebo službe Power Apps.

Poznámka

Pri zmene schémy tabuľky v analytickom toku údajov sa vykoná úplné obnovenie, aby sa zabezpečilo, že všetky výsledné údaje zodpovedajú novej schéme. V dôsledku toho sa všetky údaje uložené prírastkovo obnovujú a v niektorých prípadoch, ak zdrojový systém neuchová historické údaje, sa stratia.

Prírastkové obnovenie pre toky údajov.

Použitie prírastkového obnovenia v tokoch údajov vytvorených v službe Power BI vyžaduje, aby sa tok údajov nachádzal v pracovnom priestore v kapacite Premium. Prírastkové obnovenie v službe Power Apps vyžaduje plány služby Power Apps pre jednotlivé aplikácie alebo plány pre jednotlivých používateľov a je k dispozícii len pre toky údajov so službou Azure Data Lake Storage ako cieľom.

V službe Power BI alebo Power Apps vyžaduje použitie prírastkového obnovenia, aby zdrojové údaje presunuté do toku údajov mali pole dátumu a času, podľa ktorého sa môže filtrovať prírastkové obnovenie.

Konfigurácia prírastkového obnovenia pre toky údajov

Tok údajov môže obsahovať mnoho tabuliek. Prírastkové obnovenie je nastavené na úrovni tabuľky, vďaka čomu môže jeden tok údajov držať ako úplne obnovené tabuľky, tak aj prírastkovo obnovené tabuľky.

Ak chcete nastaviť prírastkovú obnovenú tabuľku, začnite s konfiguráciou tabuľky tak, ako by ste začali s akoukoľvek inou tabuľkou.

Po vytvorení a uložení toku údajov vyberte položku Prírastkové obnoveniePrírastkové obnovenie. v zobrazení tabuľky, ako je to znázornené na nasledujúcom obrázku.

Ikona prírastkového obnovenia pre toky údajov.

Keď vyberiete ikonu, zobrazí sa okno Nastavenie prírastkového obnovenia. Zapnutie prírastkového obnovenia.

Prírastkové obnovenie pre toky údajov.

Nasledujúci zoznam vysvetľuje nastavenia v okne Nastavenia prírastkového obnovenia.

  • Zapnutie/vypnutie prírastkového obnovenia: Pre tabuľku zapne alebo vypne politiku prírastkového obnovenia.

  • Rozbaľovací zoznam poľa filtra: vyberie pole dotazu, podľa ktorého by sa tabuľka mala filtrovať pre prírastky. Toto pole obsahuje iba polia dátumu a času. Prírastkové obnovenie nie je možné použiť, ak tabuľka neobsahuje pole Dátum a čas.

    Dôležité

    Vyberte nezmenené pole dátumu pre filter prírastkového obnovenia. Ak sa hodnota poľa zmení (napríklad s dátumom upraveným poľom), môže to viesť k zlyhaniu obnovenia z dôvodu duplicitných hodnôt v údajoch.

  • Riadky s ukladaním a obnovením z minulosti: Príklad na predchádzajúcom obrázku znázorňuje niekoľko nasledujúcich nastavení.

    V tomto príklade definujeme politiku obnovenia tak, aby sa celkovo ukladalo päť rokov údajov a prírastkovo obnovovanie 10 dní údajov. Za predpokladu, že tabuľka sa aktualizuje každý deň, pri každom obnovení sa vykonajú nasledujúce akcie:

    • Pridajte nový deň údajov.

    • Obnoví sa 10 dní do aktuálneho dátumu.

    • Odstránia sa kalendárne roky staršie než päť rokov do aktuálneho dátumu. Ak je napríklad aktuálny dátum 1. januára 2019, rok 2013 sa odstráni.

    Pri prvom obnovení toku údajov môže import celých päť rokov chvíľu trvať, ale je pravdepodobné, že následné obnovenia sa dokončia oveľa rýchlejšie.

  • Zistiť zmeny údajov: Prírastkové obnovenie 10 dní je oveľa efektívnejšie než úplné obnovenie päť rokov, ale pravdepodobne to dokážete ešte lepšie. Začiarknutie políčka Zistiť zmeny údajov vám umožní vybrať stĺpec dátumu a času len na identifikáciu a obnovu dní, počas ktorých došlo k zmene údajov. Predpokladá sa, že takýto stĺpec existuje v zdrojovom systéme, ktorý zvyčajne slúži na účely auditu. Maximálna hodnota tohto stĺpca sa vyhodnotí pre každé obdobie v prírastkovom rozsahu. Ak sa tieto údaje od posledného obnovenia nezmenili, obdobie obnovovať netreba. V uvedenom príklade by to mohlo ešte viac znížiť počet obnovovaných dní z 10 na možno 2.

    Tip

    V aktuálnom návrhu musí byť stĺpec použitý na zisťovanie zmien údajov trvalý a uložený vo vyrovnávacej pamäti. Ak chcete znížiť kardinalitu a spotrebu pamäte, zvážte jednu z nasledujúcich techník:

    • V čase obnovenia zachovajte len maximálnu hodnotu daného stĺpca napríklad pomocou funkcie Power Query.
    • Znížte presnosť na úroveň, ktorá je prijateľná vzhľadom na vaše požiadavky na frekvenciu obnovovania.
  • Obnoviť iba dokončené obdobia: Predstavte si, že máte obnovenie naplánované na spustenie každý deň o 4:00. Ak sa počas prvých štyroch hodín toho dňa v zdrojovom systéme objavia údaje, možno ich nebudete chcieť zohľadniť. Niektoré obchodné metriky, ako sú napríklad barely denne v ropnom a plynárenskom priemysle, nie sú praktické alebo vhodné na zohľadnenie na základe čiastočných dní.

    Ďalším príkladom, kde je vhodné obnoviť iba dokončené obdobia, je obnova údajov z finančného systému. Predstavte si finančný systém, do ktorého sa údaje za predchádzajúci mesiac schvaľia v 12. kalendárny deň v mesiaci. Prírastkový rozsah môžete nastaviť na jeden mesiac a spustenie obnovenia naplánovať na 12. deň v mesiaci. Keď je táto možnosť vybratá, systém obnoví januárové údaje (najnovšie dokončené mesačné obdobie) 12. februára.

Poznámka

Prírastkové obnovenie toku údajov určuje dátumy podľa nasledujúcej logiky: ak je obnovenie naplánované, prírastkové obnovenie pre toky údajov používa časové pásmo definované v politike obnovenia. Ak neexistuje žiadny plán pre obnovenie, prírastkové obnovenie použije čas z počítača, v rámci ktorý je spustené obnovenie.

Po nakonfigurovaní prírastkového obnovenia tok údajov automaticky zmení váš dotaz tak, aby zahrnul filtrovanie podľa dátumu. Ak bol tok údajov vytvorený v službe Power BI, môžete tiež upraviť automaticky generovaný dotaz pomocou rozšíreného editora v doplnku Power Query a vyladiť alebo prispôsobiť obnovenie. Ďalšie informácie o prírastkovom obnovení a o tom, ako funguje, nájdete v nasledujúcich častiach.

Poznámka

Keď upravíte tok údajov, editor Power Query sa pripojí priamo k zdroju údajov a nezobrazí údaje uložené vo vyrovnávacej pamäti alebo vyfiltrované v toku údajov po spracovaní politikou prírastkového obnovenia. Ak chcete skontrolovať údaje uložené vo vyrovnávacej pamäti toku údajov, pripojte sa z aplikácie Power BI Desktop k toku údajov po nakonfigurovaní politiky prírastkového obnovenia a obnovení toku údajov.

Prírastkové obnovenie a prepojené tabuľky vs. vypočítané tabuľky

V prípade prepojených tabuliek prírastkové obnovenie aktualizuje zdrojovú tabuľku. Keďže prepojené tabuľky jednoducho smerujú na pôvodnú tabuľku, prírastkové obnovenie nemá na prepojenú tabuľku žiadny vplyv. Keď sa zdrojová tabuľka obnoví podľa definovanej politiky obnovenia, každá prepojená tabuľka by mala predpokladať, že údaje v zdroji sú obnovené.

Vypočítané tabuľky sú založené na dotazoch spustených v úložisku údajov, čo môže byť ďalší tok údajov. Preto sa vypočítané tabuľky správajú rovnako ako prepojené tabuľky.

Keďže vypočítané tabuľky a prepojené tabuľky sa správajú podobne, požiadavky a konfiguračné kroky sú pre obe rovnaké. Jedným rozdielom je, že pri vypočítaných tabuľkách v určitých konfiguráciách prírastkové obnovenie nemožno spustiť optimalizovaným spôsobom z dôvodu spôsobu vytvorenia oblastí.

Zmena medzi prírastkovým a úplným obnovením

Toky údajov podporujú zmenu politiky obnovenia medzi prírastkovým a úplným obnovením. Keď dôjde k zmene v ľubovoľnom smere (z úplného na prírastkové alebo prírastkové na úplné), zmena ovplyvní tok údajov po ďalšom obnovení.

Pri presunutí toku údajov z úplného obnovenia na prírastkové logika nového obnovenia aktualizuje tok údajov podľa okna obnovenia a prírastok podľa definovania v nastavení prírastkového obnovenia.

Pri presunutí toku údajov z prírastkového na úplné obnovenie sa všetky údaje zozbierané z prírastkového obnovenia prepíšu politikou definovanou v úplnom obnovení. Túto akciu musíte schváliť.

Podpora časového pásma v prírastkovom obnovení

Prírastkové obnovenie toku údajov závisí od času, v ktorom je spustené. Filtrovanie dotazu závisí od dňa, kedy sa spustí.

Na prispôsobenie týchto závislostí a zabezpečenie konzistencie údajov prírastkové obnovenie pre toky údajov implementuje nasledujúcu heuristiku pre scenáre obnovenia :

  • V prípade, že je plánované obnovenie definované v systéme, prírastkové obnovenie použije nastavenia časového pásma z časti plánovaného obnovenia. Tým sa zabezpečí, že obnovenie toku údajov v ľubovoľnom časovom pásme bude vždy v súlade s definíciou systému.

  • Ak nie je definované žiadne plánované obnovenie, toky údajov použijú časové pásmo z počítača používateľa, ktorý vykonáva obnovenie.

Prírastkové obnovenie možno vyvolať aj pomocou rozhraní API. V tomto prípade volanie rozhrania API môže obsahovať nastavenie časového pásma, ktoré sa používa v obnovení. Používanie rozhraní API môže byť užitočné na účely testovania a overenia.

Podrobnosti o implementácii prírastkového obnovenia

Toky údajov používajú vytváranie oblastí na prírastkové obnovenie. Prírastkové obnovenie v tokoch údajov zachová minimálny počet oblastí na splnenie požiadaviek politiky obnovenia. Staré oblastí, ktoré idú mimo rozsahu, sa vyradia, čím sa zachová posuvné okno. Oblasti sa v prípade príležitosti zlúčia a zníži sa celkový počet požadovaných oblastí. Zlepšuje to kompresiu a v niektorých prípadoch to môže zlepšiť výkon dotazu.

V príkladoch v tejto časti je zdieľaná nasledujúca politika obnovenia:

  • Uložiť riadky za posledný 1 štvrťrok
  • Obnoviť riadky za posledných 10 dní
  • Zistiť zmeny údajov = False
  • Obnoviť iba dokončené dni = True

Zlúčené oblasti

V tomto príklade sa oblasti dní automaticky zlúčia na úroveň mesiaca po tom, ako prejdú mimo prírastkového rozsahu. Oblasti v prírastkovom rozsahu je potrebné udržiavať v dennej granularte, aby sa umožnilo obnovenie iba týchto dní. Operácia obnovenia s dátumom spustenia 11. 12. 2016 zlúči dní v novembri, pretože idú mimo prírastkového rozsahu.

Zlúčené oblasti v tokoch údajov.

Zrušenie starých oblastí

Staré oblastí, ktoré idú mimo celkového rozsahu, sa odstránia. Operácia obnovenia s dátumom spustenia 2. 1. 2017 zníži oblasť pre 3. štvrťrok 2016, pretože ide mimo celkového rozsahu.

Zrušiť staré oblasti v tokoch údajov.

Obnovenie po dlhšom zlyhaní

V tomto príklade sa simuluje obnovenie systému po dlhšom zlyhaní. Povedzme, že obnovenie sa nespustí úspešne, pretože uplynula platnosť poverení zdroja údajov, a vyriešenie problému trvá 13 dní. Prírastkový rozsah je len 10 dní.

Ďalšia úspešná operácia obnovenia s dátumom spustenia 15. 1. 2017 potrebuje vypĺňať chýbajúcich 13 dní a obnoviť ich. Je tiež potrebné obnoviť predchádzajúcich deväť dní, pretože neboli obnovené podľa normálneho plánu. Inými slovami, prírastkový rozsah sa zvýši z 10 na 22 dní.

Ďalšia operácia obnovenia s dátumom spustenia 16. 1. 2017 využíva príležitosť na zlúčenie dní v decembri a mesiacov 4. štvrťroka 2016.

Obnovenie po dlhšom zlyhaní v tokoch údajov.

Prírastkové obnovenie toku údajov a množiny údajov

Prírastkové obnovenie toku údajov a prírastkové obnovenie množiny údajov sú navrhnuté tak, aby fungovali v tandeme. Je prijateľné a podporované mať prírastkovo obnovovanú tabuľku v toku údajov úplne načítanom do množiny údajov alebo úplne načítanú tabuľku v toku údajov prírastkovo načítanom do množiny údajov.

Oba prístupy fungujú v nastaveniach obnovenia podľa vašich zadaných definícií. Ďalšie informácie: Prírastkové obnovenie v službe Power BI Premium

Pozrite si tiež

V tomto článku je popísané prírastkové obnovenie pre toky údajov. Tu je niekoľko ďalších článkov, ktoré by mohli byť užitočné:

Ďalšie informácie o Power Query a plánovanom obnovení nájdete v týchto článkoch:

Ďalšie informácie o modeli Common Data Model nájdete v článku s jeho prehľadom: