Power BI:n käyttöskenaariot: Omatoiminen tietojen valmistelu

Muistiinpano

Tämä artikkeli on osa Power BI:n käyttöönoton suunnittelun artikkelisarjaa. Tässä sarjassa keskitytään ensisijaisesti Power BI -kuormitukseen Microsoft Fabricissa. Johdanto sarjaan on artikkelissa Power BI:n käyttöönoton suunnittelu.

Tietojen valmistelu (kutsutaan joskus nimellä ETL, joka on lyhenne poiminnalle , muuntamielle ja lataamiselle) edellyttää usein merkittävää työmäärää lähdetietojen laadun ja rakenteen mukaan. Omatoiminen tietojen valmistelun käyttöskenaario keskittyy yritysanalyytikoiden tietojen valmistelutoimintojen uudelleenkäytettävyyteen. Se saavuttaa tämän uudelleenkäytettävyyden tavoitteen siirtämällä tietojen valmistelutyön Power Querystä (yksittäisissä Power BI Desktop -tiedostoissa) Power Query Onlineen (Power BI -tietovuon avulla). Logiikan keskittäminen auttaa yhden totuuden lähteen saavuttamisessa ja vähentää muiden sisällöntekijöiden tarvitsemaa työmäärää.

Tietovuot luodaan Power Query Onlinen avulla käyttäen jotakin monista työkaluista: Power BI -palvelu, Power Appsia tai Dynamics 365 Customer Insightsia. Power BI:ssä luotua tietovuota kutsutaan analyyttiseksi tietovuohksi. Power Appsissa luodut tietovuot voivat olla joko kaksi tyyppiä: vakiomuotoisia tai analyyttisia. Tämä skenaario kattaa vain Power BI -palvelu luodun ja hallinnoidun Power BI -tietovuon käytön.

Muistiinpano

Omatoiminen tietojen valmisteluskenaario on yksi omatoimisen BI:n skenaarioista. Täydellinen luettelo omatoimisista skenaarioista on Artikkelissa Power BI:n käyttöskenaariot .

Sisältöyhteistyö- ja toimitusskenaarioita käsittelevässä aiheessa kuvattuja näkökohtia ei käsitellä nyt tässä artikkelissa. Lue lisätietoja näistä artikkeleista ensin.

Skenaariokaavio

Seuraavassa kaaviossa esitetään korkean tason yleiskatsaus yleisimpiin käyttäjän toimintoihin ja Power BI -komponentteihin, jotka tukevat omatoimista tietojen valmistelua. Ensisijaisena painopisteenä on luoda Power Query Onlinessa tietovuo, josta tulee useiden semanttisten mallien (aiemmin tietojoukkoina) tietolähde. Tavoitteena on, että monet semanttiset mallit hyödyntävät tietovuon kerran tekemää tietojen valmistelua.

Diagram shows self-service data preparation, which is about dataflows for centralizing data cleansing and transformation work. Items in the diagram are described in the table below.

Vihje

Suosittelemme lataamaan skenaariokaavion , jos haluat upottaa sen esitykseen, dokumentaatioon tai blogikirjoitukseen tai tulostaa sen seinäjulisteena. Koska kyseessä on SVG-kuva, voit skaalata sitä ylös- tai alaspäin ilman laadun heikkenemistä.

Skenaariokaaviossa esitetään seuraavat käyttäjän toiminnot, työkalut ja ominaisuudet:

Kohde Kuvaus
Item 1. Tietovuon tekijä kehittää kokoelman Power BI - tietovuon taulukoita. Uudelleenkäyttöön tarkoitetulle tietovuohlle on yleistä (mutta ei pakollista), että tekijä kuuluu keskitettyyn tiimiin, joka tukee organisaation ylittämiä käyttäjiä (kuten IT, yritys-BI tai Center of Excellence).
Item 2. Tietovuo muodostaa yhteyden yhden tai useamman tietolähteen tietoihin.
Item 3. Jotkin tietolähteet saattavat edellyttää paikallista tietoyhdyskäytävää tai VNet-yhdyskäytävää tietojen päivittämiseen, kuten yksityisessä organisaatioverkossa sijaitsevat tietolähteet. Näitä yhdyskäytäviä käytetään sekä tietovuon muokkaamiseen Power Query Onlinessa, joka on Power Queryn verkkopohjainen versio, että tietovuon päivittämiseen.
Item 4. Tietovuot kehitetään käyttämällä Power Query Onlinea. Power Query Onlinen tuttu Power Query -liittymä tekee power BI Desktopista siirtymisen yksinkertaiseksi.
Item 5. Tietovuo tallennetaan tietovoiden tallentamiseen ja suojaamiseen tarkoitetussa työtilassa kohteena. Tietovuon päivitysaikataulu vaaditaan, jotta tiedot pysyvät ajan tasalla (tätä ei kuvata skenaariokaaviossa).
Item 6. Sisällöntuottajat ja muut semanttiset mallit voivat käyttää tietovuota uudelleen tietolähteenä. Ne voivat sijaita eri työtiloissa.
Item 7. Semanttisen mallin tekijä kehittää uuden tietomallin Power BI Desktopin avulla. Semanttisen mallin tekijä voi käyttää Power Queryn kaikkia ominaisuuksia Power BI Desktopissa. He voivat halutessaan käyttää muita kyselyvaiheita tietovuon tietojen muuntamiseen tai tietovuon tuloksen yhdistämiseen.
Item 8. Kun semanttinen mallin tekijä on valmis, se julkaisee tietomallin sisältävän Power BI Desktop -tiedoston (.pbix) Power BI -palvelu. Semanttisen mallin päivitystä hallitaan erillään tietovuosta (ei esitetty skenaariokaaviossa).
Item 9. Muut omatoimisen semanttisen mallin luojat voivat luoda uusia tietomalleja Power BI Desktopissa käyttämällä tietovuota tietolähteenä.
Item 10. Hallinta-portaalissa Power BI -järjestelmänvalvojat voivat määrittää Azure-yhteyksiä tietovuon tietojen tallentamiseksi Azure Data Lake Tallennus Gen2 (ADLS Gen2) -tililleen. Asetukset ovat muun muassa vuokraajatason tallennustilin määrittäminen ja työtilatason tallennuskäyttöoikeuksien käyttöönotto.
Item 11. Power BI -järjestelmänvalvojat hallitsevat asetuksia Hallinta portaalissa.
Item 12. Tietovuot tallentavat oletusarvoisesti tiedot sisäiseen tallennustilaan, jota Power BI -palvelu hallitsee. Vaihtoehtoisesti tietovuon antamat tiedot voidaan tallentaa organisaation ADLS Gen2 -tilille. Tällaista tallennustilaa kutsutaan joskus Bring Your Own Data Lake -tallennustilaksi. Tietovuotietojen tallennuksen etuna Data Lake -tallennustilassa on, että sitä voidaan käyttää ja käyttää muilla BI-työkaluilla.
Item 13. ADLS Gen2:n tietovuotiedot tallennetaan Power BI -kohtaiseen säilöön, joka tunnetaan tiedostojärjestelmänä. Tässä säilössä on kansio kullekin työtilalle. Kullekin tietovuohlle sekä kullekin taulukolle luodaan alikansio. Power BI luo tilannevedoksen aina, kun tietovuon tiedot päivitetään. Tilannevedokset ovat kuvaavia ja sisältävät metatietoja ja datatiedostoja.
Item 14. Azure-järjestelmänvalvojat hallitsevat organisaation ADLS Gen2 -tilin käyttöoikeuksia.
Item 15. Power BI -järjestelmänvalvojat valvovat ja valvovat toimintaa Power BI -palvelu.

Vihje

Suosittelemme, että tutustut myös kehittyneeseen tietojen valmistelun käyttöskenaarioon. Se perustuu tässä skenaariossa esiteltyihin käsitteisiin.

Avainasiat

Seuraavassa on joitakin avainkohtia, joita tulee korostaa omatoimista tietojen valmisteluskenaariota varten.

Tietovuot

Tietovuo koostuu kokoelmasta taulukoita (kutsutaan myös entiteeteiksi). Kaikki työn tietovuon luomiseksi tehdään Power Query Onlinessa. Voit luoda tietovoita useissa tuotteissa, kuten Power Appsissa, Dynamics 365 Customer Insightsissa ja Power BI:ssä.

Muistiinpano

Et voi luoda tietovoita henkilökohtaisessa työtilassa Power BI -palvelu.

Semanttisten mallien luojien tuki

Skenaariokaaviossa kuvataan valmisteltujen tietojen tarjoaminen muille semanttisten mallien tekijöille Power BI -tietovuon avulla.

Muistiinpano

Semanttinen malli käyttää tietovuota tietolähteenä. Raportti ei voi muodostaa yhteyttä suoraan tietovuohon.

Seuraavassa on joitakin Power BI -tietovoiden käytön etuja:

  • Semanttisten mallien tekijät käyttävät samaa tuttua Power Query -käyttöliittymää, joka löytyy Power BI Desktopista.
  • Tietovuon määrittämää tietojen valmistelun ja tietojen muunnoksen logiikkaa voidaan käyttää uudelleen monta kertaa, koska se on keskitetty.
  • Kun tietovuohon tehdään tietojen valmistelulogiikan muutoksia, riippuvaisten tietomallien päivittäminen ei välttämättä ole välttämätöntä. Sarakkeiden poistaminen tai uudelleennimeäminen tai sarakkeen tietotyyppien muuttaminen edellyttää riippuvaisten tietomallien päivittämistä.
  • Esivalmistetut tiedot voidaan helposti tuoda Power BI:n semanttisten mallien luojien saataville. Uudelleenkäyttö on erityisen hyödyllistä usein käytetyille taulukoille, erityisesti dimensiotaulukoille, kuten päivämäärälle, asiakkaalle ja tuotteelle.
  • Semanttisten mallien luojien vaatima työmäärä vähenee, koska tietojen valmistelutyö on eroteltu tietojen mallinnustyöstä.
  • Vähemmän semanttisia mallin tekijöitä tarvitsee suoran pääsyn lähdejärjestelmiin. Lähdejärjestelmät voivat olla kyselyitä varten monimutkaisia ja ne voivat vaatia erityisiä käyttöoikeuksia.
  • Lähdejärjestelmissä suoritettujen päivitysten määrä pienenee, koska semanttiset mallipäivitykset muodostavat yhteyden tietovoihin eivätkä lähdejärjestelmiin, joista tietovuot poimivat tietoja.
  • Tietovuon tiedot edustavat ajallisen tilannevedoksen tilannevedosta, ja ne edistävät johdonmukaisuutta useiden semanttisten mallien käytössä.
  • Tietojen valmistelulogiikan erottaminen tietovoihin voi auttaa parantamaan semanttisen mallin päivityksen onnistumista. Jos tietovuon päivitys epäonnistuu, semanttiset mallit päivitetään käyttämällä viimeisintä onnistunutta tietovuon päivitystä.

Vihje

Luo tietovuotaulukoita tähtirakenteen suunnitteluperiaatteiden avulla. Tähtirakenne sopii hyvin Power BI:n semanttisten mallien luomiseen. Tarkenna myös tietovuon tulostetta käyttääksesi kutsumanimiä ja käyttääksesi tiettyjä tietotyyppejä. Nämä tekniikat edistävät riippuvaisten semanttisten mallien johdonmukaisuutta ja auttavat vähentämään semanttisten mallien luojien tekemän työn määrää.

Semanttisen mallin luojan joustavuus

Kun semanttisen mallin tekijä muodostaa yhteyden tietovuohon Power BI Desktopissa, hänen ei tarvitse käyttää tarkkaa tietovuon tulostetta. Niissä on edelleen Power Queryn täydet toiminnot käytettävissään. Tästä toiminnosta on hyötyä, jos tarvitaan lisää tietojen valmistelutyötä tai jos tiedot edellyttävät lisämuunnoksia.

Tietovuon edistyneet ominaisuudet

Tietovoille on useita suunnittelutekniikoita, kuvioita ja parhaita käytäntöjä, jotka voivat viedä niitä omatoimisesti suuryritysvalmiiksi. Työtilan tietovuot, joiden käyttöoikeustila on määritetty käyttäjäkohtainen Premium tai kapasiteettikohtainen Premium, voivat hyötyä lisäominaisuuksista.

Muistiinpano

Yksi lisäominaisuuksista on tietovoiden lisäävä päivitys. Vaikka semanttisten mallien lisäävä päivitys on Power BI Pro -ominaisuus, tietovoiden lisäävä päivitys on Premium-ominaisuus.

Lisätietoja tietovuon edistyneeistä ominaisuuksista on kehittyneessä tietojen valmistelun käyttöskenaariossa.

Tietovuon ja semanttisen mallin päivitys

Kuten aiemmin mainittiin, tietovuo on semanttisten mallien tietojen lähde. Useimmissa tapauksissa siihen liittyy useita tietojen päivittämisen ajoituksia: yksi tietovuolle ja yksi jokaista semanttista mallia varten. Vaihtoehtoisesti on mahdollista käyttää DirectQueryä semanttisesta mallista tietovuohon, joka on Premium-ominaisuus (jota ei kuvata skenaariokaaviossa).

Azure Data Lake Storage Gen2

Microsoft Azuressa ADLS Gen2 -tili on tietyntyyppinen Azure-tallennus tili, jolla hierarkkinen nimitila on käytössä. ADLS Gen2:lla on suorituskyky-, hallinta- ja tietoturvaetuja analyyttisten kuormitusten käyttämisessä. Oletusarvoisesti Power BI -tietovuot käyttävät sisäistä tallennustilaa, joka on Power BI -palvelu hallitsema sisäinen Data Lake -tili. Vaihtoehtoisesti organisaatiot voivat tuoda oman Data Lake -tallennustilansa muodostamalla yhteyden organisaationsa ADLS Gen2 -tiliin.

Seuraavassa on joitakin etuja organisaation Data Lake -tilin käytölle:

  • Muut käyttäjät tai prosessit voivat (valinnaisesti) käyttää Power BI -tietovuon tallentamia tietoja Data Lake -tallennustilasta. Siitä on hyötyä, kun tietovuon uudelleenkäyttö tapahtuu Power BI:n ulkopuolella. Tietoja voi esimerkiksi käyttää Azure Data Factoryssa.
  • Data Lake -tallennustilan tietoja voidaan (valinnaisesti) hallita muilla työkaluilla tai järjestelmillä. Tässä tapauksessa Power BI voi käyttää tietoja sen hallinnan sijaan (tätä ei kuvata skenaariokaaviossa).

Vuokraajatason tallennustila

Hallinta -portaalin Azure-yhteydet-osiossa on asetus, jolla määritetään yhteys ADLS Gen2 -tiliin. Tämän asetuksen määrittäminen mahdollistaa oman Data Lake -tallennustilan tuomisen. Kun asetus on määritetty, voit määrittää työtilat käyttämään kyseistä Data Lake -tiliä.

Tärkeä

Azure-yhteyksien määrittäminen ei tarkoita sitä, että kaikki Power BI -vuokraajan tietovuot tallennetaan oletusarvoisesti tälle tilille. Jotta voit käyttää eksplisiittistä tallennustiliä (sisäisen tallennustilan sijaan), jokaisen työtilan on oltava yhdistetty erityisesti.

On tärkeää määrittää työtilan Azure-yhteydet ennen tietovoiden luomista työtilassa. Samaa Azure-tallennustiliä käytetään Power BI:n semanttisen mallin varmuuskopioinnissa.

Työtilatason tallennustila

Power BI -järjestelmänvalvoja voi määrittää asetuksen, joka sallii työtilatason tallennusoikeudet (Hallinta-portaalin Azure-yhteydet-osassa). Kun asetus on käytössä, työtilan järjestelmänvalvojat voivat käyttää eri tallennustiliä kuin vuokraajatasolla määritetty tili. Tämän asetuksen käyttöönotto on erityisen hyödyllistä hajautetuille liiketoimintayksiköille, jotka hallitsevat omaa Data Lake -tallennustilaansa Azuressa.

Muistiinpano

Hallinta-portaalin työtilatason tallennusoikeus koskee kaikkia Power BI -vuokraajan työtiloja.

Common Data Model -muoto

ADLS Gen2 -tilin tiedot tallennetaan Common Data Model (CDM) -rakenteeseen. CDM-rakenne on metatietomuoto, joka määrää, miten kuvaava rakenne ja tiedot tallennetaan. CDM-rakenne mahdollistaa semanttisen yhdenmukaisuuden muodossa, joka on standardoitu tietojen jakamiseksi useissa sovelluksissa (ei esitetty skenaariokaaviossa).

Julkaise erillisiin työtiloihin

Tietovuon julkaisemisessa työtilaan , joka on erillään riippuvaisten semanttisten mallien tallennuspaikasta, on monia etuja. Yksi etu on selkeys siihen, kuka vastaa minkäkin sisältötyypin hallinnasta (jos eri vastuualueet on sinulla eri henkilöillä). Toinen etu on se, että kullekin sisältötyypille voidaan määrittää tietyt työtilan käyttöoikeudet.

Muistiinpano

Et voi luoda tietovoita henkilökohtaisessa työtilassa Power BI -palvelu.

Kehittynyt tietojen valmistelun käyttöskenaario kuvaa, miten voit määrittää useita työtiloja entistä joustavammiksi, kun tuetaan yritystason omatoimisia luojia.

Yhdyskäytävän asennus

Yleensä paikallista tietoyhdyskäytävää tarvitaan muodostettaessa yhteyttä tietolähteisiin, jotka sijaitsevat yksityisessä organisaatioverkossa tai näennäisverkossa.

Tietoyhdyskäytävää tarvitaan, kun

  • Tietovuon luominen Power Query Onlinessa, joka muodostaa yhteyden yksityisiin organisaation tietoihin.
  • Päivitetään tietovuo, joka muodostaa yhteyden yksityisiin organisaation tietoihin.

Vihje

Tietovuot edellyttävät keskitettyä tietoyhdyskäytävää vakiotilassa. Henkilökohtaisessa tilassa olevia yhdyskäytäviä ei tueta tietovoita käsiteltäessä.

Järjestelmän valvonta

Toimintoloki kirjaa käyttäjän toimet, jotka tapahtuvat Power BI -palvelu. Power BI -järjestelmänvalvojat voivat käyttää toimintolokitietoja, jotka kerätään valvonnan suorittamiseen, jotta he ymmärtävät käyttötavat ja käyttöönoton. Toimintaloki on arvokas myös hallintotoimien, suojausvalvontaen ja vaatimustenmukaisuusvaatimusten tukemisen kannalta. Omatoimisissa tietojen valmisteluskenaariossa on erityisen hyödyllistä seurata tietovoiden käyttöä.

Sarjan seuraavassa artikkelissa on tietoja kehittyneestä tietojen valmistelun käyttöskenaariota.