Jaa


Opetusohjelma: Tietojen analysointi muistikirjalla

Koskee: SQL-analytiikan päätepiste ja Microsoft Fabric -varasto

Tässä opetusohjelmassa on tietoja siitä, miten voit tallentaa tiedot kerran ja käyttää niitä sitten monissa muissa palveluissa. Pikakuvakkeita voidaan luoda myös Azure Data Lake Storageen ja S3:een tallennettuihin tietoihin, jotta voit käyttää suoraan ulkoisten järjestelmien delta-taulukoita.

Luo lakehouse

Ensin luomme uuden Lakehousen. Luo uusi Lakehouse Microsoft Fabric -työtilaan seuraavasti:

  1. Valitse Data Warehouse Tutorial työtila siirtymisvalikosta.

  2. Valitse + Uusi>Lakehouse.

    Näyttökuva Fabric-portaalista, jossa näkyy + Uusi -valikko. Lakehouse on punaisessa laatikossa.

  3. Kirjoita Nimi-kenttään ShortcutExerciseja valitse Luo.

    Kangasportaalin näyttökuva, jossa näkyy uuden Lakehousen nimikenttä. Annettu nimi on ShortcutExercise.

  4. Uusi Lakehouse-tallennustila latautuu, ja Explorer-näkymä avautuu . Hae tiedot -valikko on lakehouse-valikossa . Valitse Lataa tiedot Lakehousessa - kohdassa Uusi pikakuvake -painike.

    Kangasportaalin näyttökuva, jossa näkyy Lataustiedot Lakehouse-valikossa aloitussivulla. Uusi pikakuvake -painike on ruudussa punaisella.

  5. Valitse Uusi pikakuvake -ikkunassa Microsoft OneLake -painike.

    Kangasportaalin näyttökuva, jossa näkyy Uusi pikakuvake -ikkuna. Microsoft OneLake -painike on ruudussa punaisena.

  6. Selaa Valitse tietolähdetyyppi -ikkunassa luetteloa, kunnes löydät aiemmin luomasi varaston WideWorldImporters. Valitse se ja valitse sitten Seuraava.

  7. Laajenna OneLake-objektiselaimessa Taulukot-kohta, laajenna dbo rakennetta ja valitse sitten -valintanappi dimension_customer. Valitse Luo-painike.

    Kangasportaalin näyttökuva, jossa näkyy OneLake-objektiselain. WideWorldImporters, Tables, dbo -kohdan alla dimension_customer on punaisella muotoiltuna.

  8. Jos näet Kansion nimeltä Unidentified Taulukot-kohdassa, valitse Päivitä-kuvake vaakasuuntaisesta valikkorivistä.

    Näyttökuva Fabric-portaalista, jossa näkyy päivityspainike vaakasuuntaisella valikkorivillä ja Tunnistamattomat taulukot ShortcutExercise-kohdassa Lakehouse Explorerissa.

  9. dimension_customer Esikatsele tietoja valitsemalla Taulukko-luettelosta. Lakehouse näyttää tiedot taulukosta dimension_customer , varastosta!

    Fabric-portaalin näyttökuva, joka näyttää dimension_customer-taulukon tietojen esikatselun.

  10. Luo seuraavaksi uusi muistikirja, jossa taulukkoa kyselevät dimension_customer . Valitse Aloitus-valintanauhasta Avoin muistikirja -avattava valikko ja valitse Uusi muistikirja.

    Kangasportaalin näyttökuva, jossa näkyy Avoin muistikirja -painike painettuna ja Uusi muistikirja -vaihtoehto valittuna.

  11. Valitse ja vedä sitten Taulukot-luettelosta dimension_customer avoimen muistikirjan soluun. Näet, että PySpark-kysely on kirjoitettu, jotta voit kysellä kaikkia tietoja kohteesta ShortcutExercise.dimension_customer. Tämä muistikirjakokemus muistuttaa Visual Studio Code Jupyter -muistikirjakokemusta. Voit myös avata muistikirjan VS Codessa.

    Näyttökuva Fabric-portaalin muistikirjanäkymästä. Nuoli osoittaa polun, dimension_customer valitaan ja sitten vedetään ja pudotetaan avoimen muistikirjan soluun.

  12. Valitse Aloitus-valintanauhasta Suorita kaikki -painike. Kun kysely on valmis, näet, että voit käyttää PySparkia helposti kyselyn suorittamiseen Varasto-taulukoille.

    Fabric-portaalin näyttökuva, joka näyttää muistikirjan suorittamisen tulokset dimension_customer tietojen näyttämiseksi.

Seuraava vaihe