Opplæring: Bruke en notatblokk med Apache Spark til å spørre en KQL-database
Viktig
Microsoft Fabric er for øyeblikket i FORHÅNDSVERSJON. Denne informasjonen er knyttet til et forhåndsutgitt produkt som kan endres vesentlig før det utgis. Microsoft gir ingen garantier, uttrykt eller underforstått, med hensyn til informasjonen som er oppgitt her.
Notatblokker er både lesbare dokumenter som inneholder beskrivelser av dataanalyse og resultater samt kjørbare dokumenter som kan kjøres for å utføre dataanalyse. I denne artikkelen lærer du hvordan du bruker en Microsoft Fabric-notatblokk til å lese og skrive data til en KQL-database ved hjelp av Apache Spark. Denne opplæringen bruker forhåndsopprettede datasett og notatblokker i både sanntidsanalyse og datateknikkmiljøer i Microsoft Fabric. Hvis du vil ha mer informasjon om notatblokker, kan du se Slik bruker du Microsoft Fabric-notatblokker.
Nærmere bestemt lærer du hvordan du:
- Opprette en KQL-database
- Importere en notatblokk
- Skrive data til en KQL-database ved hjelp av Apache Spark
- Spør etter data fra en KQL-database
Forutsetninger
- Et arbeidsområde med en Microsoft Fabric-aktivert kapasitet
1- Opprette en KQL-database
Åpne opplevelsesbryteren nederst i navigasjonsruten, og velg Sanntidsanalyse.
Velg KQL-databaseflisen (forhåndsvisning ).
Skriv inn nycGreenTaxi i navnefeltet for KQL-database, og velg deretter Opprett.
KQL-databasen er nå opprettet i konteksten til det valgte arbeidsområdet.
Kopier spørrings-URI-en fra kortet med databasedetaljer på databaseinstrumentbordet, og lim den inn et sted, for eksempel en notisblokk, for å bruke den i et senere trinn.
2- Last ned NYC GreenTaxi notatblokk
Vi har opprettet en eksempelnotatblokk som tar deg gjennom alle nødvendige trinn for å laste inn data i databasen ved hjelp av Spark-koblingen.
Åpne Fabric-eksemplerepositoriet på GitHub for å laste ned NYC GreenTaxi KQL-notatblokken..
Lagre notatblokken lokalt på enheten.
Obs!
Notatblokken må lagres i filformatet
.ipynb
.
3- Importere notatblokken
Resten av denne arbeidsflyten forekommer i datateknikkdelen av produktet, og bruker en Spark-notatblokk til å laste inn og spørre etter data i KQL-databasen.
Åpne opplevelsesbryteren nederst i navigasjonsruten, og velg Datateknikk.
Velg Importer notatblokk.
Velg Last opp i vinduet Importer status.
Velg NYC GreenTaxi-notatblokken du lastet ned i et tidligere trinn.
Når importen er fullført, går du tilbake til arbeidsområdet for å åpne notatblokken.
4- Hent data
Hvis du vil spørre databasen ved hjelp av Spark-koblingen, må du gi lese- og skrivetilgang til BLOB-beholderen NYC GreenTaxi.
Velg avspillingsknappen for å kjøre følgende celler, eller merk cellen og trykk SKIFT+ENTER. Gjenta dette trinnet for hver kodecelle.
Obs!
Vent til fullføringsmerket vises før du kjører neste celle.
Kjør følgende celle for å aktivere tilgang til NYC GreenTaxi blob-beholderen.
Lim inn spørrings-URI-en som du kopierte tidligere i stedet for plassholderteksten, i KustoURI.
Endre navnet på plassholderdatabasen til nycGreenTaxi.
Endre navnet på plassholdertabellen til GreenTaxiData.
Kjør cellen.
Kjør den neste cellen for å skrive data til databasen. Det kan ta noen minutter før dette trinnet fullføres.
Databasen har nå data lastet inn i en tabell kalt GreenTaxiData.
5– Kjør notatblokken
Kjør de resterende to cellene sekvensielt for å spørre etter data fra tabellen. Resultatene viser de 20 høyeste og laveste drosjetakstene og avstandene registrert etter år.
6- Rydd opp ressurser
Rydd opp i elementene som ble opprettet ved å gå til arbeidsområdet de ble opprettet i.
Hold pekeren over notatblokken du vil slette, i arbeidsområdet, velg Mer-menyen [...] >Slett.
Velg Slett. Du kan ikke gjenopprette notatblokken når du sletter den.