Opplæring: Bruke en notatblokk med Apache Spark til å spørre en KQL-database

Viktig

Microsoft Fabric er for øyeblikket i FORHÅNDSVERSJON. Denne informasjonen er knyttet til et forhåndsutgitt produkt som kan endres vesentlig før det utgis. Microsoft gir ingen garantier, uttrykt eller underforstått, med hensyn til informasjonen som er oppgitt her.

Notatblokker er både lesbare dokumenter som inneholder beskrivelser av dataanalyse og resultater samt kjørbare dokumenter som kan kjøres for å utføre dataanalyse. I denne artikkelen lærer du hvordan du bruker en Microsoft Fabric-notatblokk til å lese og skrive data til en KQL-database ved hjelp av Apache Spark. Denne opplæringen bruker forhåndsopprettede datasett og notatblokker i både sanntidsanalyse og datateknikkmiljøer i Microsoft Fabric. Hvis du vil ha mer informasjon om notatblokker, kan du se Slik bruker du Microsoft Fabric-notatblokker.

Nærmere bestemt lærer du hvordan du:

  • Opprette en KQL-database
  • Importere en notatblokk
  • Skrive data til en KQL-database ved hjelp av Apache Spark
  • Spør etter data fra en KQL-database

Forutsetninger

1- Opprette en KQL-database

  1. Åpne opplevelsesbryteren nederst i navigasjonsruten, og velg Sanntidsanalyse.

  2. Velg KQL-databaseflisen (forhåndsvisning ).

    Skjermbilde av ny KQL-databaseflis i Real-Time Analytics.

  3. Skriv inn nycGreenTaxi i navnefeltet for KQL-database, og velg deretter Opprett.

    KQL-databasen er nå opprettet i konteksten til det valgte arbeidsområdet.

  4. Kopier spørrings-URI-en fra kortet med databasedetaljer på databaseinstrumentbordet, og lim den inn et sted, for eksempel en notisblokk, for å bruke den i et senere trinn.

     Skjermbilde av kortet med databasedetaljer som viser databasedetaljene. URI-alternativet for spørring med tittelen Kopier URI er uthevet.

2- Last ned NYC GreenTaxi notatblokk

Vi har opprettet en eksempelnotatblokk som tar deg gjennom alle nødvendige trinn for å laste inn data i databasen ved hjelp av Spark-koblingen.

  1. Åpne Fabric-eksemplerepositoriet på GitHub for å laste ned NYC GreenTaxi KQL-notatblokken..

    Skjermbilde av GitHub-repositorium som viser NYC GreenTaxi-notatblokken. Raw-alternativet er uthevet.

  2. Lagre notatblokken lokalt på enheten.

    Obs!

    Notatblokken må lagres i filformatet .ipynb .

3- Importere notatblokken

Resten av denne arbeidsflyten forekommer i datateknikkdelen av produktet, og bruker en Spark-notatblokk til å laste inn og spørre etter data i KQL-databasen.

  1. Åpne opplevelsesbryteren nederst i navigasjonsruten, og velg Datateknikk.

  2. Velg Importer notatblokk.

    Skjermbilde av elementalternativer i Datateknikk. Elementet med tittelen Importer notatblokk er uthevet.

  3. Velg Last opp i vinduet Importer status.

    Skjermbilde av vinduet Importer status. Knappen med tittelen Last opp er uthevet.

  4. Velg NYC GreenTaxi-notatblokken du lastet ned i et tidligere trinn.

  5. Når importen er fullført, går du tilbake til arbeidsområdet for å åpne notatblokken.

4- Hent data

Hvis du vil spørre databasen ved hjelp av Spark-koblingen, må du gi lese- og skrivetilgang til BLOB-beholderen NYC GreenTaxi.

Velg avspillingsknappen for å kjøre følgende celler, eller merk cellen og trykk SKIFT+ENTER. Gjenta dette trinnet for hver kodecelle.

Obs!

Vent til fullføringsmerket vises før du kjører neste celle.

  1. Kjør følgende celle for å aktivere tilgang til NYC GreenTaxi blob-beholderen.

    Skjermbilde av første kodecelle som viser informasjon om lagringstilgang.

  2. Lim inn spørrings-URI-en som du kopierte tidligere i stedet for plassholderteksten, i KustoURI.

  3. Endre navnet på plassholderdatabasen til nycGreenTaxi.

  4. Endre navnet på plassholdertabellen til GreenTaxiData.

    Skjermbilde av andre kodecelle som viser informasjon om måldatabasen. Spørrings-URI-en, databasenavnet og tabellnavnet er uthevet.

  5. Kjør cellen.

  6. Kjør den neste cellen for å skrive data til databasen. Det kan ta noen minutter før dette trinnet fullføres.

    Skjermbilde av tredje kodecelle som viser tabelltilordnings- og inntakskommando.

Databasen har nå data lastet inn i en tabell kalt GreenTaxiData.

5– Kjør notatblokken

Kjør de resterende to cellene sekvensielt for å spørre etter data fra tabellen. Resultatene viser de 20 høyeste og laveste drosjetakstene og avstandene registrert etter år.

Skjermbilde av fjerde og femte kodecelle som viser spørringsresultatene.

6- Rydd opp ressurser

Rydd opp i elementene som ble opprettet ved å gå til arbeidsområdet de ble opprettet i.

  1. Hold pekeren over notatblokken du vil slette, i arbeidsområdet, velg Mer-menyen [...] >Slett.

    Skjermbilde av arbeidsområdet som viser rullegardinmenyen i NYC GreenTaxi-notatblokken. Alternativet Slett er uthevet.

  2. Velg Slett. Du kan ikke gjenopprette notatblokken når du sletter den.

Neste trinn