Få strømming av data til lakehouse og tilgang med SQL-endepunkt
Denne hurtigstarten forklarer hvordan du oppretter en Spark Job Definition som inneholder Python-kode med Spark Structured Streaming for å lande data i et lakehouse, og deretter betjener det gjennom et SQL-endepunkt. Når du har fullført hurtigstarten, har du en Spark-jobbdefinisjon som kjører kontinuerlig, og SQL-endepunktet kan vise innkommende data.
Viktig
Microsoft Fabric er i forhåndsversjon.
Opprette et Python-skript
Bruk følgende Python-kode som bruker Spark-strukturert strømming til å hente data i en lakehouse-tabell.
Lagre skriptet som Python-fil (PY) på den lokale datamaskinen.
Opprett et innsjøhus
Bruk følgende fremgangsmåte for å opprette et lakehouse:
Velg Synapse Data Engineering-opplevelsen i Microsoft Fabric.
Naviger til ønsket arbeidsområde, eller opprett et nytt om nødvendig.
Hvis du vil opprette et lakehouse, velger du Lakehouse-ikonet under Ny-delen i hovedruten.
Skriv inn navnet på lakehouse, og velg Opprett.
Opprett en spark-jobbdefinisjon
Bruk følgende fremgangsmåte for å opprette en Spark-jobbdefinisjon:
Velg Opprett-ikonet fra menyen til venstre fra det samme arbeidsområdet der du opprettet et innsjøhus.
Velg Spark-jobbdefinisjon under Datateknikk.
Skriv inn navnet på Spark-jobbdefinisjonen, og velg Opprett.
Velg Last opp , og velg Python-filen du opprettet i forrige trinn.
Velg lakehouse du opprettet under Lakehouse Reference .
Angi policy for nytt forsøk for Spark-jobbdefinisjon
Bruk følgende fremgangsmåte for å angi policyen for nye forsøk for Spark-jobbdefinisjonen:
Velg Innstilling-ikonet fra den øverste menyen.
Åpne fanen Optimalisering , og angi utløseren Prøv policy på nytt.
Definer maksimalt antall forsøk på nytt, eller merk av for Tillat ubegrensede forsøk.
Angi tid mellom hvert forsøk på nytt, og velg Bruk.
Utfør og overvåk spark-jobbdefinisjonen
Velg Kjør-ikonet fra den øverste menyen.
Kontroller om Spark Job-definisjonen ble sendt inn og kjører.
Vise data ved hjelp av et SQL-endepunkt
Velg Lakehouse i arbeidsområdevisning.
Velg Lakehouse fra høyre hjørne, og velg SQL-endepunkt.
Velg tabellen som skriptet bruker til å lande data, i SQL-endepunktvisningen under Tabeller. Deretter kan du forhåndsvise dataene fra SQL-endepunktet.