Quickstart: Få data inn i OneLake

OneLake er den enkelte, enhetlige datalakeen for Microsoft Fabric. Hver Fabric-arbeidsbelastning leser og skriver data gjennom OneLake, så du trenger bare å laste data én gang for å bruke dem overalt. Du kan bringe data inn i OneLake på flere måter:

  • Last opp filer direkte til en hytte ved innsjøen eller et lager.
  • Ta inn data ved å bruke pipelines, dataflyter eller strømmingsopplevelser.
  • Koble til eksterne data ved å bruke snarveier eller speiling.

I denne quickstarten bringer du data inn i OneLake på to måter: du laster opp en CSV-fil til et lakehouse, og du lager en OneLake-snarvei fra et annet lakehouse som peker tilbake til de samme dataene uten å kopiere dem. Når du er ferdig, har du en forespørselsbar Delta-tabell og en snarvei, begge tilgjengelige for alle Fabric-motorer gjennom OneLake.

Forutsetninger

Opprett et innsjøhus

Når du lager en Fabric-gjenstand, som et innsjøhus, lager eller eventhouse, sørger den gjenstanden for lagring i OneLake på dine vegne. I denne quickstarten lager du et lakehouse, som gir deg både et filområde (filer) for ustrukturerte eller semistrukturerte data og et delta-tabellområde (tabeller) for strukturerte, spørrbare data. Alt du legger inn i noen av områdene lagres i OneLake og er umiddelbart tilgjengelig for andre Fabric-arbeidsbelastninger.

  1. Logg inn på portalen Fabric og velg arbeidsområdet ditt.

  2. Velg Nytt element.

  3. I panelet Nye gjenstander , søk etter og velg Lakehouse.

  4. Skriv inn et navn, for eksempel DataLakehouse, og velg deretter Opprett.

    Innsjøhuset åpnes til Utforsker-visningen, som viser tomme Tabeller og Filer-seksjoner. Begge seksjonene støttes allerede av OneLake og er klare for innhold.

Opplast prøvedata

I denne quickstarten bruker du Dim_Products.csv fra et offentlig tilgjengelig Fabric eksempeldatasett. Det er en liten tabell med produktinformasjon fra en prøvekaffeforhandler.

  1. Åpne en nettleser og gå til https://fabrictutorialdata.blob.core.windows.net/sampledata/Coffee/Dim_Products.csv.
  2. Når du blir bedt om det, lagre filen i Dim_Products.csv en mappe på datamaskinen din.

I denne seksjonen laster du opp Dim_Products.csv til Files slik at du har rå kildedata liggende i OneLake. Arkivområdet i et innsjøhus er en generell lagringssone i OneLake. Tenk på det som landingssonen for rådata i hvilket som helst format det ankommer. Du kan legge inn CSV, JSON, Parquet, bilder, logger eller hva som helst uten å måtte definere et skjema først.

  1. I Lakehouse Explorer, hold musepekeren over Filer, velg menyen for flere alternativer (...), og velg deretter Last opp>opplasting filer.

  2. I panelet For opplasting filer velger du mappeikonet og bla til Dim_Products.csv på datamaskinen din.

  3. Velg Last opp, og lukk deretter opplastingspanelet.

  4. Velg mappen Filer for å se innholdet og bekrefte at det Dim_Products.csv vises.

  5. Velg Dim_Products.csv for å se dataene.

    Et skjermbilde av Fabric-portalen som viser ustrukturert csv-data i Filer-seksjonen i et lakehouse.

Filen ligger nå i OneLake, men som en rå CSV er det ennå ikke noe SQL eller Spark kan spørre i som en tabell.

Last filen inn i en Delta-tabell

Fabric standardiserer på Delta Lake som bordformat i OneLake. Når du laster inn en fil i området Tables, leser Fabric kildefilen, utleder et skjema og skriver dataene ut som en Delta-tabell. Fra det punktet kan alle Fabric-motorer spørre i samme tabell uten at du må kopiere eller konvertere dataene på nytt.

  1. I Lakehouse Explorer, åpne mappen Filer .

  2. Hold musepekeren over Dim_Products.csv filen og velg menyen for flere alternativer (...), og velg deretter Last til tabeller>Ny tabell.

  3. I dialogen Last til tabell , skriv dim_products inn for tabellnavn, behold standardinnstillingene, og velg Last inn.

  4. Når lastingen er ferdig, utvid Tabeller og velg dim_products for å forhåndsvise radene. Den rå CSV-filen i Files er uendret, og dim_products er en ny Delta-tabell bygget ut fra den.

    Et skjermbilde som viser strukturerte Delta-tabelldata i tabellseksjonen i et innsjøhus.

  5. Hold musepekeren over dim_products og velg menyen for flere alternativer (...), og velg deretter Egenskaper.

    Skjermen Properties viser de ulike detaljene for tabellen, inkludert URL-en og Azure Blob File System (ABFS)-stien som du kan bruke for å referere til denne tabellen i andre motorer.

Gjenbruk dataene med en snarvei fra et annet hytte ved innsjøen

Oplasting og lasting er én måte å få data inn i OneLake på. Det andre viktige mønsteret er å referere til data som allerede finnes et annet sted, uten å duplisere det. Det er det en snarvei er: en peker i OneLake som refererer til data lagret i et annet lakehouse, i et annet Fabric-arbeidsområde, eller i støttede kilder utenfor Fabric, som Azure Data Lake Storage eller Amazon S3. Dataene kopieres ikke; den forblir på kildelokasjonen, men du kan lese den gjennom OneLake som om den var lokal. Alle oppdateringer til kilden er umiddelbart synlige via snarveien, så du slipper å vedlikeholde kopier av dataene.

I denne delen lager du et andre innsjøhus og legger til en snarvei fra det tilbake til dim_products tabellen i ditt første innsjøhus. Dette gjenspeiler hvordan team vanligvis fungerer, der ett team eier de kuraterte dataene og andre team eller prosjekter bruker dem gjennom snarveier i sine egne arbeidsområder.

  1. Velg Nytt element i arbeidsområdet ditt.
  2. I panelet Nye gjenstander , søk etter og velg Lakehouse.
  3. Skriv inn et navn, for eksempel ShortcutLakehouse, og velg deretter Opprett.
  4. I utforskeren av det nye innsjøhuset, hold musepekeren over Tabeller, velg menyen for flere alternativer (...), og velg deretter Ny snarvei.
  5. På siden New snarvei, under Internal sources, velg Microsoft OneLake.
  6. I datakilde-nettleseren, velg det første innsjøhuset du laget for denne hurtigstarten, og velg deretter Neste.
  7. Utvid tabeller, velg dim_products tabellen, og velg deretter Neste.
  8. Gå gjennom valget og velg Opprett.
  9. Utvid Tabeller i ShortcutLakehouse og bekreft at det dim_products vises med et snarveisikon (et lite lenkebilde over tabellikonet). Velg den for å forhåndsvise radene. Tabellen er den samme som i det opprinnelige innsjøhuset, men ingen data ble kopiert.
  10. Hold musepekeren over tabellen dim_products , velg flere alternativer (...), og velg deretter Administrer snarvei. På Administrer snarvei-panelet kan du se snarveidetaljene, inkludert snarveimålet der de opprinnelige dataene er lagret.

Fjerning av ressurser

Hvis du ikke planlegger å fortsette til de andre OneLake quickstarts, slett lakehousene for å unngå OneLake-lagringskostnader mot din Fabric-kapasitet.

  1. I arbeidsområdet ditt, hold musepekeren over innsjøhuset du vil slette.
  2. Velg menyen for flere alternativer (...) ved siden av innsjøhuset, velg Slett, og bekreft slettingen.

Å slette innsjøhusene fjerner også innholdet i dem: den opplastede filen, dim_products Delta-tabellen og snarveien.