Hent data fra Azure Storage

I denne artikkelen lærer du hvordan du henter data fra Azure Storage (ADLS Gen2-beholder, blobbeholder eller individuelle blober) til enten en ny eller eksisterende tabell.

Forutsetning

Source

  1. Velg Hent data på det nedre båndet i KQL-databasen.

    Kilde-fanen er valgt i Hent data-vinduet.

  2. Velg datakilden fra den tilgjengelige listen. I dette eksemplet inntar du data fra Azure Storage.

    Screenshot of get data window with source tab selected.

Konfigurer

  1. Velg en måltabell. Hvis du vil innta data i en ny tabell, velger du + Ny tabell og skriver inn et tabellnavn.

    Merk

    Tabellnavn kan være opptil 1024 tegn, inkludert mellomrom, alfanumeriske tegn, bindestreker og understrekingstegn. Spesialtegn støttes ikke.

  2. Hvis du vil legge til datakilden, limer du inn lagringsplassen tilkoblingsstreng i URI-feltet, og deretter velger du +. Tabellen nedenfor viser de støttede godkjenningsmetodene og tillatelsene som kreves for inntak av data fra Azure Storage.

    Authentication method Individuell blob Blob-beholder Azure Data Lake Storage Gen2
    Sas-token (Shared Access) Lese og skrive Lese og liste Lese og liste
    Tilgangsnøkkel for lagringskonto

    Merk

    • Du kan enten legge til opptil 10 individuelle blober eller innta opptil 5000 blober fra én enkelt beholder. Du kan ikke innta begge samtidig.
    • Hver blob kan være maksimalt 1 GB ukomprimert.
    1. Hvis du limte inn en tilkoblingsstreng for en blob-beholder eller en Azure Data Lake Storage Gen2, kan du deretter legge til følgende valgfrie filtre:

      Screenshot of configure tab with new table entered and one sample data file selected.

      Innstilling Feltbeskrivelse
      Filfiltre (valgfritt)
      Folder path Filtrerer data til å innta filer med en bestemt mappebane.
      Filtype Filtrerer data til å innta filer bare med en bestemt filtype.
  3. Velg Neste

Kontroller

Undersøk-fanen åpnes med en forhåndsvisning av dataene.

Hvis du vil fullføre inntaksprosessen, velger du Fullfør.

Screenshot of the inspect tab.

Eventuelt:

Rediger kolonner

Merk

  • For tabellformater (CSV, TSV, PSV) kan du ikke tilordne en kolonne to ganger. Hvis du vil tilordne til en eksisterende kolonne, må du først slette den nye kolonnen.
  • Du kan ikke endre en eksisterende kolonnetype. Hvis du prøver å tilordne til en kolonne med et annet format, kan du ende opp med tomme kolonner.

Endringene du kan gjøre i en tabell, avhenger av følgende parametere:

  • Tabelltype er ny eller eksisterende
  • Tilordningstype er ny eller eksisterende
Tabelltype Tilordningstype Tilgjengelige justeringer
New table Ny tilordning Gi nytt navn til kolonne, endre datatype, endre datakilde, tilordningstransformasjon, legge til kolonne, slette kolonne
Eksisterende tabell Ny tilordning Legg til kolonne (der du deretter kan endre datatype, gi nytt navn til og oppdatere)
Eksisterende tabell Eksisterende tilordning ingen

Screenshot of columns open for editing.

Tilordningstransformasjoner

Noen dataformattilordninger (Parquet, JSON og Avro) støtter enkle inntakstidstransformasjoner. Hvis du vil bruke tilordningstransformasjoner, oppretter eller oppdaterer du en kolonne i vinduet Rediger kolonner.

Tilordningstransformasjoner kan utføres på en kolonne av typen streng eller datetime, der kilden har datatypeint eller lang. Støttede tilordningstransformasjoner er:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Avanserte alternativer basert på datatype

Tabell (CSV, TSV, PSV):

  • Hvis du inntar tabellformater i en eksisterende tabell, kan du velge Avansert>behold tabellskjema. Tabelldata inneholder ikke nødvendigvis kolonnenavnene som brukes til å tilordne kildedata til de eksisterende kolonnene. Når dette alternativet er merket av, utføres tilordningen etter rekkefølge, og tabellskjemaet forblir det samme. Hvis dette alternativet ikke er avmerket, opprettes nye kolonner for innkommende data, uavhengig av datastruktur.

  • Hvis du vil bruke den første raden som kolonnenavn, velger du Avansert>første rad er kolonneoverskrift.

    Screenshot of advanced CSV options.

JSON:

  • Hvis du vil bestemme kolonnedeling av JSON-data, velger du Avanserte>nestede nivåer, fra 1 til 100.

  • Hvis du velger Avanserte>Hopp over JSON-linjer med feil, blir dataene inntatt i JSON-format. Hvis du lar denne avmerkingsboksen være umerket, blir dataene inntatt i flerjsonformat.

    Screenshot of advanced JSON options.

Sammendrag

I vinduet for klargjøring av data merkes alle tre trinnene med grønne haker når datainntaket er fullført. Du kan velge et kort som skal spørres, slippe de inntatte dataene eller se et instrumentbord i inntakssammendraget.

Screenshot of summary page with successful ingestion completed.