Del via


Hent data fra OneLake

I denne artikel lærer du, hvordan du henter data fra OneLake til enten en ny eller eksisterende tabel.

Forudsætninger

Kopiér filstien fra Lakehouse

  1. Vælg Dataudvikler ing i oplevelsesskifteren.

  2. Vælg det Lakehouse-miljø, der indeholder den datakilde, du vil bruge.

  3. Placer markøren over den ønskede fil, og vælg menuen Flere , og vælg derefter Egenskaber.

    Vigtigt

    • Mappestier understøttes ikke.
    • Jokertegn (*) understøttes ikke.

    Skærmbillede af rullemenuen i en Lakehouse-fil. Indstillingen Egenskaber er fremhævet.

  4. Under URL-adresse skal du vælge ikonet Kopiér til Udklipsholder og gemme det et sted, hvor du kan hente det på et senere trin.

    Skærmbillede af ruden Egenskaber for en Lakehouse-fil. Kopiikonet til højre for filens URL-adresse er fremhævet.

  5. Gå tilbage til dit arbejdsområde, og vælg en KQL-database.

Kilde

  1. På det nederste bånd i din KQL-database skal du vælge Hent data.

    I vinduet Hent data er fanen Kilde valgt.

  2. Vælg datakilden på den tilgængelige liste. I dette eksempel bruger du data fra OneLake.

    Skærmbillede af vinduet Hent data med kildefanen valgt.

Konfigurere

  1. Vælg en destinationstabel. Hvis du vil overføre data til en ny tabel, skal du vælge +Ny tabel og angive et tabelnavn.

    Bemærk

    Tabelnavne kan indeholde op til 1024 tegn, herunder mellemrum, alfanumeriske tegn, bindestreger og understregningstegn. Specialtegn understøttes ikke.

  2. I OneLake-filen skal du indsætte filstien for det Lakehouse, du kopierede, i Kopiér filsti fra Lakehouse.

    Bemærk

    Du kan tilføje op til 10 elementer af op til 1 GB dekomprimeret størrelse hver.

    Skærmbillede af fanen Konfigurer, hvor der er angivet en ny tabel, og der er tilføjet en OneLake-filsti.

  3. Vælg Næste.

Inspicer

Fanen Undersøg åbnes med et eksempel på dataene.

Vælg Udfør for at fuldføre indtagelsesprocessen.

Skærmbillede af fanen Undersøg.

Eventuelt:

Rediger kolonner

Bemærk

  • I forbindelse med tabelformater (CSV, TSV, PSV) kan du ikke tilknytte en kolonne to gange. Hvis du vil knytte til en eksisterende kolonne, skal du først slette den nye kolonne.
  • Du kan ikke ændre en eksisterende kolonnetype. Hvis du forsøger at knytte til en kolonne med et andet format, kan du ende med at have tomme kolonner.

De ændringer, du kan foretage i en tabel, afhænger af følgende parametre:

  • Tabeltypen er ny eller eksisterende
  • Tilknytningstypen er ny eller eksisterende
Tabeltype Tilknytningstype Tilgængelige justeringer
Ny tabel Ny tilknytning Omdøb kolonne, skift datatype, skift datakilde, tilknytningstransformation, tilføj kolonne, slet kolonne
Eksisterende tabel Ny tilknytning Tilføj kolonne (hvor du derefter kan ændre datatype, omdøbe og opdatere)
Eksisterende tabel Eksisterende tilknytning ingen

Skærmbillede af kolonner, der er åbnet til redigering.

Tilknytning af transformationer

Nogle tilknytninger af dataformater (Parquet, JSON og Avro) understøtter enkle transformationer af indfødningstid. Hvis du vil anvende tilknytningstransformationer, skal du oprette eller opdatere en kolonne i vinduet Rediger kolonner .

Tilknytningstransformationer kan udføres på en kolonne af typen streng eller datetime, hvor kilden har datatypen int eller long. Understøttede tilknytningstransformationer er:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Avancerede indstillinger baseret på datatype

Tabel (CSV, TSV, PSV):

  • Hvis du bruger tabelformater i en eksisterende tabel, kan du vælge Avanceret>behold tabelskema. Tabeldata indeholder ikke nødvendigvis de kolonnenavne, der bruges til at knytte kildedata til de eksisterende kolonner. Når denne indstilling er markeret, udføres tilknytningen efter rækkefølge, og tabelskemaet forbliver det samme. Hvis denne indstilling ikke er markeret, oprettes der nye kolonner til indgående data, uanset datastruktur.

  • Hvis du vil bruge den første række som kolonnenavne, skal du vælge Avanceret>første række er kolonneoverskrift.

    Skærmbillede af avancerede CSV-indstillinger.

JSON:

  • Hvis du vil bestemme kolonneopdelingen af JSON-data, skal du vælge Avancerede>indlejrede niveauer fra 1 til 100.

  • Hvis du vælger Avanceret>Spring JSON-linjer over med fejl, indtages dataene i JSON-format. Hvis du ikke markerer dette afkrydsningsfelt, indtages dataene i multijsonformat.

    Skærmbillede af avancerede JSON-indstillinger.

Resumé

I vinduet Dataforberedelse er alle tre trin markeret med grønne markeringer, når dataindtagelse er fuldført. Du kan vælge et kort, der skal forespørges om, slippe de data, der er indtaget, eller se et dashboard med oversigten over indtagelse.

Skærmbillede af oversigtssiden, hvor indtagelsen er fuldført.