Jaa


Tietojen noutaminen Amazon S3:sta

Tässä artikkelissa opit noutamaan tietoja Amazon S3:sta joko uuteen tai olemassa olevaan taulukkoon. Amazon S3 on objektisäilöpalvelu, joka on luotu tietojen tallentamista ja noutamista varten.

Lisätietoja Amazon S3: sta on kohdassa Mikä on Amazon S3?.

Edellytykset

  • Työtila, jossa on Microsoft Fabric -yhteensopiva kapasiteetti
  • KQL-tietokanta muokkausoikeuksilla
  • Amazon S3 -säilö, jossa on tietoja

Lähde

  1. Valitse KQL-tietokannan alemmasta valintanauhasta Nouda tiedot.

    Nouda tiedot -ikkunassa lähde-välilehti on valittuna.

  2. Valitse tietolähde käytettävissä olevasta luettelosta. Tässä esimerkissä käsittelet Amazon S3:n tietoja.

    Näyttökuva Nouda tiedot -ikkunasta, jossa lähde-välilehti on valittuna.

Määrittäminen

  1. Valitse kohdetaulukko. Jos haluat käyttää tietoja uuteen taulukkoon, valitse +Uusi taulukko ja anna taulukon nimi.

    Muistiinpano

    Taulukon nimessä voi olla enintään 1 024 merkkiä, mukaan lukien välilyönnit, aakkosnumeeriset yhdysmerkit, tavuviivat ja alaviivat. Erikoismerkkejä ei tueta.

  2. Liitä URI-kenttään yksittäisen säilön ühendusstring tai yksittäinen objekti seuraavassa muodossa.

    Säilö: https://BucketName.s3.RegionName.amazonaws.com;AwsCredentials=AwsAccessID,AwsSecretKey

    Vaihtoehtoisesti voit käyttää säilösuodattimia tietojen suodattamiseen tietyn tiedostotunnisteen mukaan.

    Näyttökuva välilehden määrittämisestä, kun uusi taulukko on syötetty ja Amazon S3 -ühendusstring liitetty.

  3. Valitse Seuraava.

Tarkastaa

Tarkista-välilehti avautuu, ja siinä on tietojen esikatselu.

Viimeistele käsittelyprosessi valitsemalla Valmis.

Näyttökuva Tarkasta-välilehdestä.

Vaihtoehtoisesti:

  • Valitse Komentojen katseluohjelma , jos haluat tarkastella ja kopioida syötteistäsi luotuja automaattisia komentoja.
  • Käytä avattavaa Schema-määritystiedoston valikkoa, kun haluat muuttaa tiedostoa, josta rakenne johdetaan.
  • Muuta automaattisesti johdettua tietomuotoa valitsemalla haluamasi muoto avattavasta valikosta. Lisätietoja on kohdassa Reaaliaikaisten tietojen tukemat tietomuodot.
  • Muokkaa sarakkeita.
  • Tutustu Tietotyypin perusteella lisäasetuksiin.

Muokkaa sarakkeita

Muistiinpano

  • Taulukkomuotoisissa muodoissa (CSV, TSV, PSV) saraketta ei voi yhdistää kahdesti. Jos haluat yhdistää aiemmin luotuun sarakkeeseen, poista ensin uusi sarake.
  • Et voi muuttaa olemassa olevaa saraketyyppiä. Jos yrität yhdistää sarakkeeseen, jonka muoto on erilainen, saatat päätyä tyhjiin sarakkeisiin.

Taulukossa tekemäsi muutokset riippuvat seuraavista parametreista:

  • Taulukkotyyppi on uusi tai olemassa oleva
  • Yhdistämismääritystyyppi on uusi tai olemassa
Taulukon tyyppi Yhdistämismääritystyyppi Käytettävissä olevat muutokset
Uusi taulukko Uusi yhdistämismääritys Nimeä sarake uudelleen, muuta tietotyyppiä, muuta tietolähdettä, yhdistämismääritysten muuntaminen, sarakkeen lisääminen, sarakkeen poistaminen
Aiemmin luotu taulukko Uusi yhdistämismääritys Lisää sarake (jonka tietotyyppiä voit sitten muuttaa, nimetä uudelleen ja päivittää)
Aiemmin luotu taulukko Aiemmin luotu yhdistäminen ei mitään

Näyttökuva sarakkeista, jotka on avattu muokkaamista varten.

Yhdistämismuunnokset

Jotkin tietomuotojen yhdistämismääritykset (Parquet, JSON ja Avro) tukevat yksinkertaisia käytönaikaisia muunnoksia. Jos haluat käyttää yhdistämismuunnoksia, luo tai päivitä sarake Muokkaa sarakkeita -ikkunassa.

Yhdistämisen muunnokset voidaan suorittaa saraketyypille merkkijono tai päivämäärä ja aika, jolloin lähteen tietotyyppi on int tai pitkä. Tuettuja yhdistämismääritysten muunnoksia ovat seuraavat:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Tietotyyppiin perustuvat lisäasetukset

Taulukkomuoto (CSV, TSV, PSV):

  • Jos käytät taulukkomuotoja olemassa olevassa taulukossa, voit valita Säilytä taulukon lisärakenne>-vaihtoehdon. Taulukkomuotoiset tiedot eivät välttämättä sisällä sarakkeiden nimiä, joita käytetään lähdetietojen yhdistämiseen olemassa oleviin sarakkeisiin. Kun tämä asetus on valittuna, yhdistäminen tehdään järjestyksen mukaan ja taulukon rakenne pysyy samana. Jos asetuksen valinta ei ole valittu, uusia sarakkeita luodaan saapuville tiedoille tietorakenteesta riippumatta.

  • Jos haluat käyttää ensimmäistä riviä sarakkeiden niminä, valitse Kehittynyt>ensimmäinen rivi on sarakeotsikko.

    Näyttökuva CSV-lisäasetuksista.

JSON:

  • Voit selvittää JSON-tietojen sarakkeen jaon valitsemalla Sisäkkäisten tasojen lisäasetukset> 1:stä 100:aan.

  • Jos valitset Kehittynyt ohitus>JSON-rivit, joissa on virheitä, tiedot käsitellään JSON-muodossa. Jos jätät tämän valintaruudun valitsematta, tietoja käytetään multijson-muodossa.

    Näyttökuva JSON-lisäasetuksista.

Yhteenveto

Tietojen valmistelu -ikkunassa kaikki kolme vaihetta merkitään vihreillä tarkistusmerkeillä, kun tietojen käsittely onnistuu. Voit valita kortin kyselyä varten, pudottaa saadut tiedot tai tarkastella koontinäyttöä käsittelyyhteenvedostasi.

Näyttökuva yhteenvetosivusta, jossa onnistunut käsittely on valmis.