Adatok lekérése az Amazon S3-ból

Az adatbetöltés egy vagy több forrásból származó adatok Azure-Data Explorer táblába való betöltésére szolgáló folyamat. A betöltés után az adatok elérhetővé válnak a lekérdezéshez. Ebből a cikkből megtudhatja, hogyan kérhet le adatokat az Amazon S3-ból egy új vagy meglévő táblába.

További információ az Amazon S3-ról: Mi az Az Amazon S3?.

Az adatfeldolgozással kapcsolatos általános információkért lásd: Az Azure Data Explorer adatbetöltés áttekintése.

Előfeltételek

Adatok lekérése

  1. A bal oldali menüben válassza a Lekérdezés lehetőséget.

  2. Kattintson a jobb gombbal arra az adatbázisra, ahová az adatokat be szeretné helyezni, majd válassza az Adatok lekérése lehetőséget.

    Képernyőkép a lekérdezés lapról, amelyen a jobb gombbal egy adatbázisra kattint, és megnyílik a Beállítások lekérése párbeszédpanel.

Forrás

Az Adatok lekérése ablakban a Forrás lap van kiválasztva.

Válassza ki az adatforrást az elérhető listából. Ebben a példában az Amazon S3-ból fog adatokat betöltésre.

Képernyőkép az Adatok lekérése ablakról, amelyen a forráslap van kijelölve.

Konfigurálás

  1. Válasszon ki egy céladatbázist és -táblát. Ha adatokat szeretne bevinni egy új táblába, válassza az +Új tábla lehetőséget, és adjon meg egy táblanevet.

    Megjegyzés

    A táblanevek legfeljebb 1024 karakterből állhatnak, beleértve a szóközöket, alfanumerikus karaktereket, kötőjeleket és aláhúzásjeleket. A speciális karakterek nem támogatottak.

  2. Az URI mezőbe illessze be egyetlen gyűjtő vagy egy objektum kapcsolati karakterlánc az alábbi formátumban.

    Gyűjtő: https://BucketName.s3.RegionName.amazonaws.com

    Objektum: ObjectName;AwsCredentials=AwsAccessID,AwsSecretKey

    Ha szeretné, gyűjtőszűrőket is alkalmazhat az adatok adott fájlkiterjesztés szerinti szűréséhez.

    Képernyőkép a Konfigurálás lapról új tábla beírásával és egy Amazon S3 kapcsolati karakterlánc beillesztésével.

    Megjegyzés

    Legfeljebb 6 GB méretű fájl tölthető be. A javaslat a 100 MB és 1 GB közötti fájlok betöltése.

  3. Kattintson a Tovább gombra.

Ellenőrizni

Megnyílik a vizsgálat lap az adatok előnézetével.

A betöltési folyamat befejezéséhez válassza a Befejezés lehetőséget.

Képernyőkép a vizsgálat lapról.

Vagy:

Oszlopok szerkesztése

Megjegyzés

  • Táblázatos formátumok (CSV, TSV, PSV) esetén nem lehet kétszer leképezni egy oszlopot. Ha meglévő oszlopra szeretne megfeleltetni, először törölje az új oszlopot.
  • Meglévő oszloptípus nem módosítható. Ha más formátumú oszlopra próbál megfeleltetni, előfordulhat, hogy üres oszlopokat tartalmaz.

A táblázatban végrehajtott módosítások a következő paraméterektől függnek:

  • A tábla típusa új vagy meglévő
  • A leképezés típusa új vagy meglévő
Táblatípus Leképezés típusa Elérhető kiigazítások
Új táblázat Új leképezés Oszlop átnevezése, adattípus módosítása, adatforrás módosítása, leképezés átalakítása, oszlop hozzáadása, oszlop törlése
Meglévő tábla Új leképezés Oszlop hozzáadása (amelyen módosíthatja az adattípust, átnevezheti és frissítheti)
Meglévő tábla Meglévő leképezés Nincs

Képernyőkép a szerkesztésre megnyitott oszlopokról.

Átalakítások leképezése

Egyes adatformátum-leképezések (Parquet, JSON és Avro) támogatják az egyszerű betöltési idejű átalakításokat. A leképezési átalakítások alkalmazásához hozzon létre vagy frissítsen egy oszlopot az Oszlopok szerkesztése ablakban.

A leképezési átalakítások egy sztring vagy datetime típusú oszlopon hajthatók végre, és a forrás adattípusa int vagy long. A támogatott leképezési átalakítások a következők:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Speciális beállítások adattípus alapján

Táblázatos (CSV, TSV, PSV):

  • Ha táblázatos formátumokat használ egy meglévő táblában, válassza azAktuális táblaséma megőrzésespeciális> lehetőséget. A táblázatos adatok nem feltétlenül tartalmazzák a forrásadatok meglévő oszlopokra való leképezéséhez használt oszlopneveket. Ha ez a beállítás be van jelölve, a leképezés sorrendben történik, és a táblaséma változatlan marad. Ha ez a beállítás nincs bejelölve, a rendszer az adatstruktúrától függetlenül új oszlopokat hoz létre a bejövő adatokhoz.

  • Ha az első sort oszlopnévként szeretné használni, válassza a Speciális>első sor oszlopfejlécként lehetőséget.

    Képernyőkép a speciális CSV-beállításokról.

JSON:

  • A JSON-adatok oszlopelosztásának meghatározásához válassza a Speciális>beágyazott szintek lehetőséget 1 és 100 között.

  • Ha az AdvancedIgnore data format errors (Speciális > adatformátum-hibák figyelmen kívül hagyása) lehetőséget választja, az adatok JSON formátumban lesznek betöltve. Ha bejelöletlenül hagyja ezt a jelölőnégyzetet, az adatok többjsonos formátumban lesznek betöltve.

    Képernyőkép a speciális JSON-beállításokról.

Összefoglalás

Az Adat-előkészítés ablakban mind a három lépés zöld pipával van megjelölve, amikor az adatbetöltés sikeresen befejeződik. Megtekintheti az egyes lépésekhez használt parancsokat, vagy kiválaszthat egy kártyát a betöltött adatok lekérdezéséhez, megjelenítéséhez vagy elvetéséhez.

Képernyőkép az összefoglaló oldalról, amelyen a sikeres betöltés befejeződött.