Condividi tramite


Ottenere dati da Amazon S3

L'inserimento dati è il processo usato per caricare dati da una o più origini in una tabella in Azure Esplora dati. Una volta inseriti, i dati diventano disponibili per le query. Questo articolo illustra come ottenere dati da Amazon S3 in una tabella nuova o esistente.

Per altre informazioni su Amazon S3, vedere Che cos'è Amazon S3?.

Per informazioni generali sull'inserimento dati, vedere Panoramica dell'inserimento di dati in Azure Esplora dati.

Prerequisiti

Recuperare i dati

  1. Nel menu a sinistra selezionare Query.

  2. Fare clic con il pulsante destro del mouse sul database in cui si desidera inserire i dati e quindi scegliere Recupera dati.

    Screenshot della scheda query, con clic con il pulsante destro del mouse su un database e la finestra di dialogo Ottieni opzioni aperta.

Source

Nella finestra Recupera dati è selezionata la scheda Origine .

Selezionare l'origine dati dall'elenco disponibile. In questo esempio si inseriscono dati da Amazon S3.

Screenshot della finestra Recupera dati con la scheda origine selezionata.

Configurare

  1. Selezionare un database e una tabella di destinazione. Per inserire dati in una nuova tabella, selezionare +Nuova tabella e immettere un nome di tabella.

    Nota

    I nomi delle tabelle possono contenere fino a 1024 caratteri, inclusi spazi, alfanumerici, trattini e caratteri di sottolineatura. I caratteri speciali non sono supportati.

  2. Nel campo URI incollare la stringa di connessione di un singolo bucket o un singolo oggetto nel formato seguente.

    Bucket: https://BucketName RegionName.s3..amazonaws.com

    Oggetto: ObjectName;AwsCredentials=AwsAccessID,AwsSecretKey

    Facoltativamente, è possibile applicare filtri bucket per filtrare i dati in base a un'estensione di file specifica.

    Screenshot della scheda configura con la nuova tabella immessa e un stringa di connessione incollato di Amazon S3.

    Nota

    L'inserimento supporta file di dimensione massima di 6 GB. È consigliabile inserire file di dimensione compresa tra 100 MB e 1 GB.

  3. Selezionare Avanti.

Controllare

Viene visualizzata la scheda Inspect con un'anteprima dei dati.

Per completare il processo di inserimento, selezionare Fine.

Screenshot della scheda Ispeziona.

Facoltativamente:

Modifica colonne

Nota

  • Per i formati tabulari (CSV, TSV, PSV), non è possibile eseguire il mapping di una colonna due volte. Per eseguire il mapping a una colonna esistente, eliminare prima quella nuova.
  • Non è possibile modificare un tipo di colonna esistente. Se si tenta di eseguire il mapping a una colonna con un formato diverso, è possibile che si verifichino colonne vuote.

Le modifiche che è possibile apportare in una tabella dipendono dai parametri seguenti:

  • Il tipo di tabella è nuovo o esistente
  • Il tipo di mapping è nuovo o esistente
Tipo di tabella. Tipo di mapping Modifiche disponibili
Nuova tabella Nuovo mapping Rinominare la colonna, modificare il tipo di dati, modificare l'origine dati, la trasformazione del mapping, aggiungere una colonna, eliminare una colonna
Tabella esistente Nuovo mapping Aggiungere una colonna (in cui è possibile modificare il tipo di dati, rinominare e aggiornare)
Tabella esistente Mapping esistente Nessuno

Screenshot delle colonne aperte per la modifica.

Trasformazioni del mapping

Alcuni mapping del formato dati (Parquet, JSON e Avro) supportano semplici trasformazioni in fase di inserimento. Per applicare trasformazioni di mapping, creare o aggiornare una colonna nella finestra Modifica colonne .

Le trasformazioni di mapping possono essere eseguite su una colonna di tipo string o datetime, con l'origine con tipo di dati int o long. Le trasformazioni del mapping supportate sono:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Opzioni avanzate basate sul tipo di dati

Tabulare (CSV, TSV, PSV):Tabular (CSV, TSV, PSV):Tabular (CSV, TSV, PSV):

  • Se si inseriscono formati tabulari in una tabella esistente, è possibile selezionare Avanzate>Mantieni schema di tabella corrente. I dati tabulari non includono necessariamente i nomi di colonna usati per eseguire il mapping dei dati di origine alle colonne esistenti. Quando questa opzione viene selezionata, il mapping viene eseguito in base all'ordine e lo schema della tabella rimane invariato. Se questa opzione è deselezionata, vengono create nuove colonne per i dati in ingresso, indipendentemente dalla struttura dei dati.

  • Per usare la prima riga come nomi di colonna, selezionare Advanced First row is column header .To use the first row as column names, select Advanced>First row is column header.

    Screenshot delle opzioni CSV avanzate.

JSON:

  • Per determinare la divisione delle colonne dei dati JSON, selezionare Livelliannidati avanzati>, da 1 a 100.

  • Se si seleziona Ignoraerrori di formato datiavanzati>, i dati vengono inseriti in formato JSON. Se si lascia deselezionata questa casella di controllo, i dati vengono inseriti in formato multijson.

    Screenshot delle opzioni JSON avanzate.

Riepilogo

Nella finestra Preparazione dati tutti e tre i passaggi vengono contrassegnati con segni di spunta verdi al termine dell'inserimento dati. È possibile visualizzare i comandi usati per ogni passaggio oppure selezionare una scheda per eseguire query, visualizzare o eliminare i dati inseriti.

Screenshot della pagina di riepilogo con completamento dell'inserimento.