Condividi tramite


Ottenere dati da Amazon S3

L'inserimento dati è il processo di caricamento di dati da una o più origini in una tabella in Esplora dati di Azure. Dopo il caricamento, i dati sono disponibili per l'interrogazione. Questo articolo illustra come ottenere dati da Amazon S3 in una tabella nuova o esistente.

Per altre informazioni su Amazon S3, vedere Che cos'è Amazon S3?

Per informazioni generali sull'inserimento dati, vedere Esplora dati di Azure panoramica dell'inserimento dati.

Prerequisiti

Recuperare i dati

  1. Selezionare Query dal menu a sinistra.

  2. Fare clic con il pulsante destro del mouse sul database in cui si desidera inserire i dati e quindi scegliere Recupera dati.

    Screenshot della scheda query, con il pulsante destro del mouse su un database e la finestra di dialogo Ottieni opzioni aperta.

Origine

Nella finestra Ottieni dati è selezionata la scheda Origine.

Selezionare l'origine dati dall'elenco disponibile. In questo esempio inserire dati da Amazon S3.

Screenshot della finestra Ottieni dati con la scheda Sorgente selezionata.

Configurare

  1. Selezionare un database e una tabella di destinazione. Per inserire i dati in una nuova tabella, selezionare + Nuova tabella e immettere un nome di tabella.

    Nota

    I nomi delle tabelle possono contenere fino a 1.024 caratteri, inclusi spazi, caratteri alfanumerici, trattini e caratteri di sottolineatura. I caratteri speciali non sono supportati.

  2. Nel campo URI incollare il stringa di connessione per un singolo bucket o un singolo oggetto nel formato seguente.

    Bucket: https://BucketName.s3.RegionName.amazonaws.com

    Oggetto: ObjectName;AwsCredentials=AwsAccessID,AwsSecretKey

    È facoltativo applicare filtri bucket per filtrare i dati in base a un'estensione di file specifica.

    Screenshot della scheda di configurazione con nuova tabella inserita e una stringa di connessione Amazon S3 incollata.

    Nota

    Il processo di acquisizione supporta un file di dimensione massima di 6 GB. È consigliabile inserire file di dimensione compresa tra 100 MB e 1 GB.

  3. Selezionare Avanti.

Controllare

Viene visualizzata la scheda inspect con un'anteprima dei dati.

Selezionare Fine per completare il processo di inserimento.

Screenshot della scheda Ispeziona.

Facoltativo:

Modifica colonne

Nota

  • Per i formati tabulari (CSV, TSV, PSV), non è possibile eseguire il mapping di una colonna due volte. Per eseguire il mapping a una colonna esistente, eliminare prima quella nuova.
  • Non è possibile modificare un tipo di colonna esistente. Se si tenta di eseguire il mapping su una colonna con un formato diverso, è possibile che appaiano colonne vuote.

Le modifiche che è possibile apportare in una tabella dipendono dai parametri seguenti:

  • Il tipo di tabella è nuovo o esistente
  • Il tipo di mapping è nuovo o esistente
Tipo di tabella Tipo di mappatura Modifiche disponibili
Nuova tabella Nuova mappatura Rinominare la colonna, modificare il tipo di dati, modificare l'origine dati, eseguire la Trasformazione del mapping, aggiungere una colonna, eliminare una colonna
Tabella esistente Nuova mappatura Aggiungi colonna (per cui è poi possibile cambiare il tipo di dati, rinominare e aggiornare)
Tabella esistente Mappatura esistente Nessuno

Screenshot delle colonne aperte per la modifica.

Trasformazioni del mapping

Alcuni mapping del formato dati (Parquet, JSON e Avro) supportano semplici trasformazioni in fase di inserimento. Per applicare le trasformazioni del mapping, creare o aggiornare una colonna nella finestra Modifica colonne.

Le trasformazioni del mapping possono essere eseguite su una colonna di tipo string o date/time, con l'origine che ha un tipo di dati int o long. Le trasformazioni del mapping supportate sono:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Opzioni avanzate in base al tipo di dati

Tabellare (CSV, TSV, PSV):

  • Se si inseriscono formati tabulari in una tabella esistente, è possibile selezionare il menu a tendina della mappatura della tabella e selezionare Usa mappatura esistente. I dati tabulari non comprendono necessariamente i nomi di colonna usati per eseguire il mapping dei dati di origine sulle colonne esistenti. Quando questa opzione è selezionata, il mapping viene eseguito in base all'ordine e lo schema della tabella rimane invariato.

  • In caso contrario, creare un nuovo mapping.

  • Per usare la prima riga come nomi di colonna, selezionare Prima intestazione di riga.

    Screenshot delle opzioni di mappatura.

JSON:

  • Per determinare la divisione delle colonne dei dati JSON, selezionare Livelli annidati, da 1 a 100.

Riepilogo

Nella finestra Preparazione dati tutti e tre i passaggi mostrano segni di spunta verdi al termine dell'inserimento dati. È possibile visualizzare i comandi usati da ogni passaggio oppure selezionare una scheda per eseguire query, visualizzare o eliminare i dati inseriti.

Screenshot della pagina di riepilogo con completamento dell'inserimento riuscito.