Ottenere dati da Archiviazione di Azure
L'inserimento dati è il processo usato per caricare dati da una o più origini in una tabella in Azure Esplora dati. Una volta inseriti, i dati diventano disponibili per le query. Questo articolo illustra come ottenere dati da Archiviazione di Azure (contenitore ADLS Gen2, contenitore BLOB o SINGOLI BLOB) in una tabella nuova o esistente.
L'inserimento può essere eseguito come operazione una tantum o come metodo continuo. L'inserimento continuo può essere configurato solo tramite il portale.
Per informazioni generali sull'inserimento dati, vedere Panoramica dell'inserimento di dati in Azure Esplora dati.
Prerequisiti
- Un account Microsoft o un'identità utente di Microsoft Entra. Non è necessaria una sottoscrizione di Azure.
- Accedere all'interfaccia utente Web di Azure Esplora dati.
- Un cluster e un database di Esplora dati di Azure. Creare un cluster e un database.
- Un account di archiviazione.
Recuperare i dati
Nel menu a sinistra selezionare Query.
Fare clic con il pulsante destro del mouse sul database in cui si desidera inserire i dati. Selezionare Recupera dati.
Source
Nella finestra Recupera dati è selezionata la scheda Origine .
Selezionare l'origine dati dall'elenco disponibile. In questo esempio si inseriscono dati da Archiviazione di Azure.
Configurare
Selezionare un database e una tabella di destinazione. Per inserire dati in una nuova tabella, selezionare + Nuova tabella e immettere un nome di tabella.
Nota
I nomi delle tabelle possono contenere fino a 1024 caratteri, inclusi spazi, alfanumerici, trattini e caratteri di sottolineatura. I caratteri speciali non sono supportati.
Per aggiungere l'origine, selezionare Seleziona contenitore o Aggiungi URI.
Se si seleziona Seleziona contenitore, compilare i campi seguenti:
Impostazione Descrizione campo Subscription ID sottoscrizione in cui si trova l'account di archiviazione. Account di archiviazione Nome che identifica l'account di archiviazione. Contenitore Contenitore di archiviazione da inserire. Filtri file (facoltativo) Percorso della cartella Filtra i dati per inserire file con un percorso di cartella specifico. Estensione file Filtra i dati per inserire file solo con un'estensione di file specifica. Se è stato selezionato Aggiungi URI, incollare il stringa di connessione di archiviazione per un contenitore BLOB o singoli file nel campo URI e quindi selezionare +.
Nota
- È possibile aggiungere fino a 10 SINGOLI BLOB. Ogni BLOB può essere un massimo di 1 GB non compresso.
- È possibile inserire fino a 5000 BLOB da un singolo contenitore.
Selezionare Avanti
Controllare
Viene visualizzata la scheda Inspect con un'anteprima dei dati.
Per completare il processo di inserimento, selezionare Fine.
Facoltativamente:
- Selezionare Visualizzatore comandi per visualizzare e copiare i comandi automatici generati dagli input.
- Usare l'elenco a discesa File di definizione dello schema per modificare il file da cui viene dedotto lo schema.
- Modificare il formato dati dedotto automaticamente selezionando il formato desiderato dall'elenco a discesa. Per l'inserimento, vedere Formati di dati supportati da Azure Esplora dati.
- Modificare le colonne.
- Esplorare Le opzioni avanzate in base al tipo di dati.
Modifica colonne
Nota
- Per i formati tabulari (CSV, TSV, PSV), non è possibile eseguire il mapping di una colonna due volte. Per eseguire il mapping a una colonna esistente, eliminare prima quella nuova.
- Non è possibile modificare un tipo di colonna esistente. Se si tenta di eseguire il mapping a una colonna con un formato diverso, è possibile che si verifichino colonne vuote.
Le modifiche che è possibile apportare in una tabella dipendono dai parametri seguenti:
- Il tipo di tabella è nuovo o esistente
- Il tipo di mapping è nuovo o esistente
Tipo di tabella. | Tipo di mapping | Modifiche disponibili |
---|---|---|
Nuova tabella | Nuovo mapping | Rinominare la colonna, modificare il tipo di dati, modificare l'origine dati, la trasformazione del mapping, aggiungere una colonna, eliminare una colonna |
Tabella esistente | Nuovo mapping | Aggiungere una colonna (in cui è possibile modificare il tipo di dati, rinominare e aggiornare) |
Tabella esistente | Mapping esistente | Nessuno |
Trasformazioni del mapping
Alcuni mapping del formato dati (Parquet, JSON e Avro) supportano semplici trasformazioni in fase di inserimento. Per applicare trasformazioni di mapping, creare o aggiornare una colonna nella finestra Modifica colonne .
Le trasformazioni di mapping possono essere eseguite su una colonna di tipo string o datetime, con l'origine con tipo di dati int o long. Le trasformazioni del mapping supportate sono:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Opzioni avanzate basate sul tipo di dati
Tabulare (CSV, TSV, PSV):Tabular (CSV, TSV, PSV):Tabular (CSV, TSV, PSV):
Se si inseriscono formati tabulari in una tabella esistente, è possibile selezionare Avanzate>Mantieni schema di tabella corrente. I dati tabulari non includono necessariamente i nomi di colonna usati per eseguire il mapping dei dati di origine alle colonne esistenti. Quando questa opzione viene selezionata, il mapping viene eseguito in base all'ordine e lo schema della tabella rimane invariato. Se questa opzione è deselezionata, le nuove colonne vengono create per i dati in ingresso, indipendentemente dalla struttura dei dati.
Per usare la prima riga come nomi di colonna, selezionare AdvancedFirst row is column header (Intestazione> di colonna).
JSON:
Per determinare la divisione di colonne dei dati JSON, selezionare Livellinidificatiavanzati>, da 1 a 100.
Se si seleziona Advanced>Ignore data format errors ,i dati vengono inseriti in formato JSON. Se si lascia deselezionata questa casella di controllo, i dati vengono inseriti in formato multijson.
Riepilogo
Nella finestra Preparazione dati tutti e tre i passaggi sono contrassegnati con i segni di spunta verdi al termine dell'inserimento dei dati. È possibile visualizzare i comandi usati per ogni passaggio oppure selezionare una scheda per eseguire query, visualizzare o eliminare i dati inseriti.
Contenuti correlati
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per