Ottenere dati da Amazon S3
Questo articolo illustra come ottenere dati da Amazon S3 in una tabella nuova o esistente. Amazon S3 è un servizio di archiviazione oggetti creato per archiviare e recuperare i dati.
Per altre informazioni su Amazon S3, vedi Che cos'è Amazon S3?.
Prerequisiti
- Un'area di lavoro con capacità abilitata per Microsoft Fabric
- Un database KQL con autorizzazioni di modifica
- Un bucket Amazon S3 con dati
Origine
Nella barra multifunzione inferiore del database KQL selezionare Recupera dati.
Nella finestra Recupera dati è selezionata la scheda Origine .
Selezionare l'origine dati dall'elenco disponibile. In questo esempio vengono inseriti dati da Amazon S3.
Configurazione
Selezionare una tabella di destinazione. Se si desidera inserire dati in una nuova tabella, selezionare +Nuova tabella e immettere un nome di tabella.
Nota
I nomi delle tabelle possono avere un massimo di 1024 caratteri, inclusi spazi, alfanumerici, trattini e caratteri di sottolineatura. I caratteri speciali non sono supportati.
Nel campo URI incollare il stringa di connessione di un singolo bucket o un singolo oggetto nel formato seguente.
Bucket:
https://
BucketName.s3.
RegionName.amazonaws.com;AwsCredentials=
AwsAccessID,
AwsSecretKeyFacoltativamente, è possibile applicare filtri bucket per filtrare i dati in base a un'estensione di file specifica.
Selezionare Avanti.
Controllare
Viene visualizzata la scheda Inspect con un'anteprima dei dati.
Per completare il processo di inserimento, selezionare Fine.
Facoltativamente:
- Selezionare Visualizzatore comandi per visualizzare e copiare i comandi automatici generati dagli input.
- Usare l'elenco a discesa File di definizione dello schema per modificare il file da cui viene dedotto lo schema.
- Modificare il formato dei dati dedotto automaticamente selezionando il formato desiderato dall'elenco a discesa. Per altre informazioni, vedere Formati di dati supportati da Analisi in tempo reale.
- Modificare le colonne.
- Esplorare Le opzioni avanzate in base al tipo di dati.
Modifica colonne
Nota
- Per i formati tabulari (CSV, TSV, PSV), non è possibile eseguire il mapping di una colonna due volte. Per eseguire il mapping a una colonna esistente, eliminare prima quella nuova.
- Non è possibile modificare un tipo di colonna esistente. Se si tenta di eseguire il mapping a una colonna con un formato diverso, è possibile che si verifichino colonne vuote.
Le modifiche che è possibile apportare in una tabella dipendono dai parametri seguenti:
- Il tipo di tabella è nuovo o esistente
- Il tipo di mapping è nuovo o esistente
Tipo di tabella | Tipo di mapping | Modifiche disponibili |
---|---|---|
Nuova tabella | Nuovo mapping | Rinominare la colonna, modificare il tipo di dati, modificare l'origine dati, la trasformazione mapping, aggiungere una colonna, eliminare una colonna |
Tabella esistente | Nuovo mapping | Aggiungi colonna (in cui è possibile modificare il tipo di dati, rinominare e aggiornare) |
Tabella esistente | Mapping esistente | Nessuno |
Trasformazioni del mapping
Alcuni mapping del formato dati (Parquet, JSON e Avro) supportano semplici trasformazioni in fase di inserimento. Per applicare trasformazioni di mapping, creare o aggiornare una colonna nella finestra Modifica colonne .
Le trasformazioni di mapping possono essere eseguite su una colonna di tipo string o datetime, con l'origine con tipo di dati int o long. Le trasformazioni del mapping supportate sono:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Opzioni avanzate basate sul tipo di dati
Tabulare (CSV, TSV, PSV):
Se si inseriscono formati tabulari in una tabella esistente, è possibile selezionare Schema tabella Mantieni avanzato>. I dati tabulari non includono necessariamente i nomi di colonna usati per eseguire il mapping dei dati di origine alle colonne esistenti. Quando questa opzione è selezionata, il mapping viene eseguito in base all'ordine e lo schema della tabella rimane invariato. Se questa opzione è deselezionata, vengono create nuove colonne per i dati in ingresso, indipendentemente dalla struttura dei dati.
Per usare la prima riga come nomi di colonna, selezionare Avanzate>Prima riga è intestazione di colonna.
JSON:
Per determinare la divisione delle colonne dei dati JSON, selezionare Livelli annidati avanzati>, da 1 a 100.
Se si seleziona Advanced Skip JSON lines with errors (Ignora righe JSON avanzate>con errori), i dati vengono inseriti in formato JSON. Se si lascia deselezionata questa casella di controllo, i dati vengono inseriti in formato multijson.
Riepilogo
Nella finestra Preparazione dati tutti e tre i passaggi vengono contrassegnati con segni di spunta verdi al termine dell'inserimento dati. È possibile selezionare una scheda per eseguire query, eliminare i dati inseriti o visualizzare un dashboard del riepilogo dell'inserimento.
Contenuto correlato
- Per gestire il database, vedere Gestire i dati
- Per creare, archiviare ed esportare query, vedere Eseguire query sui dati in un set di query KQL
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per