Ottenere dati da OneLake

Questo articolo illustra come ottenere dati da OneLake in una tabella nuova o esistente.

Prerequisiti

Copiare il percorso del file da Lakehouse

  1. Nel commutatore dell'esperienza scegliere Ingegneria dei dati.

  2. Selezionare l'ambiente Lakehouse contenente l'origine dati da usare.

  3. Posizionare il cursore sul file desiderato e selezionare il menu Altro , quindi selezionare Proprietà.

    Importante

    • I percorsi delle cartelle non sono supportati.
    • I caratteri jolly (*) non sono supportati.

    Screenshot of a Lakehouse file's dropdown menu. The option titled Properties is highlighted.

  4. In URL selezionare l'icona Copia negli Appunti e salvarla da qualche parte per recuperarla in un passaggio successivo.

    Screenshot of a Lakehouse file's Properties pane. The copy icon to the right of the file's URL is highlighted.

  5. Tornare all'area di lavoro e selezionare un database KQL.

Origine

  1. Nella barra multifunzione inferiore del database KQL selezionare Recupera dati.

    Nella finestra Recupera dati è selezionata la scheda Origine .

  2. Selezionare l'origine dati dall'elenco disponibile. In questo esempio si inseriscono dati da OneLake.

    Screenshot of get data window with source tab selected.

Configurazione

  1. Selezionare una tabella di destinazione. Se si desidera inserire dati in una nuova tabella, selezionare +Nuova tabella e immettere un nome di tabella.

    Nota

    I nomi delle tabelle possono avere un massimo di 1024 caratteri, inclusi spazi, alfanumerici, trattini e caratteri di sottolineatura. I caratteri speciali non sono supportati.

  2. Nel file OneLake incollare il percorso del file di Lakehouse copiato in Copia percorso file da Lakehouse.

    Nota

    È possibile aggiungere fino a 10 elementi di dimensioni fino a 1 GB non compressi ciascuno.

    Screenshot of configure tab with new table entered and a OneLake file path added.

  3. Selezionare Avanti.

Controllare

Viene visualizzata la scheda Inspect con un'anteprima dei dati.

Per completare il processo di inserimento, selezionare Fine.

Screenshot of the inspect tab.

Facoltativamente:

  • Selezionare Visualizzatore comandi per visualizzare e copiare i comandi automatici generati dagli input.
  • Usare l'elenco a discesa File di definizione dello schema per modificare il file da cui viene dedotto lo schema.
  • Modificare il formato dei dati dedotto automaticamente selezionando il formato desiderato dall'elenco a discesa. Per altre informazioni, vedere Formati di dati supportati da Analisi in tempo reale.
  • Modificare le colonne.
  • Esplorare Le opzioni avanzate in base al tipo di dati.

Modifica colonne

Nota

  • Per i formati tabulari (CSV, TSV, PSV), non è possibile eseguire il mapping di una colonna due volte. Per eseguire il mapping a una colonna esistente, eliminare prima quella nuova.
  • Non è possibile modificare un tipo di colonna esistente. Se si tenta di eseguire il mapping a una colonna con un formato diverso, è possibile che si verifichino colonne vuote.

Le modifiche che è possibile apportare in una tabella dipendono dai parametri seguenti:

  • Il tipo di tabella è nuovo o esistente
  • Il tipo di mapping è nuovo o esistente
Tipo di tabella Tipo di mapping Modifiche disponibili
Nuova tabella Nuovo mapping Rinominare la colonna, modificare il tipo di dati, modificare l'origine dati, la trasformazione mapping, aggiungere una colonna, eliminare una colonna
Tabella esistente Nuovo mapping Aggiungi colonna (in cui è possibile modificare il tipo di dati, rinominare e aggiornare)
Tabella esistente Mapping esistente Nessuno

Screenshot of columns open for editing.

Trasformazioni del mapping

Alcuni mapping del formato dati (Parquet, JSON e Avro) supportano semplici trasformazioni in fase di inserimento. Per applicare trasformazioni di mapping, creare o aggiornare una colonna nella finestra Modifica colonne .

Le trasformazioni di mapping possono essere eseguite su una colonna di tipo string o datetime, con l'origine con tipo di dati int o long. Le trasformazioni del mapping supportate sono:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Opzioni avanzate basate sul tipo di dati

Tabulare (CSV, TSV, PSV):

  • Se si inseriscono formati tabulari in una tabella esistente, è possibile selezionare Schema tabella Mantieni avanzato>. I dati tabulari non includono necessariamente i nomi di colonna usati per eseguire il mapping dei dati di origine alle colonne esistenti. Quando questa opzione è selezionata, il mapping viene eseguito in base all'ordine e lo schema della tabella rimane invariato. Se questa opzione è deselezionata, vengono create nuove colonne per i dati in ingresso, indipendentemente dalla struttura dei dati.

  • Per usare la prima riga come nomi di colonna, selezionare Avanzate>Prima riga è intestazione di colonna.

    Screenshot of advanced CSV options.

JSON:

  • Per determinare la divisione delle colonne dei dati JSON, selezionare Livelli annidati avanzati>, da 1 a 100.

  • Se si seleziona Advanced Skip JSON lines with errors (Ignora righe JSON avanzate>con errori), i dati vengono inseriti in formato JSON. Se si lascia deselezionata questa casella di controllo, i dati vengono inseriti in formato multijson.

    Screenshot of advanced JSON options.

Riepilogo

Nella finestra Preparazione dati tutti e tre i passaggi vengono contrassegnati con segni di spunta verdi al termine dell'inserimento dati. È possibile selezionare una scheda per eseguire query, eliminare i dati inseriti o visualizzare un dashboard del riepilogo dell'inserimento.

Screenshot of summary page with successful ingestion completed.