Delen via


Laden naar Delta Lake-tabel

De Lakehouse in Microsoft Fabric biedt een functie voor het efficiënt laden van algemene bestandstypen naar een geoptimaliseerde Delta-tabel die gereed is voor analyse. Met de functie Laden naar tabel kunnen gebruikers één bestand of een map met bestanden naar een tabel laden. Deze functie verhoogt de productiviteit voor data engineers doordat ze snel een actie met de rechtermuisknop kunnen gebruiken om het laden van tabellen in bestanden en mappen in te schakelen. Laden naar de tabel is ook een ervaring zonder code, waardoor de invoerbalk voor alle persona's wordt verlaagd.

Overzicht van load to table-mogelijkheden

Hier volgt een lijst met functies die we in de geïntegreerde load to table-ervaring hebben ingeschakeld om onze gebruikers flexibiliteit te bieden en tegelijkertijd hun productiviteit te verhogen:

  • Ondersteunde bestandstypen: deze functie ondersteunt momenteel alleen het laden van PARQUET- of CSV-bestandstypen. Bestandsextensie case maakt niet uit.

  • Laden van één bestand: gebruikers kunnen één bestand van hun keuze laden in een van de ondersteunde indelingen door 'Laden naar Delta-tabel' te selecteren in de contextmenuactie van het bestand.

  • Laden op mapniveau: u kunt alle bestanden onder een map en de bijbehorende submappen tegelijk laden door 'Laden naar Delta-tabel' te selecteren nadat u op een map hebt geklikt. Met deze functie worden alle bestanden automatisch doorkruist en geladen naar een Delta-tabel. Het is belangrijk om te weten dat alleen bestanden van hetzelfde type tegelijkertijd naar een tabel kunnen worden geladen.

  • Laden naar nieuwe en bestaande tabel: Gebruikers kunnen ervoor kiezen hun bestanden en mappen te laden in een nieuwe tabel of een bestaande tabel naar keuze. Als ze ervoor kiezen om te laden in een bestaande tabel, kunnen ze hun gegevens in de tabel toevoegen of overschrijven.

  • Optie voor CSV-bronbestand: Voor CSV-bestanden kunnen gebruikers opgeven of hun bronbestand kopteksten bevat die ze als kolomnamen willen gebruiken. Gebruikers kunnen ook een scheidingsteken van hun keuze opgeven om het standaardscheidingsteken voor komma's te overschrijven.

  • Geladen als Delta-tabellen: tabellen worden altijd geladen met de Delta Lake-tabelindeling waarvoor V-Orderoptimalisatie is ingeschakeld.

    Gif van de algemene laadmap voor tabelervaring.

Notitie

Op dit moment kunt u het tabelschema niet opgeven via de gebruikersinterface van Lakehouse. u moet hiervoor een notitieblok gebruiken.

Validatierichtlijnen en -regels

De volgende standaard is van toepassing op de ervaring Laden op tabel:

  • Tabelnamen mogen alleen alfanumerieke tekens en onderstrepingstekens bevatten. Het staat ook elke Engelse letter, hoofdletter of kleine letter en onderstrepingsteken (_), met een maximale lengte van 256 tekens toe. Er zijn geen streepjes (-) of spatietekens toegestaan.

  • Tekstbestanden zonder kolomkoppen worden vervangen door standaard col# notatie als tabelkolomnamen.

  • Kolomnamen staan elke Engelse letter, hoofdletter of kleine letter, onderstrepingsteken (_) en tekens in andere talen toe, zoals Chinees in UTF, lengte tot 32 tekens. Kolomnamen worden gevalideerd tijdens de laadactie. Het algoritme Laden naar Delta vervangt verboden waarden door de onderbalk (_). Als er tijdens de validatie geen juiste kolomnaam wordt bereikt, mislukt de laadactie.

  • Voor CSV-bestanden mag het scheidingsteken niet leeg zijn, mag niet langer zijn dan 8 tekens of mag een van de volgende tekens worden gebruikt: (, )[],{} , enkele aanhalingsteken (), dubbele aanhalingstekens ('") en witruimte.