Indlæs i tabellen Delta Lake

Lakehouse i Microsoft Fabric indeholder en funktion til effektivt at indlæse almindelige filtyper i en optimeret Delta-tabel, der er klar til analyse. Funktionen Indlæs i tabel giver brugerne mulighed for at indlæse en enkelt fil eller en mappe med filer i en tabel. Denne funktion øger produktiviteten for datateknikere ved hurtigt at bruge en højreklikshandling til at aktivere indlæsning af tabeller i filer og mapper. Indlæsning til tabellen er også en oplevelse uden kode, hvilket sænker indgangslinjen for alle personer.

Oversigt over indlæsning i tabelfunktioner

Her er en liste over funktioner, som vi har aktiveret i den integrerede indlæsning til tabeloplevelse for at give vores brugere fleksibilitet og samtidig øge deres produktivitet:

  • Understøttede filtyper: Denne funktion understøtter i øjeblikket kun indlæsning af PARQUET- eller CSV-filtyper. Det er lige meget, om der er tale om filtypenavne.

  • Indlæsning af en enkelt fil: Brugerne kan indlæse en enkelt fil efter eget valg i et af de understøttede formater ved at vælge "Indlæs i Delta-tabel" i filens genvejsmenuhandling.

  • Indlæsning på mappeniveau: Du kan indlæse alle filer under en mappe og dens undermapper på én gang ved at vælge "Indlæs i Delta-tabel", når du har klikket på en mappe. Denne funktion gennemgår automatisk alle filer og indlæser dem i en Delta-tabel. Det er vigtigt at bemærke, at det kun er filer af samme type, der kan indlæses samtidig i en tabel.

  • Indlæs i ny og eksisterende tabel: Brugeren kan vælge at indlæse deres filer og mapper i en ny tabel eller en eksisterende tabel efter eget valg. Hvis de vælger at indlæse i en eksisterende tabel, kan de enten tilføje eller overskrive deres data i tabellen.

  • Indstilling for CSV-kildefil: For CSV-filer tillader vi, at brugeren angiver, om deres kildefil indeholder overskrifter, de vil bruge som kolonnenavne. Brugerne kan også angive en separator efter eget valg for at tilsidesætte den eksisterende standard kommaseparator.

  • Indlæst som Delta-tabeller: Tabeller indlæses altid ved hjælp af tabelformatet Delta Lake med V-Order-optimering aktiveret.

    Gif af den overordnede indlæsningsmappe til tabeloplevelsen.

Bemærk

I øjeblikket kan du ikke angive tabelskemaet via brugergrænsefladen i Lakehouse. Du skal bruge en notesbog til dette formål.

Retningslinjer og regler for validering

Følgende standard gælder for indlæs til tabeloplevelsen:

  • Tabelnavne kan kun indeholde alfanumeriske tegn og understregningstegn. Den tillader også alle engelske bogstaver, store eller små bogstaver og understregningstegn (_) med en maksimumlængde på 256 tegn. Streger (-) eller mellemrumstegn er ikke tilladt.

  • Tekstfiler uden kolonneoverskrifter erstattes med standardnotation col# som tabelkolonnenavne.

  • Kolonnenavne tillader engelske bogstaver, store eller små bogstaver, understregningstegn (_) og tegn på andre sprog, f.eks. kinesisk i UTF, på op til 32 tegn. Kolonnenavne valideres under indlæsningshandlingen. Algoritmen Indlæs i Delta erstatter forbudte værdier med underbjælken (_). Hvis der ikke opnås et korrekt kolonnenavn under valideringen, mislykkes indlæsningshandlingen.

  • I forbindelse med CSV-filer må separatoren ikke være tom, må ikke være længere end 8 tegn eller bruge et af følgende tegn: (, ), [, ], , ,{} enkelt anførselstegn ('), dobbelt anførselstegn (") og blanktegn.