Bemærk
Adgang til denne side kræver godkendelse. Du kan prøve at logge på eller ændre mapper.
Adgang til denne side kræver godkendelse. Du kan prøve at ændre mapper.
Microsoft Fabric Lakehouse er en dataarkitekturplatform til lagring, administration og analyse af strukturerede og ustrukturerede data på en enkelt placering. Delta Lake er valgt som det samlede tabelformat for at opnå problemfri dataadgang på tværs af alle beregningsprogrammer i Microsoft Fabric.
Når du gemmer data i et lakehouse ved hjælp af funktioner som Indlæs i tabel eller metoder, der er beskrevet i Indstillinger for at hente data ind i Fabric Lakehouse, gemmes alle data i Delta-format.
Hvis du vil have en mere omfattende introduktion til tabelformatet Delta Lake, skal du følge linkene til relateret indhold i slutningen af denne artikel.
Big data-, Apache Spark- og ældre tabelformater
Microsoft Fabric Runtime til Apache Spark bruger det samme fundament som Azure Synapse Analytics Runtime til Apache Spark, men indeholder vigtige forskelle for at give en mere strømlinet funktionsmåde på tværs af alle programmer i Microsoft Fabric-tjenesten. I Microsoft Fabric er vigtige ydeevnefunktioner som standard slået til. Avancerede Apache Spark-brugere kan gendanne konfigurationer til tidligere værdier for bedre at tilpasse sig bestemte scenarier.
Microsoft Fabric Lakehouse og Apache Spark-programmet understøtter alle tabeltyper, både administrerede og ikke-administrerede. Dette omfatter visninger og almindelige tabelformater, der ikke er Delta Hive. Tabeller, der er defineret ved hjælp af PARQUET, CSV, AVRO, JSON og et hvilket som helst Apache Hive-kompatibelt filformat, fungerer som forventet.
Oplevelsen af brugergrænsefladen i Lakehouse Explorer varierer afhængigt af tabeltypen. I øjeblikket gengiver Lakehouse-stifinderen kun tabelobjekter.
Konfigurationsforskelle med Azure Synapse Analytics
Følgende tabel indeholder konfigurationsforskellene mellem Azure Synapse Analytics og Microsoft Fabric Runtime for Apache Spark.
Apache Spark-konfiguration | Microsoft Fabric-værdi | Azure Synapse Analytics-værdi | Bemærkninger |
---|---|---|---|
spark.sql.sources.default | delta | Parket | Standardtabelformat |
spark.sql.parquet.vorder.default | sand | I/R | V-Order-skriver |
spark.sql.parquet.vorder.dictionaryPageSize | 2 GB | I/R | Grænse for størrelse på ordbogsside for V-order |
spark.databricks.delta.optimizeWrite.enabled | sand | unset (falsk) | Optimer skrivning |
Automatisk registrering af tabeller
Lakehouse Explorer giver en trælignende visning af objekterne i Microsoft Fabric Lakehouse-elementet. Den har en nøglefunktion til at finde og vise tabeller, der er beskrevet i metadatalageret og i OneLake-lageret. Tabelreferencerne vises under Tables
afsnittet i brugergrænsefladen i Lakehouse Explorer. Automatisk registrering gælder også for tabeller, der er defineret via OneLake-genveje.
Tabeller over genveje
Microsoft Fabric Lakehouse understøtter tabeller, der er defineret via OneLake-genveje, for at sikre størst mulig kompatibilitet og ingen dataflytning. Følgende tabel indeholder scenariets bedste fremgangsmåder for hver elementtype, når den bruges via genveje.
Genvejsdestination | Sådan opretter du genvejen | Anbefalet fremgangsmåde |
---|---|---|
Delta Lake-tabel |
Tables afsnit |
Hvis der findes flere tabeller i destinationen, skal du oprette én genvej pr. tabel. |
Mapper med filer |
Files afsnit |
Brug Apache Spark til at bruge destinationen direkte ved hjælp af relative stier. Indlæs dataene i Lakehouse-oprindelige Delta-tabeller for at opnå maksimal ydeevne. |
Ældre Apache Hive-tabeller |
Files afsnit |
Brug Apache Spark til at bruge destinationen direkte ved hjælp af relative stier, eller opret en reference til metadatakataloget ved hjælp af CREATE EXTERNAL TABLE syntaks. Indlæs dataene i Lakehouse-oprindelige Delta-tabeller for at opnå maksimal ydeevne. |
Indlæs i tabel
Microsoft Fabric Lakehouse indeholder en praktisk og produktiv brugergrænseflade til at strømline indlæsning af data i Delta-tabeller. Funktionen Indlæs til tabel giver en visuel oplevelse til indlæsning af almindelige filformater til Delta for at øge analyseproduktiviteten for alle personer. Hvis du vil vide mere om funktionen Indlæs til tabel, skal du læse referencedokumentationen Indlæs til Delta Lake-tabeller .
Delta Lake-tabeloptimering
Det er ikke nogen mindre bedrift at holde tabeller i form til det brede omfang af analysescenarier. Microsoft Fabric Lakehouse muliggør proaktivt de vigtige parametre for at minimere almindelige problemer, der er forbundet med big data-tabeller, f.eks. komprimering og små filstørrelser, og for at maksimere ydeevnen af forespørgsler. Der er stadig mange scenarier, hvor disse parametre skal ændres. Artiklen Delta Lake-tabeloptimering og V-Order dækker nogle vigtige scenarier og indeholder en detaljeret vejledning i, hvordan du effektivt vedligeholder Delta-tabeller for at opnå maksimal ydeevne.