Delen via


Wat is een lakehouse in Microsoft Fabric?

Microsoft Fabric Lakehouse is een platform voor gegevensarchitectuur voor het opslaan, beheren en analyseren van gestructureerde en ongestructureerde gegevens op één locatie. Het is een flexibele en schaalbare oplossing waarmee organisaties grote hoeveelheden gegevens kunnen verwerken met behulp van verschillende hulpprogramma's en frameworks om die gegevens te verwerken en te analyseren. Het is geïntegreerd met andere hulpprogramma's voor gegevensbeheer en analyse om een uitgebreide oplossing te bieden voor data engineering en analyses.

Gif of overall lakehouse experience.

Lakehouse SQL-analyse-eindpunt

Lakehouse maakt een ondersteunende laag door automatisch een SQL-analyse-eindpunt en een standaard semantisch model te genereren tijdens het maken. Met deze nieuwe see-through-functionaliteit kan de gebruiker rechtstreeks op de Delta-tabellen in het lake werken om een probleemloze en performante ervaring te bieden van gegevensopname tot rapportage.

Het is belangrijk om te weten dat het SQL-analyse-eindpunt een alleen-lezen ervaring is en geen ondersteuning biedt voor het volledige T-SQL-oppervlak van een transactioneel datawarehouse.

Notitie

Alleen de tabellen in Delta-indeling zijn beschikbaar in het SQL Analytics-eindpunt. Parquet, CSV en andere indelingen kunnen niet worden opgevraagd met behulp van het SQL-analyse-eindpunt. Als u de tabel niet ziet, moet u deze converteren naar Delta-indeling.

Automatische tabeldetectie en -registratie

De automatische tabeldetectie en -registratie is een functie van Lakehouse die een volledig beheerd bestand biedt voor gegevenstechnici en gegevenswetenschappers. U kunt een bestand neerzetten in het beheerde gebied van Lakehouse en het systeem valideert het automatisch voor ondersteunde gestructureerde indelingen en registreert het in de metastore met de benodigde metagegevens, zoals kolomnamen, indelingen, compressie en meer. (Momenteel is de enige ondersteunde indeling Delta-tabel.) U kunt vervolgens verwijzen naar het bestand als een tabel en sparkSQL-syntaxis gebruiken om met de gegevens te communiceren.

Interactie met het Lakehouse-item

Een data engineer kan op verschillende manieren communiceren met het lakehouse en de gegevens in het lakehouse:

  • De Lakehouse-verkenner: De verkenner is de belangrijkste interactiepagina van Lakehouse. U kunt gegevens in uw Lakehouse laden, gegevens in Lakehouse verkennen met behulp van de objectverkenner, MIP-labels en verschillende andere dingen instellen. Meer informatie over de verkenner-ervaring: Navigeer door de Fabric Lakehouse-verkenner.

  • Notebooks: Data engineers kunnen het notebook gebruiken om code te schrijven om rechtstreeks naar Lakehouse te lezen, transformeren en schrijven als tabellen en/of mappen. Meer informatie over het gebruik van notebooks voor Lakehouse: Verken de gegevens in uw lakehouse met een notebook en hoe u een notebook gebruikt om gegevens in uw lakehouse te laden.

  • Pijplijnen: Data engineers kunnen hulpprogramma's voor gegevensintegratie gebruiken, zoals het hulpprogramma voor het kopiëren van pijplijnen om gegevens uit andere bronnen op te halen en in Lakehouse te landen. Meer informatie over het gebruik van de kopieeractiviteit: gegevens kopiëren met behulp van kopieeractiviteit.

  • Apache Spark-taakdefinities: data engineers kunnen robuuste toepassingen ontwikkelen en de uitvoering van gecompileerde Spark-taken in Java, Scala en Python organiseren. Meer informatie over Spark-taken: Wat is een Apache Spark-taakdefinitie?

  • Gegevensstromen Gen 2: Data engineers kunnen Dataflows Gen 2 gebruiken om hun gegevens op te nemen en voor te bereiden. Meer informatie over het laden van gegevens met behulp van gegevensstromen: Maak uw eerste gegevensstroom om gegevens op te halen en te transformeren.

Meer informatie over de verschillende manieren om gegevens in uw lakehouse te laden: opties voor het ophalen van gegevens in Fabric Lakehouse.

Multitasking met lakehouse

De multitasking-ervaring biedt een browsertabbladontwerp waarmee u meerdere items naadloos kunt openen en schakelen, zodat u uw Data Lakehouse efficiënter kunt beheren dan ooit. U hoeft niet langer tussen verschillende vensters te schakelen of uw taken te verliezen. Lakehouse biedt een verbeterde multitasking-ervaring om uw databeheertraject zo efficiënt en gebruiksvriendelijk mogelijk te maken met de volgende mogelijkheden:

  • Actieve bewerkingen behouden: u kunt de bewerking voor het laden van gegevens op het ene tabblad uploaden of uitvoeren en controleren op een andere taak op een ander tabblad. Met verbeterde multi-tasking worden de actieve bewerkingen niet geannuleerd wanneer u tussen tabbladen navigeert. U kunt zich richten op uw werk zonder onderbrekingen.

  • Uw context behouden: geselecteerde objecten, gegevenstabellen of bestanden blijven geopend en direct beschikbaar wanneer u schakelt tussen tabbladen. De context van uw Data Lakehouse bevindt zich altijd binnen handbereik.

  • Niet-blokkerende lijst opnieuw laden: een niet-blokkerend herlaadmechanisme voor uw bestanden en tabellenlijst. U kunt blijven werken terwijl de lijst op de achtergrond wordt vernieuwd. Het zorgt ervoor dat u beschikt over de nieuwste gegevens terwijl u een soepele en ononderbroken ervaring krijgt.

  • Duidelijk gedefinieerde meldingen: De pop-upmeldingen geven aan van welk lakehouse ze afkomstig zijn, waardoor het eenvoudiger is om wijzigingen en updates in uw omgeving met meerdere taken bij te houden.

Toegankelijk lakehouse-ontwerp

Toegankelijkheid is altijd een topprioriteit geweest om ervoor te zorgen dat Lakehouse inclusief en gebruiksvriendelijk is voor iedereen. Dit zijn de belangrijkste initiatieven die we tot nu toe hebben geïmplementeerd ter ondersteuning van toegankelijkheid:

  • Compatibiliteit met schermlezers: u kunt naadloos werken met populaire schermlezers, zodat gebruikers met visuele beperkingen effectief kunnen navigeren en met ons platform kunnen communiceren.

  • Responsief ontwerp voor tekstomloop dat zich aanpast aan verschillende schermgrootten en afdrukstanden. Tekst en inhoud worden dynamisch terugstroomd, waardoor gebruikers onze toepassing op verschillende apparaten gemakkelijker kunnen bekijken en ermee kunnen werken.

  • Toetsenbordnavigatie: Verbeterde toetsenbordnavigatie zodat gebruikers door het lakehouse kunnen navigeren zonder te vertrouwen op een muis, waardoor de ervaring voor mensen met motorische beperkingen wordt verbeterd.

  • Alternatieve tekst voor afbeeldingen: alle afbeeldingen bevatten nu een beschrijvende alternatieve tekst, waardoor schermlezers zinvolle informatie kunnen overbrengen.

  • Formuliervelden en labels: alle formuliervelden hebben gekoppelde labels, vereenvoudigen gegevensinvoer voor iedereen, inclusief de velden die schermlezers gebruiken.

In dit overzicht krijgt u basiskennis van een lakehouse. Ga naar het volgende artikel voor meer informatie over het maken en gebruiken van uw eigen lakehouse: