Was ist ein Lakehouse in Microsoft Fabric?
Microsoft Fabric Lakehouse ist eine Datenarchitekturplattform zum Speichern, Verwalten und Analysieren strukturierter und unstrukturierter Daten an einem einzelnen Speicherort. Es stellt eine flexible und skalierbare Lösung dar, die es Organisationen ermöglicht, große Datenmengen mit verschiedenen Tools und Frameworks zu verarbeiten und zu analysieren. Es lässt sich in andere Datenverwaltungs- und Analysetools integrieren, um eine umfassende Lösung für Datentechnik und -analyse bereitzustellen.
Lakehouse SQL-Analyseendpunkt
Lakehouse schafft eine Bereitstellungsebene, indem während der Erstellung automatisch ein SQL-Analyseendpunkt und ein Semantikmodell generiert werden. Diese neue Transparenzfunktion ermöglicht es dem Benutzer, direkt an den Deltatabellen im Lake zu arbeiten, um durchgängig eine reibungslose und leistungsfähige Erfahrung von der Datenerfassung bis zur Berichterstellung zu bieten.
Es muss beachtet werden, dass der SQL-Analyseendpunkteine schreibgeschützte Umgebung ist und nicht den vollständigen T-SQL-Oberflächenbereich eines transaktionsbasierten Data Warehouse unterstützt.
Hinweis
Nur die Tabellen im Delta-Format sind im SQL-Analyseendpunkt verfügbar. Parquet, CSV und andere Formate können über den SQL-Analyseendpunkt nicht abgefragt werden. Wenn Ihre Tabelle nicht angezeigt wird, müssen Sie sie in das Delta-Format konvertieren.
Automatische Tabellenermittlung und -registrierung
Die automatische Tabellenermittlung und -registrierung ist ein Feature von Lakehouse, das eine vollständig verwaltete Datei-zu-Tabelle-Umgebung für Datentechniker und Data Scientists bietet. Sie können eine Datei im verwalteten Bereich des Lakehouse ablegen, und das System validiert die Datei automatisch auf unterstützte strukturierte Formate und registriert sie mit den erforderlichen Metadaten wie Spaltennamen, Formaten, Komprimierung usw. im Metastore. (Aktuell ist Delta-Tabelle das einzige unterstützte Format.) Anschließend können Sie auf die Datei als Tabelle verweisen und SparkSQL-Syntax verwenden, um mit den Daten zu interagieren.
Interaktion mit dem Lakehouse-Element
Ein Datentechniker kann auf verschiedene Weise mit dem Lakehouse und den Daten innerhalb des Lakehouse interagieren:
Der Lakehouse-Explorer: Der Explorer ist die Hauptinteraktionsseite für das Lakehouse. Sie können Daten in Ihr Lakehouse laden, Daten im Lakehouse mit dem Objekt-Explorer untersuchen sowie MIP-Bezeichnungen und verschiedene andere Dinge festlegen. Erfahren Sie mehr über die Explorer-Benutzeroberfläche: Navigieren im Fabric Lakehouse-Explorer.
Notebooks: Datentechniker können das Notebook verwenden, um Code zum Lesen, Transformieren und Schreiben direkt in Lakehouse in Form von Tabellen und/oder Ordnern zu schreiben. Hier erfahren Sie mehr über die Verwendung von Notebooks für Lakehouse: Erkunden der Daten in Ihrem Lakehouse mit einem Notebook und Verwenden eines Notebooks zum Laden von Daten in Ihr Lakehouse.
Pipelines: Datentechniker können Datenintegrationstools wie das Pipelinekopiertool verwenden, um Daten aus anderen Quellen zu abrufen und in Lakehouse einzubringen. Weitere Informationen zur Verwendung der Kopieraktivität: Kopieren von Daten mithilfe der Kopieraktivität.
Apache Spark-Auftragsdefinitionen: Datentechniker können robuste Anwendungen entwickeln und die Ausführung kompilierter Spark-Aufträge in Java, Scala und Python orchestrieren. Weitere Informationen zu Spark-Aufträgen finden Sie unter Was ist eine Apache Spark-Auftragsdefinition?
Dataflows Gen 2: Datentechniker können Dataflows Gen 2 nutzen, um ihre Daten zu erfassen und vorzubereiten. Weitere Informationen zum Laden von Daten mithilfe von Dataflows: Erstellen Ihres ersten Dataflow zum Abrufen und Transformieren von Daten.
Erfahren Sie mehr über die verschiedenen Möglichkeiten zum Laden von Daten in Ihr Lakehouse: Optionen zum Abrufen von Daten im Fabric Lakehouse.
Multitasking mit Lakehouse
Die Multitasking-Oberfläche bietet ein Registerkartendesign wie ein Browser, mit dem Sie nahtlos mehrere Elemente öffnen und zwischen ihnen wechseln können, sodass Sie Ihr Data Lakehouse effizienter verwalten können als je zuvor. Sie müssen nicht mehr zwischen verschiedenen Fenstern jonglieren und verlieren nicht den Überblick über Ihre Aufgaben. Lakehouse bietet eine verbesserte Multitasking-Erfahrung, um Ihre Datenverwaltungsreise so effizient und benutzerfreundlich wie möglich zu gestalten. Das umfasst die folgenden Funktionen:
Beibehalten ausgeführter Vorgänge: Sie können den Datenladevorgang auf einer Registerkarte hochladen oder ausführen und eine andere Aufgabe auf einer anderen Registerkarte überprüfen. Mit erweitertem Multitasking werden die ausgeführten Vorgänge beim Navigieren zwischen Registerkarten nicht abgebrochen. Sie können sich ohne Unterbrechungen auf Ihre Arbeit konzentrieren.
Beibehalten Ihres Kontexts: Ausgewählte Objekte, Datentabellen oder Dateien bleiben geöffnet und sind beim Wechseln zwischen Registerkarten sofort verfügbar. Der Kontext Ihres Data Lakehouse steht Ihnen immer zur Verfügung.
Nicht blockierendes Neuladen der Liste: Ein nicht blockierender Neulademechanismus für Ihre Dateien und Tabellenliste. Sie können weiterarbeiten, während die Liste im Hintergrund aktualisiert wird. Dadurch wird sichergestellt, dass Sie über die neuesten Daten verfügen, während Sie eine reibungslose und unterbrechungsfreie Erfahrung erhalten.
Klar definierte Benachrichtigungen: Die Popupbenachrichtigungen geben an, von welchem Lakehouse sie stammen, wodurch das Nachverfolgen von Änderungen und Updates in Ihrer Umgebung mit mehreren Aufgaben erleichtert wird.
Barrierefreies Lakehouse-Design
Barrierefreiheit hat immer oberste Priorität, um sicherzustellen, dass Lakehouse inklusiv und für alle Benutzer*innen benutzerfreundlich ist. Hier sind die wichtigsten Initiativen, die wir bisher umgesetzt haben, um die Barrierefreiheit zu unterstützen:
Kompatibilität der Sprachausgabe: Sie können nahtlos mit beliebten Bildschirmsprachausgaben arbeiten, sodass sehbehinderte Benutzer*innen effektiv auf unserer Plattform navigieren und damit interagieren können.
Textumbruch: Dynamisches Design, das sich an verschiedene Bildschirmgrößen und Ausrichtungen anpasst. Text und Inhalt werden dynamisch umgebrochen, sodass Benutzer*innen unsere Anwendung auf einer Vielzahl von Geräten einfacher anzeigen und mit damit interagieren können.
Tastaturnavigation: Verbesserte Tastaturnavigation, damit Benutzer*innen durch Lakehouse navigieren können, ohne sich auf eine Maus zu verlassen, wodurch die Erfahrung für Personen mit motorischen Einschränkungen verbessert wird.
Alternativtext für Bilder: Alle Bilder enthalten nun einen beschreibenden Alternativtext, sodass Bildschirmsprachausgaben aussagekräftige Informationen vermitteln können.
Formularfelder und Bezeichnungen: Allen Formularfeldern sind Bezeichnungen zugeordnet, was die Dateneingabe für jeden vereinfacht, auch für jene, die Bildschirmsprachausgaben verwenden.
Zugehöriger Inhalt
In dieser Übersicht erwerben Sie ein grundlegendes Verständnis eines Lakehouse. Fahren Sie mit dem nächsten Artikel fort, um zu erfahren, wie Sie Ihr eigenes Lakehouse erstellen:
- Informationen zum Verwenden von Lakehouses finden Sie unter Erstellen eines Lakehouse in Microsoft Fabric.