Freigeben über


Was ist Spiegelung in Fabric?

Die Spiegelung in Fabric ist eine kostengünstige und latenzarme Lösung, um Daten aus verschiedenen Systemen in einer einzigen Analyseplattform zusammenzubringen. Sie können Ihre vorhandene Datenmenge kontinuierlich direkt aus einer Vielzahl von Azure-Datenbanken und externen Datenquellen in Fabrics OneLake replizieren.

Mit den meisten up-to-Datumsdaten in einem abfragefähigen Format in OneLake können Sie jetzt alle verschiedenen Dienste in Fabric verwenden, z. B. die Ausführung von Analysen mit Spark, das Ausführen von Notizbüchern, das Daten engineering, die Visualisierung über Power BI-Berichte und vieles mehr.

Die Spiegelung in Fabric ermöglicht Es Benutzern, ein hoch integriertes, end-to-End- und benutzerfreundliches Produkt zu genießen, das für die Vereinfachung Ihrer Analyseanforderungen konzipiert ist. Für Offenheit und Zusammenarbeit zwischen Microsoft und Technologielösungen entwickelt, die das Open-Source-Delta Lake-Tabellenformat lesen können, ist Mirroring eine kostengünstige und low-latey turnkey-Lösung, mit der Sie ein Replikat Ihrer Daten in OneLake erstellen können, das für alle Ihre analytischen Anforderungen verwendet werden kann.

Die Delta-Tabellen können dann überall in Fabric verwendet werden, sodass Benutzer ihre Reise in Fabric beschleunigen können.

Gründe für die Verwendung von Spiegelung in Fabric

Heute verfügen viele Organisationen über unternehmenskritische betriebskritische oder analytische Daten, die in Silos sitzen.

Für den Heutigen Zugriff und die Arbeit mit diesen Daten sind komplexe ETL-Pipelines (Extract Transform Load), Geschäftsprozesse und Entscheidungssilos erforderlich, wodurch Folgendes entsteht:

  • Eingeschränkter und eingeschränkter Zugriff auf wichtige, sich ständig ändernde Daten
  • Reibung zwischen Menschen, Prozessen und Technologien
  • Lange Wartezeiten beim Erstellen von Pipelines und Prozessen zu kritisch wichtigen Daten.
  • Keine Freiheit, die Tools zu verwenden, die Sie benötigen, um Einblicke bequem zu analysieren und freizugeben
  • Mangel an einer richtigen Grundlage für Die Leute, um Daten zu teilen und zusammenzuarbeiten
  • Keine gängigen, offenen Datenformate für alle analytischen Szenarien – BI, AI, Integration, Engineering und sogar Apps

Die Spiegelung in Fabric bietet eine einfache Erfahrung, um die Zeit für Erkenntnisse und Entscheidungen zu beschleunigen und Datensilos zwischen Technologielösungen aufzuschlüsseln:

  • Nahezu echtzeitbasierte Replikation von Daten und Metadaten in einen SaaS-Datensee mit integrierter Analyse für BI und KI

Die Microsoft Fabric-Plattform basiert auf einer Grundlage von Software as a Service (SaaS), die Einfachheit und Integration auf eine ganz neue Ebene erfordert. Weitere Informationen zu Microsoft Fabric finden Sie unter Was ist Microsoft Fabric?

Die Spiegelung erstellt diese Elemente in Ihrem Fabric-Arbeitsbereich:

  • Die Spiegelung verwaltet die Replikation von Daten und Metadaten in OneLake und die Konvertierung in Parkett in einem analysefähigen Format. Dies ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und mehr.
  • Ein SQL-Analyseendpunkt

Zusätzlich zum SQL-Abfrage-Editor gibt es ein breites Ökosystem von Tools, einschließlich SQL Server Management Studio (SSMS),der mssql-Erweiterung mit Visual Studio Code und sogar GitHub Copilot.

Die Freigabe ermöglicht die erleichterte Zugriffssteuerung und -verwaltung, um sicherzustellen, dass Sie den Zugriff auf vertrauliche Informationen steuern können. Die Freigabe ermöglicht auch sichere und demokratisierte Entscheidungsfindung in Ihrer Gesamten Organisation.

Spiegelungstypen

Fabric bietet drei verschiedene Ansätze, um Daten durch Spiegelung in OneLake zu bringen.

  • Datenbankspiegelung – Datenbankspiegelung in Microsoft Fabric ermöglicht die Replikation ganzer Datenbanken und Tabellen, sodass Sie Daten aus verschiedenen Systemen in einer einzigen Analyseplattform zusammenführen können.
  • Metadatenspiegelung – Die Metadatenspiegelung in Fabric synchronisiert Metadaten (z. B. Katalognamen, Schemas und Tabellen), anstatt die Daten physisch zu verschieben. Dieser Ansatz nutzt Tastenkombinationen, um sicherzustellen, dass die Daten in ihrer Quelle verbleiben und gleichzeitig in Fabric leicht zugänglich sind.
  • Offene Spiegelung – Offene Spiegelung in Fabric wurde entwickelt, um die Spiegelung basierend auf dem geöffneten Delta Lake-Tabellenformat zu erweitern. Mit dieser Funktion können Entwickler die Änderungsdaten ihrer Anwendung direkt in ein gespiegeltes Datenbankelement in Microsoft Fabric schreiben, basierend auf dem offenen Spiegelungsansatz und öffentlichen APIs.

Derzeit sind die folgenden externen Datenbanken verfügbar:

Plattform Nahezu echtzeitbasierte Replikation Spiegelungstyp Ende-zu-Ende-Lernprogramm
Gespiegelte Microsoft Fabric-Datenbanken aus Azure Cosmos DB Yes Datenbankspiegelung Lernprogramm: Azure Cosmos DB
Gespiegelte Microsoft Fabric-Datenbanken aus Azure Databricks Yes Metadatenspiegelung Lernprogramm: Azure Databricks
Gespiegelte Microsoft Fabric-Datenbanken aus Azure-Datenbank für PostgreSQL flexiblen Server Yes Datenbankspiegelung Lernprogramm: Azure-Datenbank für PostgreSQL– flexibler Server
Gespiegelte Microsoft Fabric-Datenbanken aus azure SQL-Datenbank Yes Datenbankspiegelung Lernprogramm: Azure SQL-Datenbank
Gespiegelte Microsoft Fabric-Datenbanken aus Azure SQL Managed Instance Yes Datenbankspiegelung Lernprogramm: Azure SQL Managed Instance
Gespiegelte Microsoft Fabric-Datenbanken von Google BigQuery (Vorschau) Yes Datenbankspiegelung Lernprogramm: Google BigQuery
Gespiegelte Microsoft Fabric-Datenbanken aus Oracle (Vorschau) Yes Datenbankspiegelung Lernprogramm: Oracle
Gespiegelte Microsoft Fabric-Datenbanken aus SAP (Vorschau) Yes Datenbankspiegelung Lernprogramm: SAP
Gespiegelte Microsoft Fabric-Datenbanken von Snowflake Yes Datenbankspiegelung Lernprogramm: Schneeflake
Gespiegelte Microsoft Fabric-Datenbanken aus SQL Server Yes Datenbankspiegelung Lernprogramm: SQL Server
Öffnen von gespiegelten Datenbanken Yes Offene Spiegelung Lernprogramm: Öffnen der Spiegelung
Gespiegelte Microsoft Fabric-Datenbanken aus der Fabric SQL-Datenbank Yes Datenbankspiegelung Automatisch konfiguriert

Wie funktioniert die nahezu echtzeitnahe Replikation der Datenbankspiegelung?

Die Spiegelung wird durch Erstellen einer sicheren Verbindung mit Ihrer betrieblichen Datenquelle aktiviert. Sie wählen aus, ob eine gesamte Datenbank oder einzelne Tabellen repliziert werden soll und die Spiegelung Ihre Daten automatisch synchronisiert. Nach der Einrichtung repliziert die Daten kontinuierlich in oneLake für den Analyseverbrauch.

Im Folgenden sind die Kerndehner der Spiegelung aufgeführt:

  • Die Aktivierung von Spiegelung in Fabric ist einfach und intuitiv, ohne dass komplexe ETL-Pipelines erstellt werden müssen, andere Computeressourcen zugewiesen und Datenbewegungen verwaltet werden müssen.

  • Die Spiegelung in Fabric ist ein vollständig verwalteter Dienst, daher müssen Sie sich keine Gedanken über hostingen, verwalten oder verwalten die Replikation der gespiegelten Verbindung machen.

Wie funktioniert die Metadatenspiegelung?

Die Spiegelung ermöglicht nicht nur die Datenreplikation, sondern kann auch durch Verknüpfungen oder Metadatenspiegelung und nicht durch vollständige Datenreplikation erreicht werden, sodass Daten verfügbar sind, ohne sie physisch zu verschieben oder zu duplizieren. Die Spiegelung in diesem Kontext bezieht sich auf das Replizieren nur von Metadaten wie Katalognamen, Schemas und Tabellen und nicht auf die tatsächlichen Daten selbst. Mit diesem Ansatz kann Fabric Daten aus verschiedenen Quellen zugänglich machen, ohne sie zu duplizieren, die Datenverwaltung zu vereinfachen und die Speicheranforderungen zu minimieren.

Wenn Sie beispielsweise auf daten zugreifen, die im Unity-Katalog registriert sind, spiegelt Fabric nur die Katalogstruktur von Azure Databricks wider, sodass auf die zugrunde liegenden Daten über Verknüpfungen zugegriffen werden kann. Diese Methode stellt sicher, dass alle Änderungen der Quelldaten sofort in Fabric widergespiegelt werden, ohne dass Datenbewegungen erforderlich sind, die Echtzeitsynchronisierung beibehalten und die Effizienz beim Zugriff auf up-to-Datumsinformationen verbessert werden.

Wie funktioniert die offene Spiegelung?

Zusätzlich zur Spiegelung der Datenreplikation durch Erstellen einer sicheren Verbindung mit Ihrer Datenquelle können Sie auch einen vorhandenen Datenanbieter auswählen oder Ihre eigene Anwendung schreiben, um Daten in gespiegelte Datenbank zu landen. Nachdem Sie eine geöffnete gespiegelte Datenbank über die öffentliche API oder über das Fabric-Portal erstellt haben, können Sie eine Zielzonen-URL in OneLake abrufen, in der Sie Daten pro offener Spiegelungsspezifikation landen können.

Sobald sich Daten in der Zielzone mit dem richtigen Format befinden, wird die Replikation gestartet und verwaltet die Komplexität der Zusammenführung der Änderungen mit Updates, Einfügen und Löschen, um in Delta-Tabellen widergespiegelt zu werden. Diese Methode stellt sicher, dass alle in die Landezone geschriebenen Daten sofort und die Daten in Fabric up-to-date beibehalten werden.

Freigabe

Die Freigabe ermöglicht die erleichterte Zugriffssteuerung und -verwaltung, während Sicherheitskontrollen wie Sicherheit auf Zeilenebene (RLS) und OLS (Object Level Security) und mehr sicherstellen, dass Sie den Zugriff auf vertrauliche Informationen steuern können. Die Freigabe ermöglicht auch sichere und demokratisierte Entscheidungsfindung in Ihrer Gesamten Organisation.

Durch die Freigabe gewähren Benutzer anderen Benutzern oder einer Gruppe von Benutzern Zugriff auf eine gespiegelte Datenbank, ohne zugriff auf den Arbeitsbereich und die restlichen Elemente zu gewähren. Wenn jemand eine gespiegelte Datenbank teilt, gewähren sie auch Zugriff auf den SQL-Analyseendpunkt.

Weitere Informationen finden Sie unter Freigeben Ihrer gespiegelten Datenbank und Verwalten von Berechtigungen.

Datenbankübergreifende Abfragen

Mit den Daten aus Der gespiegelten Datenbank, die in OneLake gespeichert sind, können Sie Datenbankübergreifende Abfragen schreiben, Daten aus gespiegelten Datenbanken, Lagerhäusern und den SQL-Analyseendpunkten von Lakehouses in einer einzigen T-SQL-Abfrage verknüpfen. Weitere Informationen finden Sie unter Schreiben einer datenbankübergreifenden Abfrage.

Sie können z. B. auf die Tabelle aus gespiegelten Datenbanken und Lagerhäusern mit dreiteiliger Benennung verweisen. Verwenden Sie im folgenden Beispiel den dreiteiligen Namen, um im Lager ContosoSalesTablezu verweisenContosoWarehouse. Aus anderen Datenbanken oder Lagerhäusern ist der erste Teil der dreiteiligen SQL-Standardbenennungskonvention der Name der gespiegelten Datenbank.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Kosten für die Spiegelung

Für die Datenbankspiegelung und die offene Spiegelung sind der Fabric-Compute- und OneLake-Speicher bis zu einem kapazitätsbasierten Grenzwert frei.

  • Speicher für Replikate ist bis zu einem Grenzwert auf der Grundlage der Kapazitätsgröße frei. Mirroring bietet einen kostenlosen Terabyte Spiegelungsspeicher für jede von Ihnen erworbene Kapazitätseinheit (CU). Wenn Sie z. B. eine F64-Kapazität erwerben, erhalten Sie 64 kostenlose Terabyte Speicherplatz, der ausschließlich für die Spiegelung verwendet wird. OneLake-Speicher wird in Rechnung gestellt, wenn das speicherfreie Spiegelungslimit überschritten wird oder wenn die Kapazität angehalten wird. Weitere Informationen finden Sie unter Microsoft Fabric-Preise.
  • Die Background Fabric-Compute, die zum Replizieren Ihrer Daten in Fabric OneLake verwendet wird, ist kostenlos und verbraucht keine Kapazität. Anforderungen direkt an oneLake für gespiegelte Daten verbrauchen kapazität als normale OneLake-Computenutzung. Die Berechnung zum Abfragen von Daten mit SQL, Power BI oder Spark wird in regelmäßigen Tarifen berechnet.
  • Eine ausgeführte Fabric-Kapazität ist nur für die ersteinrichtung von Spiegelung erforderlich.

Data Engineering mit gespiegelten Datenbankdaten

Microsoft Fabric bietet verschiedene Datentechnikfunktionen, um sicherzustellen, dass Ihre Daten leicht zugänglich, gut organisiert und qualitativ hochwertig sind. Aus Fabric Data Engineering können Sie:

  • Erstellen und Verwalten Ihrer Daten als Spark mit einem Seehaus
  • Entwerfen von Pipelines zum Kopieren von Daten in Ihr Seehaus
  • Verwenden von Spark-Auftragsdefinitionen zum Senden eines Batch-/Streamingauftrags an Spark-Cluster
  • Verwenden von Notizbüchern zum Schreiben von Code für Die Erfassung, Vorbereitung und Transformation von Daten

Data Science mit gespiegelten Datenbankdaten

Microsoft Fabric bietet Fabric Data Science an, um Benutzern die Möglichkeit zu geben, End-to-End Data Science-Workflows für den Zweck der Datenerweiterung und Geschäftseinblicke abzuschließen. Sie können eine breite Palette von Aktivitäten im gesamten Data Science-Prozess durchführen, von der Datenerkundung, Vorbereitung und Reinigung bis hin zu Experimentierung, Modellierung, Modellbewertung und Bereitstellung von predictive Insights für BI-Berichte.

Microsoft Fabric-Benutzer können auf Data Science-Workloads zugreifen. Von dort aus können sie verschiedene relevante Ressourcen entdecken und darauf zugreifen. Sie können z. B. Machine Learning Experimente, Modelle und Notizbücher erstellen. Sie können auch vorhandene Notizbücher auf der Data Science-Startseite importieren.

Direct Lake mit gespiegelten Datenbankdaten

Der Direct Lake-Modus kann mit gespiegelten Datenbanken in Microsoft Fabric verwendet werden, um hochleistungsfähige Abfragen über gespiegelte Daten zu ermöglichen, ohne dass Datenverschiebungen oder Duplizierung erforderlich sind. Wenn eine gespiegelte Datenbank erstellt wird, werden ihre Daten im Delta Lake-Format in OneLake gespeichert. Mit diesem nativen Format können Power BI und andere Analysetools über den Direct Lake-Modus eine Verbindung herstellen, die nahezu echtzeitbasierte Einblicke bietet, indem sie direkt auf die zugrunde liegenden Dateien zugreifen. Diese Integration kombiniert die Einfachheit der Spiegelung mit der Geschwindigkeit und Skalierbarkeit von Direct Lake, wodurch schnelle, up-to-Datumsberichte zu Betriebsdaten ermöglicht werden.

Aufbewahrung für gespiegelte Daten

Die Spiegelung in Fabric repliziert kontinuierlich Ihre vorhandene Datenstruktur in OneLake im Delta Lake-Tabellenformat. Um die gespiegelten Daten effizient zu speichern und immer für Analysen bereit zu halten, führt die Spiegelung automatisch Vakuum aus, um alte Dateien zu entfernen, auf die nicht mehr durch ein Delta-Protokoll verwiesen wird.

Sie können die Aufbewahrungseinstellung entsprechend Ihren Anforderungen anpassen. Sie können z. B. einen kürzeren Aufbewahrungszeitraum auswählen, um den Spiegelungsspeicherverbrauch zu reduzieren oder den Aufbewahrungszeitraum zu verlängern, um die Zeitreisefunktionen von Delta für Analysen zu nutzen.

Für gespiegelte Datenbanken, die mitte Juni 2025 aus dem Fabric-Portal erstellt wurden, ist die Standardaufbewahrung ein Tag. Bei alten gespiegelten Datenbanken ist die Standardeinstellung sieben Tage. Um die Aufbewahrungseinstellung zu überprüfen oder zu aktualisieren, navigieren Sie im Fabric-Portal zur Gespiegelten Datenbank ->Einstellungen ->Wartungsregisterkarte , und geben Sie den Aufbewahrungsschwellenwert an. Sie können sie auch über öffentliche API konfigurieren, indem Sie die retentionInDays Eigenschaft angeben.

SQL-Datenbank in Fabric

Sie können auch direkt eine SQL-Datenbank in Microsoft Fabric im Fabric-Portal erstellen und verwalten. Basierend auf der Azure SQL-Datenbank wird die SQL-Datenbank in Fabric automatisch für Analysezwecke gespiegelt und ermöglicht es Ihnen, Ihre betriebsbereite Datenbank in Fabric auf einfache Weise zu erstellen. DIE SQL-Datenbank ist die Startseite in Fabric für OLTP-Workloads und kann in die Integration der Fabric-Quellcodeverwaltung integriert werden.