Share via


Spiegeln von Azure Cosmos DB (Vorschau)

Die Spiegelung in Microsoft Fabric bietet eine nahtlose Erfahrung ohne ETL, um Ihre bestehenden Azure Cosmos DB-Daten mit dem Rest Ihrer Daten in Microsoft Fabric zu integrieren. Sie können Ihre Azure Cosmos DB-Daten kontinuierlich und nahezu in Echtzeit direkt in Fabric OneLake replizieren, ohne dass dies Auswirkungen auf die Leistung Ihrer transaktionalen Workloads hat.

Die Daten in OneLake werden im Open-Source-Delta-Format gespeichert und automatisch allen Analyseprogrammen auf Fabric zur Verfügung gestellt.

Sie können T-SQL zur Ausführung komplexer Aggregatabfragen und Spark zur Datenexploration verwenden. Sie können nahtlos auf die Daten in Notebooks zugreifen, Data Science nutzen, um Modelle für maschinelles Lernen zu erstellen, und Business Intelligence-Berichte mit Direct Lake unterstützt von Copilot-Integration erstellen.

Wichtig

Die Spiegelung für Azure Cosmos DB befindet sich derzeit in der Vorschau. Produktionsworkloads werden in der Vorschauversion nicht unterstützt. Derzeit werden nur Azure Cosmos DB for NoSQL-Konten unterstützt.

Warum eine Spiegelung in Fabric?

Mit der Spiegelung in Fabric vermeiden Sie, verschiedene Dienste von mehreren Anbietern kombinieren zu müssen. Stattdessen können Sie ein hochgradig integriertes, umfassendes und benutzerfreundliches Produkt nutzen, das Ihre Analyseanforderungen vereinfacht und auf Offenheit ausgelegt ist.

Wenn Sie Analysen zu Ihren Betriebsdaten in Azure Cosmos DB durchführen möchten, bietet Ihnen die Spiegelung folgende Möglichkeit:

  • Kostengünstige Quasi-Echtzeit-Analysen ohne ETL auf Azure Cosmos DB-Daten ohne Beeinträchtigung des Verbrauchs von Anforderungseinheiten
  • Einfaches Zusammenführen von Daten aus verschiedenen Quellen in Fabric OneLake
  • Delta-Tabellenoptimierungen mit v-Reihenfolge für blitzschnelle Lesevorgänge
  • Ein-Klick-Integration in Power BI mit Direct Lake und Copilot
  • Reichhaltige Geschäftseinblicke durch Zusammenführung von Daten aus verschiedenen Quellen
  • Umfangreichere App-Integration für den Zugriff auf Abfragen und Ansichten

OneLake-Daten werden im quelloffenen Delta Lake-Format gespeichert, so dass Sie sie mit verschiedenen Lösungen innerhalb und außerhalb von Microsoft nutzen können. Dieses Datenformat erleichtert den Aufbau eines einzigen Datenbestands für Ihre analytischen Anforderungen.

Welche Analyseerfahrungen sind integriert?

Spiegeldatenbanken sind ein Element in Fabric Synapse-Datenspeicherung, die sich von Warehouse- und SQL-Analyseendpunkten unterscheidet.

Diagramm der Fabric-Spiegelung für Azure Cosmos DB.

Jede gespiegelte Azure Cosmos DB-Datenbank hat drei Elemente, mit denen Sie in Ihrem Fabric-Arbeitsbereich interagieren können:

  • Das gespiegelte Datenbankelement. Die Spiegelung verwaltet die Replikation von Daten in OneLake und die Konvertierung in Parquet in einem analysefähigen Format. Dies ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und noch vieles mehr.
  • SQL-Analyseendpunkt, der automatisch generiert wird
  • Standardsemantikmodell, das automatisch generiert wird

Gespiegelte Datenbanken

Die gespiegelte Datenbank zeigt den Replikationsstatus und die Steuerelemente zum Stoppen oder Starten der Replikation in Fabric OneLake an. Sie können Ihre Quelldatenbank auch im Lesemodus mit dem Azure Cosmos DB-Datenexplorer anzeigen. Mit dem Datenexplorer können Sie Ihre Container in Ihrer Azure Cosmos DB-Quelldatenbank anzeigen und abfragen. Diese Vorgänge verbrauchen Anforderungseinheiten (Request Units, RUs) aus Ihrem Azure Cosmos DB-Konto. Alle Änderungen an der Quelldatenbank werden sofort in der Quelldatenbankansicht von Fabric angezeigt. Das Schreiben in die Quelldatenbank ist von Fabric aus nicht erlaubt, da Sie die Daten nur anzeigen können.

SQL-Analyseendpunkt

Jede gespiegelte Datenbank verfügt über einen automatisch generierten SQL-Analyseendpunkt, der über die OneLake Delta-Tabellen verfügt, die vom Spiegelungsprozess erstellt wurden. Sie haben Zugriff auf vertraute T-SQL-Befehle, mit denen Sie Datenobjekte definieren und abfragen können, die Daten des SQL Analytics-Endpunkts jedoch nicht manipulieren können, da es sich um eine schreibgeschützte Kopie handelt.

Sie können die folgenden Aktionen im SQL-Analyseendpunkt ausführen:

  • Erkunden von Delta Lake-Tabellen mit T-SQL. Jede Tabelle wird einem Container aus Ihrer Azure Cosmos DB-Datenbank zugeordnet.
  • Erstellen Sie Abfragen und Ansichten ohne Code und erkunden Sie sie visuell, ohne eine Codezeile zu schreiben.
  • Verbinden und fragen Sie Daten in anderen gespiegelten Datenbanken, Warehouses und Lakehouses im selben Arbeitsbereich ab.

Neben dem Microsoft Fabric SQL-Abfrage-Editor gibt es ein breites Ökosystem von Tools. Zu diesen Tools gehören Visual Studio Code, Azure Data Studio, SQL Server Management Studio und sogar GitHub Copilot. Sie können die Analyse und die Gewinnung von Erkenntnissen mit dem Tool Ihrer Wahl verbessern.

Semantikmodell

Das Standardsemantikmodell ist ein automatisch bereitgestelltes Power BI-Semantikmodell. Mit diesem Feature können Geschäftsmetriken erstellt, freigegeben und wiederverwendet werden. Weitere Informationen finden Sie unter Verbindung mit semantischen Modellen herstellen.

Wie funktioniert die Quasi-Echtzeit-Replikationsarbeit?

Wenn Sie die Spiegelung auf Ihrer Azure Cosmos DB-Datenbank aktivieren, werden Einfüge-, Aktualisierungs- und Löschvorgänge auf Ihren Onlinetransaktionsverarbeitung-Daten (Online Transaction Processing, OLTP) kontinuierlich in Fabric OneLake repliziert und für Analysen genutzt.

Das Feature für die kontinuierliche Sicherung ist eine Voraussetzung für die Spiegelung. Sie können für Ihr Azure Cosmos DB-Konto entweder eine 7- oder 30-tägige fortlaufende Sicherung aktivieren.

Hinweis

Die Spiegelung verwendet den Analytischen Speicher oder den Feed von Azure Cosmos DB nicht als Änderungsdaten-Erfassungsquelle. Sie können diese Funktionalitäten weiterhin unabhängig nutzen, zusammen mit Spiegelung.

Es kann einige Minuten dauern, bis Ihre Azure Cosmos DB-Daten in Fabric OneLake repliziert werden. Je nach der anfänglichen Momentaufnahme oder der Häufigkeit von Aktualisierungen/Löschvorgängen kann die Replikation in einigen Fällen auch länger dauern. Die Replikation wirkt sich nicht auf die Anforderungseinheiten (Request Units, RUs) aus, die Sie für Ihre Transaktionsworkloads zugewiesen haben.

Was Sie von der Spiegelung erwarten können

Es gibt einige Überlegungen und unterstützte Szenarien, die Sie vor der Spiegelung anstellen bzw. berücksichtigen sollten.

Überlegungen zum Setup

Um eine Datenbank zu spiegeln, sollte diese bereits in Azure bereitgestellt werden. Als Voraussetzung dafür müssen Sie die fortlaufende Sicherung für das Konto aktivieren.

  • Sie können jede Datenbank jeweils nur einzeln spiegeln. Sie können auswählen, welche Datenbank gespiegelt werden soll.
  • Sie können dieselbe Datenbank mehrmals innerhalb desselben Arbeitsbereichs spiegeln. Es empfiehlt sich, eine einzige Kopie der Datenbank in verschiedenen Lakeshouses, Warehouses oder anderen gespiegelten Datenbanken wiederzuverwenden. Sie sollten nicht mehrere Spiegelungen für dieselbe Datenbank einrichten müssen.
  • Sie können dieselbe Datenbank auch in verschiedenen Fabric-Arbeitsbereichen oder Mandanten spiegeln.
  • Änderungen an Azure Cosmos DB-Containern, wie das Hinzufügen neuer Container und das Löschen bestehender Container, werden nahtlos in Fabric repliziert. Sie können z. B. mit der Spiegelung einer leeren Datenbank ohne Container beginnen und die Spiegelung nimmt die zu einem späteren Zeitpunkt hinzugefügten Container nahtlos auf.

Unterstützung für geschachtelte Daten

Geschachtelte Daten werden in SQL Analytics-Endpunkttabellen als JSON-Zeichenkette angezeigt. Sie können OPENJSON, CROSS APPLY und OUTER APPLY in T-SQL-Abfragen oder Ansichten verwenden, um diese Daten selektiv zu erweitern. Wenn Sie Power Query verwenden, können Sie auch die ToJson-Funktion anwenden, um diese Daten zu erweitern.

Hinweis

Fabric hat eine Einschränkung für Zeichenkettenspalten mit einer Größe von 8 KB. Weitere Informationen finden Sie unter Einschränkungen des Data Warehouse.

Behandeln von Schemenänderungen

Die Spiegelung repliziert automatisch Eigenschaften in Azure Cosmos DB-Elementen mit Schemenänderungen. Alle in einem Element ermittelten neuen Eigenschaften werden als neue Spalten angezeigt, und falls vorhanden, werden die fehlenden Eigenschaften in Fabric als NULL dargestellt.

Wenn Sie eine Eigenschaft in einem Element umbenennen, behalten Fabric-Tabellen sowohl die alten als auch die neuen Spalten bei. In der alten Spalte wird NULL angezeigt, und die neue Spalte zeigt den neuesten Wert für alle Elemente an, die nach dem Umbenennungsvorgang repliziert werden.

Wenn Sie den Datentyp einer Eigenschaft in Azure Cosmos DB-Elementen ändern, werden die Änderungen für kompatible Datentypen unterstützt, die konvertiert werden können. Wenn die Datentypen nicht für die Konvertierung in Delta kompatibel sind, werden sie als NULL-Werte dargestellt.

SQL Analytics-Endpunkttabellen konvertieren Delta-Datentypen in T-SQL-Datentypen.

Doppelte Spaltennamen

Azure Cosmos DB unterstützt Spaltennamen ohne Berücksichtigung der Groß- und Kleinschreibung, basierend auf dem JSON-Standard. Die Spiegelung unterstützt diese doppelten Spaltennamen durch Hinzufügen von _n zum Spaltennamen, wobei es sich bei n um einen numerischen Wert handelt.

Wenn beispielsweise das Azure Cosmos DB-Element über addressName und AddressName als eindeutige Eigenschaften verfügt, verfügen Fabric-Tabellen über entsprechende addressName- und AddressName_1-Spalten. Weitere Informationen finden Sie unter Einschränkungen der Replikation.

Sicherheit

Die Verbindungen zu Ihrer Quelldatenbank basieren auf den Kontoschlüsseln für Ihre Azure Cosmos DB-Konten. Wenn Sie die Schlüssel drehen oder neu generieren, müssen Sie die Verbindungen aktualisieren, um sicherzustellen, dass die Replikation funktioniert. Weitere Informationen finden Sie unter Verbindungen.

Kontoschlüssel sind nicht direkt für andere Fabric-Benutzer sichtbar, nachdem die Verbindung eingerichtet wurde. Sie können einschränken, wer Zugriff auf die in Fabric erstellten Verbindungen hat. Schreibzugriffe auf die Azure Cosmos DB-Datenbank sind weder vom Datenexplorer noch vom Analyse-Endpunkt in Ihrer gespiegelten Datenbank aus zulässig.

Mirroring unterstützt derzeit keine Authentifizierung mit schreibgeschützten Kontoschlüsseln, Single-Sign-On (SSO) mit Microsoft Entra IDs und rollenbasierter Zugriffssteuerung oder verwalteten Identitäten.

Sobald die Daten in Fabric OneLake repliziert wurden, müssen Sie den Zugriff auf diese Daten sichern.

Datenschutzfunktionen

Granulare Sicherheit kann in der gespiegelten Datenbank in Microsoft Fabric konfiguriert werden. Weitere Informationen finden Sie unter Granulare Berechtigungen in Microsoft Fabric.

Sie können Spaltenfilter und prädikatbasierte Zeilenfilter für Tabellen für Rollen und Benutzer in Microsoft Fabric sichern:

Sie können außerdem vertrauliche Daten von Nicht-Administratoren-Benutzer mithilfe der dynamischen Datenmaskierung maskieren:

Netzwerksicherheit

Derzeit unterstützt die Spiegelung bei OneLake keine privaten Endpunkte oder kundenseitig verwaltete Schlüssel (Customer Managed Keys, CMK). Die Spiegelung wird nicht unterstützt für Azure Cosmos DB-Konten mit Netzwerksicherheitskonfigurationen, die weniger permissiv sind als alle Netzwerke, mit Service-Endpunkten, mit privaten Endpunkten, mit IP-Adressen oder mit anderen Einstellungen, die den öffentlichen Netzwerkzugriff auf das Konto beschränken könnten. Azure Cosmos DB-Konten sollten für alle Netzwerke offen sein, um mit der Spiegelung zu arbeiten.

Notfallwiederherstellung und Replikationslatenz

In Fabric können Sie Inhalte in Rechenzentren in anderen Regionen als der Heimatregion des Fabric-Mandanten bereitstellen. Weitere Informationen finden Sie unter Multi-Geo-Unterstützung.

Bei einem Azure Cosmos DB-Konto mit einer primären Schreibregion und mehreren Leseregionen wählt die Spiegelung die Azure Cosmos DB-Leseregion, die der Region am nächsten liegt, in der die Fabric-Kapazität konfiguriert ist. Diese Auswahl sorgt für eine Replikation mit niedriger Latenz bei der Spiegelung.

Wenn Sie Ihr Azure Cosmos DB-Konto in eine Wiederherstellungsregion wechseln, wählt die Spiegelung automatisch wieder die nächstgelegene Azure Cosmos DB-Region aus.

Hinweis

Die Spiegelung unterstützt keine Konten mit mehreren Schreibregionen.

Ihre Cosmos DB-Daten, die zu OneLake repliziert werden, müssen so konfiguriert werden, dass sie mit regionsweiten Ausfällen umgehen können. Weitere Informationen finden Sie unter Notfallwiederherstellung in OneLake.

Erkunden Sie Ihre Daten mithilfe von Spiegelung

Sie können gespiegelte Daten direkt in OneLake anzeigen und darauf zugreifen. Sie können auch nahtlos auf gespiegelte Daten zugreifen, ohne weitere Datenbewegungen.

Erfahren Sie mehr über den Zugriff auf OneLake mit ADLS Gen2-APIs oder SDK, dem OneLake-Datei-Explorer und dem Azure Storage-Explorer.

Sie können eine Verbindung zum SQL-Analyse-Endpunkt über Tools wie SQL Server Management Studio (SSMS) oder über Treiber wie Microsoft Open Database Connectivity (ODBC) und Java Database Connectivity (JDBC) herstellen. Weitere Informationen finden Sie unter SQL-Analyseendpunkt-Konnektivität.

Sie können auch auf gespiegelte Daten mit Diensten wie z. B.:

  • Azure Services wie Azure Databricks, Azure HDInsight oder Azure Synapse Analytics zugreifen
  • Fabric Lakehouse mit Verknüpfungen für Data Engineering- und Data Science-Szenarien
  • Andere gespiegelte Datenbanken oder Warehouses im Fabric-Arbeitsbereich

Sie können auch Medallion-Architekturlösungen erstellen, die Daten bereinigen und umwandeln, die in einer gespiegelten Datenbank als Bronzeschicht landen. Weitere Informationen finden Sie in Unterstützung der Medaillon-Architektur in Fabric.

Preisberechnung

Für die Spiegelungsfunktion und die Speicherung gespiegelter Daten in Fabric fallen während der öffentlichen Vorschau derzeit keine Kosten an. Die Rechennutzung für die Abfrage von Daten über SQL, Power BI oder Spark wird weiterhin auf der Grundlage der Fabric-Kapazität berechnet. Weitere Informationen finden Sie unter Häufig gestellte Fragen: Preise.

Wenn Sie den Datenexplorer in der Fabric-Spiegelung verwenden, fallen typische Kosten auf der Grundlage der Nutzung von Anforderungseinheiten (Request Units, RUs) an, um die Container zu erkunden und die Elemente in der Azure Cosmos DB-Quelldatenbank abzufragen. Die kontinuierliche Backup-Funktion von Azure Cosmos DB ist eine Voraussetzung für die Spiegelung: Es gelten die Standardgebühren für fortlaufende Datensicherungen. Bei der Abrechnung der fortlaufenden Datensicherung fallen keine zusätzlichen Kosten für die Spiegelung an. Weitere Informationen finden Sie unter Azure Cosmos DB – Preise.

Nächster Schritt