Freigeben über


Spiegeln von Snowflake in Microsoft Fabric

Die Spiegelung in Fabric bietet eine einfache Oberfläche, um komplexe ETL (Extract Transform Load) zu vermeiden und Ihre vorhandenen Snowflake Warehouse-Daten in den Rest Ihrer Daten in Microsoft Fabric zu integrieren. Sie können Ihre vorhandenen Snowflake-Daten kontinuierlich direkt in das OneLake von Fabric replizieren. Inside Fabric können Sie leistungsstarke Business Intelligence, künstliche Intelligenz, Data Engineering, Data Science und Datenfreigabeszenarien freischalten.

Ein Lernprogramm zum Konfigurieren Ihrer Snowflake-Datenbank für die Spiegelung in Fabric finden Sie im Lernprogramm: Konfigurieren von gespiegelten Microsoft Fabric-Datenbanken aus Snowflake.

Gründe für die Verwendung von Spiegelung in Fabric

Mit Mirroring in Fabric müssen Sie keine verschiedenen Dienste von mehreren Anbietern zusammenfügen. Stattdessen können Sie ein hochgradig integriertes, end-to-End- und benutzerfreundliches Produkt genießen, das für die Vereinfachung Ihrer Analyseanforderungen konzipiert ist und für Offenheit und Zusammenarbeit zwischen Microsoft, Snowflake und den 1000er Technologielösungen entwickelt wurde, die das Open Source Delta Lake-Tabellenformat lesen können.

Welche Analyseerfahrungen sind integriert?

Gespiegelte Datenbanken sind ein Element in Fabric Data Warehouse , das sich vom Warehouse - und SQL-Analyseendpunkt unterscheidet.

Diagramm der Fabric-Datenbankspiegelung für Snowflake.

Die Spiegelung erstellt diese Elemente in Ihrem Fabric-Arbeitsbereich:

  • Das gespiegelte Datenbankelement. Dies ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und mehr. Die Spiegelung verwaltet Folgendes:
    • Die Replikation von Iceberg-Tabellenmetadaten in OneLake mithilfe von Verknüpfungen zum Speicher, der Ihre Iceberg-Tabellen enthält. OneLake konvertiert diese Iceberg-Tabellen automatisch in formatierte Delta Lake-Tabellen für die Verwendung über Fabric-Workloads hinweg.
    • Die Replikation von verwalteten Tabellendaten in OneLake und Konvertierung in Parquet, in einem für Analysen geeigneten Format.
  • Ein SQL-Analyseendpunkt

Jede gespiegelte Datenbank verfügt über einen automatisch generierten SQL-Analyseendpunkt , der eine umfassende analysereiche Erfahrung über den Delta-Tabellen bietet, die vom Spiegelungsprozess erstellt wurden. Benutzer haben Zugriff auf vertraute T-SQL-Befehle, die Datenobjekte definieren und abfragen können, aber die Daten nicht vom SQL-Analyseendpunkt bearbeiten können, da es sich um eine schreibgeschützte Kopie handelt. Sie können die folgenden Aktionen im SQL-Analyseendpunkt ausführen:

  • Erkunden Sie die Tabellen, die auf Daten in Ihren Delta Lake-Tabellen aus Snowflake verweisen.
  • Erstellen Sie keine Codeabfragen und -ansichten, und untersuchen Sie Daten visuell, ohne eine Codezeile zu schreiben.
  • Entwickeln Sie SQL-Ansichten, Inline-TVFs (Tabellenwertfunktionen) und gespeicherte Prozeduren, um Ihre Semantik und Geschäftslogik in T-SQL zu kapseln.
  • Berechtigungen für die Objekte verwalten.
  • Abfragen von Daten in anderen Warehouses und Lakehouses im selben Arbeitsbereich.

Zusätzlich zum SQL-Abfrage-Editor gibt es ein breites Ökosystem von Tools, das den SQL-Analyseendpunkt abfragen kann, einschließlich SQL Server Management Studio (SSMS), der mssql-Erweiterung mit Visual Studio Code und sogar GitHub Copilot.

Sicherheitsüberlegungen

Zum Aktivieren der Fabric-Spiegelung benötigen Sie Benutzerberechtigungen für Ihre Snowflake-Datenbank, die die folgenden Berechtigungen enthält:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Weitere Informationen finden Sie in der Snowflake-Dokumentation zu Zugriffssteuerungsberechtigungen für Streamingtabellen und erforderlichen Berechtigungen für Streams.

Von Bedeutung

Jede granulare Sicherheit, die im Snowflake-Quelllager eingerichtet wurde, muss in der gespiegelten Datenbank in Microsoft Fabric neu konfiguriert werden. Weitere Informationen finden Sie unter detaillierte SQL-Berechtigungen in Microsoft Fabric.

Snowflake hinter der Firewall synchronisieren

Überprüfen Sie die Netzwerkanforderungen für den Zugriff auf Ihre Snowflake-Datenquelle. Wenn Ihre Snowflake-Datenquelle nicht öffentlich zugänglich ist und sich in einem privaten Netzwerk befindet, erstellen Sie ein Gateway für virtuelle Netzwerkedaten , oder installieren Sie ein lokales Datengateway , um die Daten zu spiegeln. Das virtuelle Azure-Netzwerk oder das Netzwerk des Gatewaycomputers muss über einen privaten Endpunkt eine Verbindung mit der Snowflake-Instanz herstellen oder von der Firewallregel zugelassen werden. Informationen zu den ersten Schritten finden Sie im Lernprogramm: Konfigurieren von gespiegelten Microsoft Fabric-Datenbanken aus Snowflake.

Gespiegelte Snowflake-Kostenüberlegungen

Fabric-Compute, die zum Replizieren Ihrer Daten in Fabric OneLake verwendet wird, ist kostenlos. Die Speicherkosten für Spiegelung sind bis zu einem Grenzwert basierend auf der Kapazität frei. Weitere Informationen finden Sie unter Kosten für Spiegelung und Microsoft Fabric-Preise. Die Berechnung zum Abfragen von Daten mit SQL, Power BI oder Spark wird in regelmäßigen Tarifen berechnet.

Fabric berechnet keine Gebühren für Netzwerkdaten, die für Spiegelung in OneLake anfallen.

Es gibt Snowflake Compute- und Cloudabfragekosten, wenn Daten gespiegelt werden: Compute- und Clouddienste für virtuelle Lager.

  • Berechnungsgebühren für virtuelles Snowflake-Lager:
    • Berechnete Gebühren werden auf der Snowflake-Seite berechnet, wenn Datenänderungen vorhanden sind, die in Snowflake gelesen werden und wiederum in Fabric gespiegelt werden.
    • Alle Metadatenabfragen werden hinter den Kulissen ausgeführt, um zu überprüfen, ob Datenänderungen für eine Snowflake-Berechnung berechnet werden; Abfragen, die Daten erzeugen, z SELECT * . B. werden das Snowflake Warehouse aufwachen und berechnet.
  • Snowflake Services berechnen Gebühren:
    • Obwohl im Hintergrund keine Berechnungsgebühren für Aufgaben wie Erstellen, Metadatenabfragen, Zugriffssteuerung, Anzeigen von Datenänderungen und sogar DDL-Abfragen anfallen, gibt es Cloudkosten für diese Abfragen.
    • Je nachdem, welche Art von Snowflake Edition Sie haben, werden Ihnen die entsprechenden Gutschriften für alle Clouddienstekosten in Rechnung gestellt.

Im folgenden Screenshot können Sie sehen, wie die Compute- und Clouddienste des virtuellen Lagers Kosten für die zugeordnete Snowflake-Datenbank berechnen, die in Fabric gespiegelt wird. In diesem Szenario stammen die meisten Clouddienste Kosten für die Berechnung (gelb) aus Datenänderungsabfragen basierend auf den zuvor erwähnten Punkten. Die Berechnungsgebühren des virtuellen Lagers (in Blau) stammen ausschließlich aus den Datenänderungen, die von Snowflake gelesen und in Fabric gespiegelt werden.

Screenshot des Snowflake-Kostendiagramms.

Weitere Informationen zu snowflake spezifischen Cloud-Abfragekosten finden Sie unter Snowflake Docs: Grundlegendes zu den Gesamtkosten.

Nächster Schritt