Udostępnij za pośrednictwem


Co to jest mirrorowanie w Fabric?

Mirroring w Fabric to rozwiązanie o niskich kosztach i małych opóźnieniach, które integruje dane z różnych systemów w jedną platformę analityczną. Istniejące zasoby danych można stale replikować bezpośrednio do OneLake w Fabric z różnych baz danych Azure i zewnętrznych źródeł danych.

Korzystając z najnowszych danych w formacie umożliwiającym wykonywanie zapytań w usłudze OneLake, można korzystać ze wszystkich różnych usług w ramach Fabric, takich jak uruchamianie analiz za pomocą platformy Spark, wykonywanie notatników, inżynieria danych, wizualizowanie za pomocą raportów Power BI i nie tylko.

Korzystając z mirroringu w Fabric, uzyskujesz wysoce zintegrowany, kompleksowy i łatwy w użyciu produkt, który upraszcza Twoje potrzeby analityczne. Mirroring jest stworzone na potrzeby otwartości i współpracy między firmą Microsoft a rozwiązaniami technologicznymi, które mogą odczytywać format tabeli Delta Lake typu open source. Jest to niedrogie i o niskim opóźnieniu pakietowe rozwiązanie, które tworzy replikę danych w usłudze OneLake dla wszystkich potrzeb analitycznych.

Można używać tabel Delta wszędzie w Fabric, co przyspiesza wdrożenie w Fabric.

Dublowanie można włączyć, tworząc bezpieczne połączenie ze źródłem danych operacyjnych. Decydujesz, czy replikować całą bazę danych, czy poszczególne tabele, a funkcja dublowania automatycznie synchronizuje dane. Po skonfigurowaniu dane są stale replikowane do usługi OneLake na potrzeby użycia analiz.

Dlaczego warto używać funkcji mirroringu w architekturze?

Obecnie wiele organizacji ma krytyczne dane operacyjne lub analityczne siedzące w silosach.

Uzyskiwanie dostępu do tych danych i praca z nimi wymaga złożonych potoków ETL (Extract Transform Load), procesów biznesowych i silosów decyzyjnych, tworząc:

  • Ograniczony i ograniczony dostęp do ważnych, ciągle zmieniających się danych
  • Tarcie między ludźmi, procesem i technologią
  • Długie czasy oczekiwania na tworzenie potoków i procesów dla krytycznie ważnych danych
  • Brak swobody korzystania z narzędzi potrzebnych do wygodnego analizowania i udostępniania szczegółowych informacji
  • Brak właściwej podstawy, aby ludzie dzielili się danymi i współpracowali nad nimi
  • Brak typowych, otwartych formatów danych dla wszystkich scenariuszy analitycznych — analizy biznesowej, sztucznej inteligencji, integracji, inżynierii, a nawet aplikacji

Replikacja w systemie Fabric umożliwia proste wdrożenie, przyspieszenie uzyskiwania wartości z danych oraz przełamywanie silosów danych między rozwiązaniami technologicznymi.

  • Niemal w czasie rzeczywistym replikacja danych i metadanych do usługi SaaS data-lake z wbudowaną analizą analizy biznesowej i sztucznej inteligencji

Platforma Microsoft Fabric jest zbudowana na fundamencie oprogramowania jako usługi (SaaS), co wnosi prostotę i integrację na zupełnie nowy poziom. Aby dowiedzieć się więcej o Microsoft Fabric, zobacz Co to jest Microsoft Fabric?

Poniżej przedstawiono podstawowe zasady mirrorowania.

  • Włączanie Mirroring w Fabric jest proste i intuicyjne, bez konieczności tworzenia złożonych potoków ETL, przydzielania dodatkowych zasobów obliczeniowych ani zarządzania ruchem danych.

  • Dublowanie w Fabric to w pełni zarządzana usługa, więc nie musisz martwić się o hostowanie, konserwowanie i zarządzanie replikacją zmirorowanego połączenia.

Dublowanie obiektów

Mirrorowanie tworzy te elementy w obszarze roboczym Fabric:

  • Proces, który zarządza replikacją danych i metadanych do usługi OneLake oraz konwersją na Parquet, w formacie gotowym do analizy. Ten proces umożliwia wykonywanie scenariuszy podrzędnych, takich jak inżynieria danych, nauka o danych i nie tylko.
  • Punkt końcowy analizy SQL

Oprócz edytora zapytań SQL istnieje szeroki ekosystem narzędzi, w tym SQL Server Management Studio (SSMS),rozszerzenie MSSQL dla programu Visual Studio Code, a nawet GitHub Copilot.

Udostępnianie ułatwia kontrolowanie uprawnień dostępu i zarządzania nimi, dzięki czemu można chronić poufne informacje. Udostępnianie umożliwia również bezpieczne i zdemokratyzowane podejmowanie decyzji w całej organizacji.

Typy mirroringu

Usługa Microsoft Fabric oferuje trzy różne podejścia do wprowadzania danych do OneLake poprzez mirroring.

  • Odbicie lustrzane bazy danych — odbicie lustrzane bazy danych w platformie Fabric replikuje całe bazy danych i tabele w celu łączenia danych z różnych systemów w jednolitą platformę analityczną.
  • Dublowanie metadanych — dublowanie metadanych w sieci szkieletowej synchronizuje metadane (takie jak nazwy katalogów, schematy i tabele) zamiast fizycznie przenosić dane. To podejście korzysta ze skrótów, zapewniając, że dane pozostają w ich źródle, a jednocześnie są łatwo dostępne w Fabric.
  • Otwarte dublowanie — otwarte dublowanie w frameworku Fabric jest zaprojektowane do rozszerzania dublowania w oparciu o otwarty format tabel Delta Lake. Ta funkcja umożliwia każdemu deweloperowi zapisywanie danych zmian aplikacji bezpośrednio w odzwierciedlonym elemencie bazy danych w Fabric, bazując na otwartym podejściu do odzwierciedlania i publicznych interfejsach API.

Obecnie dostępne są następujące zewnętrzne bazy danych:

Platforma Replikacja niemal w czasie rzeczywistym Typ replikacji Kompleksowy samouczek od początku do końca
Microsoft Fabric odzwierciedlane bazy danych z Azure Cosmos DB Tak Dublowanie bazy danych Samouczek: Azure Cosmos DB
Microsoft Fabric dublowane bazy danych z Azure Databricks Tak Dublowanie metadanych Samouczek: Azure Databricks
Lustrzane bazy danych Microsoft Fabric z Azure Database for PostgreSQL Tak Dublowanie bazy danych Samouczek: Azure Database for PostgreSQL
Dublowane bazy danych usługi Microsoft Fabric z usługi Azure Database for MySQL (wersja zapoznawcza) Tak Dublowanie bazy danych Samouczek: Azure Database for MySQL (wersja zapoznawcza)
Microsoft Fabric dublowane bazy danych z Azure SQL Database Tak Dublowanie bazy danych Samouczek: Azure SQL Database
Odbite bazy danych Microsoft Fabric z Azure SQL Managed Instance Tak Dublowanie bazy danych Samouczek: Azure SQL Managed Instance
Microsoft Fabric lustrzane bazy danych z Google BigQuery (wersja zapoznawcza) Tak Dublowanie bazy danych Samouczek: Google BigQuery
Dublowane bazy danych usługi Microsoft Fabric z bazy danych Oracle Tak Dublowanie bazy danych Samouczek: Oracle
Lustrzane bazy danych Microsoft Fabric z systemu SAP Tak Dublowanie bazy danych Samouczek: SAP
Microsoft Fabric dublowane bazy danych z usługi Snowflake Tak Dublowanie bazy danych Poradnik: Snowflake
Microsoft Fabric bazy danych z mirroringiem z SQL Server Tak Dublowanie bazy danych Samouczek: SQL Server
Otwieranie dublowanych baz danych Tak Otwieranie mirroringu Samouczek: otwieranie mirrorowania
Microsoft Fabric replikowane bazy danych z bazy danych Fabric SQL Tak Dublowanie bazy danych Automatycznie skonfigurowane

Replikacja niemal w czasie rzeczywistym

Replikacja niemal w czasie rzeczywistym może zależeć od różnych czynników, takich jak:

  • Lokalizacja lub region źródła
  • Lokalizacja lub region miejsca docelowego
  • Ilość zmian
  • Częstotliwość zmian
  • Przepustowość i opóźnienie sieci ze źródła
  • Zasoby obliczeniowe przydzielone do lokalnej bramy danych

Jak działa dublowanie bazy danych?

Pliki różnicowe są dostarczane przyrostowo w Fabric ze źródła danych. Metoda identyfikowania danych zmienianych przyrostowo różni się w każdym źródle danych. Na przykład w SQL Server 2025 r. Database Engine SQL skanuje dziennik transakcji źródłowej bazy danych z wysoką częstotliwością. SQL Server publikuje zmiany dla każdej tabeli do odpowiednich plików w strefie docelowej Fabric.

Wewnątrz platformy Fabric silnik replikatora działa bez przerwy i skanuje pod kątem nowo opublikowanych plików z dużą częstotliwością. Fabric natychmiast scala przychodzące zmiany w docelową tabelę delta. Zmiany można publikować tak szybko, jak co 15 sekund.

Logika wycofywania, która wykrywa niski poziom aktywności, pozwala uniknąć nadmiernego obciążenia w silnikach źródeł danych poza Fabric i zmniejsza opóźnienie, odpowiadając na częstotliwość zmian danych przychodzących.

Diagram przedstawiający sposób działania mirringu bazy danych Fabric.

Jak działa dublowanie metadanych?

Dublowanie nie tylko umożliwia replikację danych, ale można również przeprowadzić za pomocą skrótów lub dublowania metadanych, a nie pełnej replikacji danych, co pozwala na dostępność danych bez fizycznego przenoszenia lub duplikowania. Dublowanie w tym kontekście odnosi się do replikowania tylko metadanych, takich jak nazwy wykazu, schematy i tabele, a nie rzeczywiste dane. Takie podejście umożliwia sieci szkieletowej udostępnianie danych z różnych źródeł bez duplikowania ich, upraszczanie zarządzania danymi i minimalizowanie potrzeb związanych z magazynem.

Na przykład podczas uzyskiwania dostępu do danych zarejestrowanych w Unity Catalog, Fabric odzwierciedla tylko strukturę katalogu z Azure Databricks, umożliwiając dostęp do danych źródłowych za pomocą skrótów. Ta metoda gwarantuje, że wszelkie zmiany w danych źródłowych zostaną natychmiast odzwierciedlone w Fabric bez konieczności przenoszenia danych, utrzymując synchronizację w czasie rzeczywistym i zwiększając wydajność uzyskania dostępu do aktualnych informacji.

Jak działa otwarte odbijanie?

Oprócz włączenia replikacji danych przez utworzenie bezpiecznego połączenia ze źródłem danych funkcja dublowania umożliwia wybranie istniejącego dostawcy danych lub zapisanie własnej aplikacji w celu uzyskania danych w dublowanej bazie danych. Podczas tworzenia otwartej zduplikowanej bazy danych za pośrednictwem publicznego interfejsu API lub portalu Fabric otrzymujesz adres URL strefy lądowania w usłudze OneLake, gdzie można umieszczać dane zmiany zgodnie z otwartą specyfikacją dublowania.

Gdy dane są w strefie docelowej z odpowiednim formatem, replikacja rozpoczyna działanie i zarządza złożonością scalania zmian z aktualizacjami, wstawianiem i usuwaniem, które mają zostać odzwierciedlone w tabelach różnicowych. Ta metoda gwarantuje, że wszystkie dane zapisane w strefie docelowej zostaną natychmiast odzwierciedlone, zachowując dane w Fabric aktualne.

Udostępnianie

Udostępnianie ułatwia kontrolę dostępu i zarządzanie. Mechanizmy kontroli bezpieczeństwa, takie jak zabezpieczenia na poziomie wiersza (RLS), zabezpieczenia na poziomie obiektu (OLS) oraz inne, upewniają się, że możesz kontrolować dostęp do poufnych informacji. Udostępnianie umożliwia również bezpieczne i zdemokratyzowane podejmowanie decyzji w całej organizacji.

Dzięki udostępnianiu użytkownicy udzielają innym użytkownikom lub grupie użytkowników dostępu do dublowanej bazy danych bez udzielania dostępu do obszaru roboczego i pozostałych elementów. Gdy ktoś udostępnia dublowaną bazę danych, udziela również dostępu do punktu końcowego analizy SQL.

Aby uzyskać więcej informacji, zobacz Udostępnianie dublowanej bazy danych i zarządzanie uprawnieniami.

Zapytania obejmujące wiele baz danych

Dzięki danych z dublowanej bazy danych przechowywanej w usłudze OneLake można zapisywać zapytania obejmujące wiele baz danych, łącząc dane z dublowanych baz danych, magazynów i punktów końcowych analizy SQL usługi Lakehouse w jednym zapytaniu T-SQL. Aby uzyskać więcej informacji, zobacz Pisanie zapytania obejmującego wiele baz danych.

Można na przykład odwołać się do tabeli z lustrzanych baz danych i magazynów przy użyciu trzyczęściowego nazewnictwa. W poniższym przykładzie użyj trzyczęściowej nazwy, aby odwołać się do ContosoSalesTable w magazynie ContosoWarehouse. Pierwsza część standardowej trójczęściowej konwencji nazewnictwa SQL, podobnie jak w innych bazach danych lub magazynach, to nazwa lustrzanej bazy danych.

SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Koszt dublowania

W przypadku mirroringu i otwartego mirroringu baz danych zasoby obliczeniowe Fabric oraz magazyn OneLake są dostępne bez opłat do limitu określonego na podstawie pojemności.

  • Magazyn replik jest darmowy do określonego limitu związanego z rozmiarem pojemności. Dublowanie oferuje bezpłatny terabajt magazynu dublowania dla każdej zakupionej jednostki pojemności (CU). Jeśli na przykład zakupisz pojemność F64, otrzymasz 64 bezpłatne terabajty pamięci masowej, używane wyłącznie do dublowania. Płacisz za magazyn OneLake, jeśli przekroczysz limit bezpłatnego magazynu dublowania lub gdy pojemność zostanie wstrzymana. Aby uzyskać więcej informacji, zobacz Microsoft Fabric Cennik.
  • Zasoby obliczeniowe usługi Background Fabric używane do replikowania danych do usługi Fabric OneLake są bezpłatne i nie zużywają pojemności. Żądania bezpośrednio do usługi OneLake dotyczące odzwierciedlonych danych zużywają pojemność w taki sam sposób, jak normalne użycie zasobów obliczeniowych w usłudze OneLake. Obliczenia na potrzeby wykonywania zapytań dotyczących danych przy użyciu języka SQL, usługi Power BI lub platformy Spark są naliczane według regularnych stawek.
  • Uruchomiona pojemność sieci szkieletowej jest wymagana tylko do początkowej konfiguracji dublowania.

Inżynieria danych przy użyciu zreplikowanych danych bazy danych

Microsoft Fabric zapewnia różne możliwości inżynierii danych, aby zapewnić łatwo dostępne, dobrze zorganizowane i wysokiej jakości dane. Z Inżynierii danych w Fabric można:

  • Twórz i zarządzaj danymi w Spark używając Lakehouse
  • Projektowanie potoków do kopiowania danych do Lakehouse
  • Użyj definicji zadań Spark do przesyłania zadań wsadowych lub strumieniowych do klastra Spark.
  • Używanie notesów do pisania kodu na potrzeby pozyskiwania, przygotowywania i przekształcania danych

Nauka o danych z użyciem odzwierciedlonych danych bazy danych

Microsoft Fabric oferuje usługę Fabric Data Science, aby umożliwić użytkownikom kompleksowe przepływy pracy nauki o danych na potrzeby wzbogacania danych i szczegółowych informacji biznesowych. Możesz wykonać szeroką gamę działań w całym procesie nauki o danych, począwszy od eksploracji danych, przygotowywania i czyszczenia po eksperymenty, modelowanie, ocenianie modelu i obsługę analiz predykcyjnych do raportów analizy biznesowej.

Microsoft Fabric użytkownicy mogą uzyskiwać dostęp do obciążeń Data Science. Z tego miejsca mogą odnajdywać różne odpowiednie zasoby i uzyskiwać do nich dostęp. Mogą na przykład tworzyć eksperymenty, modele i notesy uczenia maszynowego. Mogą również importować istniejące notesy na Stronie Głównej Nauki o Danych.

Usługa Direct Lake z dublowaną bazą danych

Możesz użyć trybu Direct Lake ze zreplikowanymi bazami danych w usłudze Microsoft Fabric, aby umożliwić wykonywanie zapytań o wysokiej wydajności na zreplikowanych danych bez potrzeby przenoszenia lub powielania danych. Podczas tworzenia lustrzanej bazy danych, jej dane są przechowywane w formacie Delta Lake w usłudze OneLake. Ten natywny format umożliwia Power BI i innym narzędziom analitycznym nawiązywanie połączenia za pośrednictwem trybu Direct Lake, oferując szczegółowe informacje niemal w czasie rzeczywistym, bezpośrednio korzystając z podstawowych plików. Ta integracja łączy prostotę dublowania z szybkością i skalowalnością usługi Direct Lake, umożliwiając szybkie, up-to-date raportowania danych operacyjnych.

Przechowywanie danych lustrzanych

Odbijanie w Fabric stale replikuje istniejące zasoby danych do OneLake w formacie tabeli Delta Lake. Aby wydajnie przechowywać dublowane dane i zawsze gotowe do analizy, funkcja dublowania automatycznie uruchamia opróżnianie w celu usunięcia starych plików, do których już nie odwołuje się dziennik delta.

Ustawienie przechowywania można dostosować zgodnie z wymaganiami. Możesz na przykład wybrać krótszy okres przechowywania, aby zmniejszyć użycie przechowywania kopii lustrzanych lub przedłużyć okres przechowywania, aby korzystać z funkcji Delta Time Travel do analizy.

W przypadku lustrzanych baz danych utworzonych w portalu Fabric od połowy czerwca 2025 r. domyślny okres przechowywania wynosi jeden dzień. W przypadku starych dublowanych baz danych wartość domyślna to siedem dni. Aby sprawdzić lub zaktualizować ustawienie przechowywania, w portalu Fabric przejdź do zmirrorowanej bazy danych ->Ustawienia ->Zarządzanie tabelą Delta i określ próg przechowywania. Można go również skonfigurować za pomocą interfejsu API publicznegoretentionInDays, określając właściwość.

Baza danych SQL w Fabric

Możesz również bezpośrednio utworzyć bazę danych SQL i zarządzać nią w Microsoft Fabric w portalu sieci szkieletowej. Na podstawie usługi Azure SQL Database, baza danych SQL w Fabric automatycznie replikuje dane do celów analitycznych i można łatwo utworzyć operacyjną bazę danych w Fabric. Baza danych SQL to strona główna w sieci szkieletowej dla obciążeń OLTP i może być zintegrowana z integracją kontroli źródła sieci szkieletowej.