Co to jest mirrorowanie w Fabric?

Mirroring w Fabric to rozwiązanie o niskich kosztach i małych opóźnieniach, które integruje dane z różnych systemów w jedną platformę analityczną. Istniejące zasoby danych można stale replikować bezpośrednio do OneLake w Fabric z różnych baz danych Azure i zewnętrznych źródeł danych.

Korzystając z najnowszych danych w formacie umożliwiającym wykonywanie zapytań w usłudze OneLake, można korzystać ze wszystkich różnych usług w ramach Fabric, takich jak uruchamianie analiz za pomocą platformy Spark, wykonywanie notatników, inżynieria danych, wizualizowanie za pomocą raportów Power BI i nie tylko.

Korzystając z mirroringu w Fabric, uzyskujesz wysoce zintegrowany, kompleksowy i łatwy w użyciu produkt, który upraszcza Twoje potrzeby analityczne. Mirroring jest stworzone na potrzeby otwartości i współpracy między firmą Microsoft a rozwiązaniami technologicznymi, które mogą odczytywać format tabeli Delta Lake typu open source. Jest to niedrogie i o niskim opóźnieniu pakietowe rozwiązanie, które tworzy replikę danych w usłudze OneLake dla wszystkich potrzeb analitycznych.

Można używać tabel Delta wszędzie w Fabric, co przyspiesza wdrożenie w Fabric.

Dublowanie można włączyć, tworząc bezpieczne połączenie ze źródłem danych operacyjnych. Decydujesz, czy replikować całą bazę danych, czy poszczególne tabele, a funkcja dublowania automatycznie synchronizuje dane. Po skonfigurowaniu dane są stale replikowane do usługi OneLake na potrzeby użycia analiz.

Dlaczego warto używać funkcji mirroringu w architekturze?

Obecnie wiele organizacji ma krytyczne dane operacyjne lub analityczne siedzące w silosach.

Uzyskiwanie dostępu do tych danych i praca z nimi wymaga złożonych potoków ETL (Extract Transform Load), procesów biznesowych i silosów decyzyjnych, tworząc:

Ograniczony i ograniczony dostęp do ważnych, ciągle zmieniających się danych
Tarcie między ludźmi, procesem i technologią
Długie czasy oczekiwania na tworzenie potoków i procesów dla krytycznie ważnych danych
Brak swobody korzystania z narzędzi potrzebnych do wygodnego analizowania i udostępniania szczegółowych informacji
Brak właściwej podstawy, aby ludzie dzielili się danymi i współpracowali nad nimi
Brak typowych, otwartych formatów danych dla wszystkich scenariuszy analitycznych — analizy biznesowej, sztucznej inteligencji, integracji, inżynierii, a nawet aplikacji

Replikacja w systemie Fabric umożliwia proste wdrożenie, przyspieszenie uzyskiwania wartości z danych oraz przełamywanie silosów danych między rozwiązaniami technologicznymi.

Niemal w czasie rzeczywistym replikacja danych i metadanych do usługi SaaS data-lake z wbudowaną analizą analizy biznesowej i sztucznej inteligencji

Platforma Microsoft Fabric jest zbudowana na fundamencie oprogramowania jako usługi (SaaS), co wnosi prostotę i integrację na zupełnie nowy poziom. Aby dowiedzieć się więcej o Microsoft Fabric, zobacz Co to jest Microsoft Fabric?

Poniżej przedstawiono podstawowe zasady mirrorowania.

Włączanie Mirroring w Fabric jest proste i intuicyjne, bez konieczności tworzenia złożonych potoków ETL, przydzielania dodatkowych zasobów obliczeniowych ani zarządzania ruchem danych.
Dublowanie w Fabric to w pełni zarządzana usługa, więc nie musisz martwić się o hostowanie, konserwowanie i zarządzanie replikacją zmirorowanego połączenia.

Dublowanie obiektów

Mirrorowanie tworzy te elementy w obszarze roboczym Fabric:

Proces, który zarządza replikacją danych i metadanych do usługi OneLake oraz konwersją na Parquet, w formacie gotowym do analizy. Ten proces umożliwia wykonywanie scenariuszy podrzędnych, takich jak inżynieria danych, nauka o danych i nie tylko.
Punkt końcowy analizy SQL

Oprócz edytora zapytań SQL istnieje szeroki ekosystem narzędzi, w tym SQL Server Management Studio (SSMS),rozszerzenie MSSQL dla programu Visual Studio Code, a nawet GitHub Copilot.

Udostępnianie ułatwia kontrolowanie uprawnień dostępu i zarządzania nimi, dzięki czemu można chronić poufne informacje. Udostępnianie umożliwia również bezpieczne i zdemokratyzowane podejmowanie decyzji w całej organizacji.

Typy mirroringu

Usługa Microsoft Fabric oferuje trzy różne podejścia do wprowadzania danych do OneLake poprzez mirroring.

Odbicie lustrzane bazy danych — odbicie lustrzane bazy danych w platformie Fabric replikuje całe bazy danych i tabele w celu łączenia danych z różnych systemów w jednolitą platformę analityczną.
Dublowanie metadanych — dublowanie metadanych w sieci szkieletowej synchronizuje metadane (takie jak nazwy katalogów, schematy i tabele) zamiast fizycznie przenosić dane. To podejście korzysta ze skrótów, zapewniając, że dane pozostają w ich źródle, a jednocześnie są łatwo dostępne w Fabric. Ponieważ dublowanie metadanych opiera się na skrótach OneLake, obsługuje również współużytkowanie danych między dzierżawami. Organizacje mogą korzystać z danych na żywo zarządzanych z innych dzierżaw za pomocą skrótów bez kopiowania danych lub tworzenia potoków ETL.
Otwarte dublowanie — otwarte dublowanie w frameworku Fabric jest zaprojektowane do rozszerzania dublowania w oparciu o otwarty format tabel Delta Lake. Ta funkcja umożliwia każdemu deweloperowi zapisywanie danych zmian aplikacji bezpośrednio w odzwierciedlonym elemencie bazy danych w Fabric, bazując na otwartym podejściu do odzwierciedlania i publicznych interfejsach API.

Obecnie dostępne są następujące zewnętrzne bazy danych:

Platforma	Typ replikacji	Kompleksowy samouczek od początku do końca
Azure Cosmos DB	Dublowanie bazy danych	Samouczek: Azure Cosmos DB
Azure Databricks	Lustrzane odbicie metadanych	Samouczek: Azure Databricks
Azure Database for PostgreSQL	Dublowanie bazy danych	Samouczek: Azure Database for PostgreSQL
Azure Database for MySQL (wersja zapoznawcza)	Dublowanie bazy danych	Samouczek: Azure Database for MySQL (wersja zapoznawcza)
Azure SQL Database	Dublowanie bazy danych	Samouczek: Azure SQL Database
Azure SQL Managed Instance	Dublowanie bazy danych	Samouczek: Azure SQL Managed Instance
Katalog Dremio (zapowiedź)	Lustrzane odbicie metadanych	Samouczek: Dremio (wersja zapoznawcza)
Google BigQuery (zapowiedź)	Dublowanie bazy danych	Samouczek: Google BigQuery
Oracle	Dublowanie bazy danych	Samouczek: Oracle
SAP	Dublowanie bazy danych	Samouczek: SAP Datasphere
Lista SharePoint (podgląd)	Dublowanie bazy danych	Samouczek: Lista SharePoint (podgląd)
Snowflake	Dublowanie bazy danych	Poradnik: Snowflake
SQL Server	Dublowanie bazy danych	Samouczek: SQL Server
Otwieranie dublowanych baz danych	Uruchomienie mirroringu	Samouczek: otwieranie mirrorowania
baza danych SQL dla Fabric	Dublowanie bazy danych	Automatycznie skonfigurowane

Replikacja niemal w czasie rzeczywistym

W przypadku mirroringu i otwartego mirroringu bazy danych, replikacja niemal w czasie rzeczywistym może zależeć od różnych czynników, w tym:

Lokalizacja lub region źródła
Lokalizacja lub region miejsca docelowego
Ilość zmian
Częstotliwość zmian
Przepustowość i opóźnienie sieci ze źródła
Zasoby obliczeniowe przydzielone do lokalnej bramy danych

Uwaga / Notatka

Dublowanie metadanych nie replikuje danych. Zamiast tego opiera się na skrótach OneLake w celu odwołowania się do danych źródłowych. Opóźnienie dublowania metadanych odzwierciedla czas dostępu do systemu źródłowego i wydajność skrótów, a nie szybkość replikacji danych.

Jak działa dublowanie bazy danych?

Pliki różnicowe są dostarczane przyrostowo w Fabric ze źródła danych. Metoda identyfikowania danych zmienianych przyrostowo różni się w każdym źródle danych. Na przykład w SQL Server 2025 r. Database Engine SQL skanuje dziennik transakcji źródłowej bazy danych z wysoką częstotliwością. SQL Server publikuje zmiany dla każdej tabeli do odpowiednich plików w strefie docelowej Fabric.

Wewnątrz platformy Fabric silnik replikatora działa bez przerwy i skanuje pod kątem nowo opublikowanych plików z dużą częstotliwością. Fabric natychmiast scala przychodzące zmiany w docelową tabelę delta. Zmiany można publikować tak szybko, jak co 15 sekund.

Logika wycofywania, która wykrywa niski poziom aktywności, pozwala uniknąć nadmiernego obciążenia w silnikach źródeł danych poza Fabric i zmniejsza opóźnienie, odpowiadając na częstotliwość zmian danych przychodzących.

Diagram przedstawiający sposób działania mirringu bazy danych Fabric.

Jak działa dublowanie metadanych?

Dublowanie metadanych odwołuje się do danych źródłowych za pomocą skrótów OneLake zamiast ich replikowania, zachowując jedną wersję prawdy bez duplikowania i bez funkcji ETL. Dublowanie w tym kontekście synchronizuje tylko metadane (nazwy katalogów, schematy i tabele), a nie same dane. Takie podejście umożliwia sieci szkieletowej udostępnianie danych z różnych źródeł bez ich kopiowania, upraszczanie zarządzania danymi i minimalizowanie potrzeb związanych z magazynem.

Na przykład podczas uzyskiwania dostępu do danych zarejestrowanych w Unity Catalog, Fabric odzwierciedla tylko strukturę katalogu z Azure Databricks, umożliwiając dostęp do danych źródłowych za pomocą skrótów. Ta metoda gwarantuje, że wszelkie zmiany w danych źródłowych zostaną natychmiast odzwierciedlone w Fabric bez konieczności przenoszenia danych, utrzymując synchronizację w czasie rzeczywistym i zwiększając wydajność uzyskania dostępu do aktualnych informacji.

Jak działa otwarte odbijanie?

Oprócz włączenia replikacji danych przez utworzenie bezpiecznego połączenia ze źródłem danych funkcja dublowania umożliwia wybranie istniejącego dostawcy danych lub zapisanie własnej aplikacji w celu uzyskania danych w dublowanej bazie danych. Podczas tworzenia otwartej zduplikowanej bazy danych za pośrednictwem publicznego interfejsu API lub portalu Fabric otrzymujesz adres URL strefy lądowania w usłudze OneLake, gdzie można umieszczać dane zmiany zgodnie z otwartą specyfikacją dublowania.

Gdy dane są w strefie docelowej z odpowiednim formatem, replikacja rozpoczyna działanie i zarządza złożonością scalania zmian z aktualizacjami, wstawianiem i usuwaniem, które mają zostać odzwierciedlone w tabelach różnicowych. Ta metoda gwarantuje, że wszystkie dane zapisane w strefie docelowej zostaną natychmiast odzwierciedlone, zachowując dane w Fabric aktualne.

Udostępnianie ułatwia kontrolę dostępu i zarządzanie. Mechanizmy kontroli bezpieczeństwa, takie jak zabezpieczenia na poziomie wiersza (RLS), zabezpieczenia na poziomie obiektu (OLS) oraz inne, upewniają się, że możesz kontrolować dostęp do poufnych informacji. Udostępnianie umożliwia również bezpieczne i zdemokratyzowane podejmowanie decyzji w całej organizacji.

Dzięki udostępnianiu użytkownicy udzielają innym użytkownikom lub grupie użytkowników dostępu do dublowanej bazy danych bez udzielania dostępu do obszaru roboczego i pozostałych elementów. Gdy ktoś udostępnia dublowaną bazę danych, udziela również dostępu do punktu końcowego analizy SQL.

Można również udostępniać zmirrowane bazy danych i dane dostępne za pomocą skrótów między granicami dzierżaw przy użyciu zewnętrznego udostępniania danych w OneLake. Współużytkowanie między dzierżawami tworzy skrót tylko do odczytu w dzierżawie odbiorcy, dzięki czemu obie organizacje mogą korzystać z tych samych danych na żywo bez ich duplikowania.

Aby uzyskać więcej informacji, zobacz Udostępnianie dublowanej bazy danych i zarządzanie uprawnieniami.

Zapytania obejmujące wiele baz danych

Dzięki danych z dublowanej bazy danych przechowywanej w usłudze OneLake można zapisywać zapytania obejmujące wiele baz danych, łącząc dane z dublowanych baz danych, magazynów i punktów końcowych analizy SQL usługi Lakehouse w jednym zapytaniu T-SQL. Aby uzyskać więcej informacji, zobacz Pisanie zapytania obejmującego wiele baz danych.

Można na przykład odwołać się do tabeli z lustrzanych baz danych i magazynów przy użyciu trzyczęściowego nazewnictwa. W poniższym przykładzie użyj trzyczęściowej nazwy, aby odwołać się do ContosoSalesTable w magazynie ContosoWarehouse. Pierwsza część standardowej trójczęściowej konwencji nazewnictwa SQL, podobnie jak w innych bazach danych lub magazynach, to nazwa lustrzanej bazy danych.

SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Koszt dublowania

W przypadku mirroringu i otwartego mirroringu baz danych zasoby obliczeniowe Fabric oraz magazyn OneLake są dostępne bez opłat do limitu określonego na podstawie pojemności.

Magazyn replik jest darmowy do określonego limitu związanego z rozmiarem pojemności. Dublowanie oferuje bezpłatny terabajt magazynu dublowania dla każdej zakupionej jednostki pojemności (CU). Jeśli na przykład zakupisz pojemność F64, otrzymasz 64 bezpłatne terabajty pamięci masowej, używane wyłącznie do dublowania. Płacisz za magazyn OneLake, jeśli przekroczysz limit bezpłatnego magazynu dublowania lub gdy pojemność zostanie wstrzymana. Aby uzyskać więcej informacji, zobacz Microsoft Fabric Cennik.
Zasoby obliczeniowe usługi Background Fabric używane do replikowania danych do usługi Fabric OneLake są bezpłatne i nie zużywają pojemności. Żądania bezpośrednio do usługi OneLake dotyczące odzwierciedlonych danych zużywają pojemność w taki sam sposób, jak normalne użycie zasobów obliczeniowych w usłudze OneLake. Obliczenia na potrzeby wykonywania zapytań dotyczących danych przy użyciu języka SQL, usługi Power BI lub platformy Spark są naliczane według regularnych stawek.
Do tworzenia kopii lustrzanej wymagana jest uruchomiona pojemność usługi Microsoft Fabric. Wstrzymana lub usunięta pojemność ma wpływ na dublowanie i nie są replikowane żadne dane. Jednak zasoby obliczeniowe w tle używane do replikacji nie zużywają jednostek pojemności.

Inżynieria danych przy użyciu zreplikowanych danych bazy danych

Microsoft Fabric zapewnia różne możliwości inżynierii danych, aby zapewnić łatwo dostępne, dobrze zorganizowane i wysokiej jakości dane. Z Inżynierii danych w Fabric można:

Twórz i zarządzaj danymi w Spark używając Lakehouse
Projektowanie potoków do kopiowania danych do Lakehouse
Użyj definicji zadań Spark do przesyłania zadań wsadowych lub strumieniowych do klastra Spark.
Używanie notesów do pisania kodu na potrzeby pozyskiwania, przygotowywania i przekształcania danych

Nauka o danych z użyciem odzwierciedlonych danych bazy danych

Microsoft Fabric oferuje usługę Fabric Data Science, aby umożliwić użytkownikom kompleksowe przepływy pracy nauki o danych na potrzeby wzbogacania danych i szczegółowych informacji biznesowych. Możesz wykonać szeroką gamę działań w całym procesie nauki o danych, począwszy od eksploracji danych, przygotowywania i czyszczenia po eksperymenty, modelowanie, ocenianie modelu i obsługę analiz predykcyjnych do raportów analizy biznesowej.

Microsoft Fabric użytkownicy mogą uzyskiwać dostęp do obciążeń Data Science. Z tego miejsca mogą odnajdywać różne odpowiednie zasoby i uzyskiwać do nich dostęp. Mogą na przykład tworzyć eksperymenty, modele i notesy uczenia maszynowego. Mogą również importować istniejące notesy na Stronie Głównej Nauki o Danych.

Usługa Direct Lake z dublowaną bazą danych

Możesz użyć trybu Direct Lake ze zreplikowanymi bazami danych w usłudze Microsoft Fabric, aby umożliwić wykonywanie zapytań o wysokiej wydajności na zreplikowanych danych bez potrzeby przenoszenia lub powielania danych. Podczas tworzenia lustrzanej bazy danych, jej dane są przechowywane w formacie Delta Lake w usłudze OneLake. Ten natywny format umożliwia Power BI i innym narzędziom analitycznym nawiązywanie połączenia za pośrednictwem trybu Direct Lake, oferując szczegółowe informacje niemal w czasie rzeczywistym, bezpośrednio korzystając z podstawowych plików. Ta integracja łączy prostotę dublowania z szybkością i skalowalnością usługi Direct Lake, umożliwiając szybkie, up-to-date raportowania danych operacyjnych.

Przechowywanie danych lustrzanych

Odbijanie w Fabric stale replikuje istniejące zasoby danych do OneLake w formacie tabeli Delta Lake. Aby wydajnie przechowywać dublowane dane i zawsze gotowe do analizy, funkcja dublowania automatycznie uruchamia opróżnianie w celu usunięcia starych plików, do których już nie odwołuje się dziennik delta.

Ustawienie przechowywania można dostosować zgodnie z wymaganiami. Możesz na przykład wybrać krótszy okres przechowywania, aby zmniejszyć użycie przechowywania kopii lustrzanych lub przedłużyć okres przechowywania, aby korzystać z funkcji Delta Time Travel do analizy.

W przypadku lustrzanych baz danych utworzonych w portalu Fabric od połowy czerwca 2025 r. domyślny okres przechowywania wynosi jeden dzień. W przypadku starych dublowanych baz danych wartość domyślna to siedem dni. Aby sprawdzić lub zaktualizować ustawienie przechowywania, w portalu Fabric przejdź do zmirrorowanej bazy danych ->Ustawienia ->Zarządzanie tabelą Delta i określ próg przechowywania. Można go również skonfigurować za pomocą interfejsu API publicznegoretentionInDays, określając właściwość.

Baza danych SQL w Fabric

Możesz również bezpośrednio utworzyć bazę danych SQL i zarządzać nią w Microsoft Fabric w portalu sieci szkieletowej. Na podstawie usługi Azure SQL Database, baza danych SQL w Fabric automatycznie replikuje dane do celów analitycznych i można łatwo utworzyć operacyjną bazę danych w Fabric. Baza danych SQL to strona główna w sieci szkieletowej dla obciążeń OLTP i może być zintegrowana z integracją kontroli źródła sieci szkieletowej.

Opinia

Czy ta strona była pomocna?

Last updated on 2026-07-22