Udostępnij za pośrednictwem


Dublowanie Azure SQL Managed Instance

Mirroring w Microsoft Fabric zapewnia łatwe środowisko, aby uniknąć złożonego procesu ETL (Wyodrębnianie, Transformowanie, Ładowanie) i zintegrować istniejące środowisko Azure SQL Managed Instance z resztą danych w Microsoft Fabric. Istniejące bazy danych SQL Managed Instance można stale replikować bezpośrednio do OneLake w ramach usługi Fabric. Wewnątrz sieci szkieletowej można odblokować zaawansowane scenariusze analizy biznesowej, sztucznej inteligencji, inżynierii danych, nauki o danych i udostępniania danych.

Aby zapoznać się z samouczkiem dotyczącym konfigurowania Azure SQL Managed Instance na potrzeby dublowania w sieci szkieletowej, zobacz Tutorial: Konfigurowanie dublowanych baz danych Microsoft Fabric z Azure SQL Managed Instance.

Dlaczego używać mirrorowania w Fabric?

Dzięki funkcji Mirroring w technologii Fabric nie trzeba łączyć różnych usług od wielu dostawców. Zamiast tego możesz korzystać z wysoce zintegrowanego, kompleksowego i łatwego w użyciu produktu, który został zaprojektowany w celu uproszczenia potrzeb analitycznych oraz skompilowany pod kątem otwartości i współpracy między firmą Microsoft, Azure SQL Managed Instance i 1000 rozwiązań technologicznych, które mogą odczytywać format tabeli delta lake typu open source.

Jakie doświadczenia analityczne są wbudowane?

Dublowane bazy danych są elementem w Fabric Data Warehouse odrębnym od Warehouse i punktu końcowego analizy SQL.

Diagram mirrorowania bazy danych Fabric dla Azure SQL Managed Instance.

Utworzenie dublowanego wystąpienia zarządzanego SQL powoduje utworzenie tych elementów w obszarze roboczym usługi Fabric:

  • Element zmironizowanej bazy danych. Mirroring zarządza replikacją danych do OneLake i konwersją na format Parquet, w formacie gotowym do analiz. Umożliwia to wykonywanie scenariuszy podrzędnych, takich jak inżynieria danych, nauka o danych i nie tylko.
  • Punkt końcowy analizy SQL

Każdy dublowany Azure SQL Managed Instance ma automatycznie wygenerowany punkt końcowy analizy SQL który zapewnia zaawansowane środowisko analityczne na podstawie tabel delty utworzonych przez proces dublowania. Użytkownicy mają dostęp do znanych poleceń języka T-SQL, które mogą definiować obiekty danych i wykonywać względem niego zapytania, ale nie manipulować danymi z punktu końcowego analizy SQL, ponieważ jest to kopia tylko do odczytu. Następujące akcje można wykonać w punkcie końcowym analizy SQL:

  • Zapoznaj się z tabelami, które odwołują się do danych w tabelach usługi Delta Lake z Azure SQL Managed Instance.
  • Twórz zapytania i widoki bez kodowania oraz eksploruj dane wizualnie bez konieczności pisania ani jednej linii kodu.
  • Twórz widoki SQL, wbudowane funkcje TVF (funkcje z wartościami tabel) i procedury składowane w celu hermetyzacji semantyki i logiki biznesowej w języku T-SQL.
  • Zarządzanie uprawnieniami do obiektów.
  • Wykonywanie zapytań o dane w innych magazynach i magazynach Lakehouse w tym samym obszarze roboczym.

Oprócz edytora zapytań SQL, Istnieje szeroki ekosystem narzędzi, który może wysyłać zapytania do punktu końcowego analizy SQL, w tym SQL Server Management Studio (SSMS), rozszerzenie MSSQL dla Visual Studio Code, a nawet GitHub Copilot.

Odwzorowanie Azure SQL Managed Instance za zaporą

Jeśli Azure SQL Managed Instance nie jest publicznie dostępna, utwórz bramę danych wirtualnej sieci lub bramę danych lokalną w celu dublowania danych. Upewnij się, że sieć Azure Virtual Network lub serwera bramy może łączyć się z Azure SQL Managed Instance za pośrednictwem prywatnego punktu końcowego.

Aktywne transakcje, obciążenia i zachowania aparatu replikatora

  • Aktywne transakcje nadal blokują przycinanie dziennika transakcji aż do momentu, gdy transakcja zostanie zatwierdzona, a dublowany Azure SQL Managed Instance nadrobi zaległości, lub gdy transakcja się zakończy. Długotrwałe transakcje mogą spowodować wypełnienie dziennika transakcji więcej niż zwykle. Źródłowy dziennik transakcji bazy danych powinien być monitorowany, żeby dziennik transakcji się nie zapełnił. Aby uzyskać więcej informacji, zobacz Dziennik transakcji rośnie z powodu długotrwałych transakcji i cdC.
  • Każde obciążenie użytkownika różni się. Podczas początkowej migawki może występować większe zużycie zasobów w źródłowej bazie danych, zarówno dla CPU, jak i dla operacji we/wy na sekundę (IOPS). Operacje aktualizacji/usuwania tabel mogą prowadzić do zwiększenia generowania dzienników. Dowiedz się więcej na temat sposobu monitorowanie zasobów dla Azure SQL Managed Instance.

Obsługa modeli warstw i modelu zakupów

Źródłowy Azure SQL Managed Instance może być pojedynczym wystąpieniem zarządzanym SQL lub wystąpieniem zarządzanym SQL należącym do puli wystąpień.

Pricing

Zasoby obliczeniowe sieci szkieletowej używane do replikowania danych do usługi Fabric OneLake są bezpłatne. Przechowywanie w OneLake jest bezpłatne w zależności od wielkości pojemności. Aby uzyskać więcej informacji, zobacz Koszt dublowania oraz OneLake cennik dublowania. Użycie zasobów obliczeniowych do wykonywania zapytań dotyczących danych za pośrednictwem programu SQL, Power BI lub platformy Spark jest nadal naliczane na podstawie pojemności sieci szkieletowej.

Następny krok