Udostępnij przez


Dublowanie wykazu aparatu Unity usługi Azure Databricks

Wiele organizacji rejestruje obecnie swoje dane w wykazie aparatu Unity w usłudze Azure Databricks. Odbity Unity Catalog w Fabric umożliwia klientowi odczytywanie danych zarządzanych przez Unity Catalog z obciążeń w Fabric. Usługi Azure Databricks i Fabric są lepsze razem.

Aby zapoznać się z samouczkiem dotyczącym konfigurowania obszaru roboczego usługi Azure Databricks na potrzeby dublowania wykazu aparatu Unity w sieci szkieletowej, zobacz Samouczek: konfigurowanie dublowanych baz danych usługi Microsoft Fabric z usługi Azure Databricks.

Dublowane bazy danych w sieci szkieletowej umożliwiają użytkownikom korzystanie z wysoce zintegrowanego, kompleksowego i łatwego w użyciu produktu, który został zaprojektowany w celu uproszczenia potrzeb analitycznych. Możesz cieszyć się łatwym w użyciu produktem zaprojektowanym w celu uproszczenia potrzeb analitycznych i skompilowania na potrzeby otwierania i współpracy między usługami Microsoft Fabric i Azure Databricks.

Gdy używasz sieci szkieletowej do odczytywania danych zarejestrowanych w wykazie aparatu Unity, nie ma przenoszenia danych ani replikacji danych. Tylko struktura katalogu usługi Azure Databricks jest dublowana w sieci szkieletowej, a podstawowe dane wykazu są dostępne za pomocą skrótów. Zmiany w danych źródłowych mogą nie pojawiać się natychmiast w Fabric. Propagacja może potrwać od kilku sekund do kilku minut, zgodnie z opisem w dokumentacji wydajności punktu końcowego usługi SQL Analytics.

Jakie środowiska analityczne są wbudowane

Katalogi dublowane są elementem magazynowania danych sieci szkieletowej różni się od punktu końcowego magazynu i analizy SQL.

Podczas dublowania katalogu aparatu Unity usługi Azure Databricks sieć szkieletowa tworzy następujące elementy:

Dostęp do danych dublowanych w usłudze Azure Databricks można uzyskać na wiele sposobów:

  • Każdy element dublowany w usłudze Azure Databricks ma automatycznie wygenerowany punkt końcowy analizy SQL, który zapewnia zaawansowane środowisko analityczne utworzone przez proces dublowania. Użyj poleceń języka T-SQL, aby zdefiniować i wysyłać zapytania o obiekty danych z punktu końcowego analizy SQL tylko do odczytu.
  • Użyj usługi Power BI z trybem Direct Lake, aby tworzyć raporty względem elementu usługi Azure Databricks.

Synchronizacja metadanych

Podczas tworzenia nowej dublowanej bazy danych z usługi Azure Databricks w usłudze Fabric domyślnie jest włączona opcja Automatycznie synchronizuj przyszłe zmiany wykazu dla wybranego schematu . Następujące zmiany metadanych są odzwierciedlane w obszarze roboczym usługi Azure Databricks do sieci szkieletowej, jeśli włączono automatyczną synchronizację:

  • Dodawanie schematów do wykazu.
  • Usuwanie schematów z wykazu.
  • Dodawanie tabel do schematu.
  • Usuwanie tabel ze schematu.

Wybór schematu/tabeli:

  • Domyślnie cały wykaz jest wybierany, gdy użytkownik dodaje wykaz.
  • Użytkownik może wykluczyć niektóre tabele w schemacie.
  • Usunięcie zaznaczenia schematu usuwa zaznaczenie wszystkich tabel w schemacie.
  • Jeśli użytkownik wróci i wybierze schemat, wszystkie tabele w schemacie zostaną ponownie wybrane.
  • To samo zachowanie wyboru dotyczy schematów w wykazie.

Istnieją inne warunki filtrowania stosowane do katalogów/schematów/tabel:

  • Zmaterializowane widoki i tabele przesyłania strumieniowego nie będą wyświetlane.
  • Tabele zewnętrzne, które nie obsługują formatu różnicowego, nie będą wyświetlane.