Udostępnij przez


Odwzorowywanie Google BigQuery w usłudze Microsoft Fabric (wersja wstępna)

Dublowanie w sieci szkieletowej oferuje prosty sposób uniknięcia złożonych procesów ETL (wyodrębnianie, przekształcanie, ładowanie) i bezproblemową integrację istniejących danych magazynu Google BigQuery z resztą danych w sieci szkieletowej. Dane Google BigQuery można w sposób ciągły replikować bezpośrednio do OneLake w ramach Fabric. W usłudze Fabric możesz korzystać z zaawansowanych funkcji analizy biznesowej, sztucznej inteligencji, inżynierii danych, nauki o danych i udostępniania danych.

Aby zapoznać się z samouczkiem dotyczącym konfigurowania bazy danych Google BigQuery na potrzeby mirroringu w Microsoft Fabric, zobacz Samouczek: Konfigurowanie zreplikowanych baz danych Microsoft Fabric z Google BigQuery.

Ważne

Dublowanie w usłudze Google BigQuery jest teraz dostępne w wersji zapoznawczej. Obciążenia produkcyjne nie są obsługiwane w wersji zapoznawczej.

Dlaczego warto używać dublowania w sieci szkieletowej?

Odwzorowanie w usłudze Microsoft Fabric eliminuje złożoność łączenia narzędzi od różnych dostawców. Nie trzeba migrować danych. Połącz się z danymi Google BigQuery niemal w czasie rzeczywistym, aby korzystać z zestawu narzędzi analitycznych Fabric. Fabric współpracuje również bezproblemowo z produktami firmy Microsoft, Google BigQuery i szeroką gamą technologii, które obsługują format tabeli Delta Lake typu open source.

Jakie doświadczenia analityczne są wbudowane?

Mirroring tworzy dwa elementy w obszarze roboczym usługi Fabric.

  • Element dublowanej bazy danych. Dublowanie zarządza replikacją danych do usługi OneLake i konwersją na Parquet w formacie gotowym do analizy. Odwzorowanie umożliwia realizację dalszych scenariuszy, takich jak inżynieria danych, nauka o danych i inne. Dublowane bazy danych różnią się od elementów punktu końcowego magazynu i analizy SQL.
  • Punkt końcowy analizy SQL

Diagram mirroring bazy danych Fabric dla usługi Google BigQuery.

Z każdej dublowanej bazy danych punkt końcowy analizy SQL zapewnia środowisko analityczne tylko do odczytu na podstawie tabel delta utworzonych podczas dublowania. Ten punkt końcowy obsługuje składnię języka T-SQL do definiowania i wykonywania zapytań dotyczących obiektów danych, ale nie zezwala na bezpośrednie zmiany danych, ponieważ dane są tylko do odczytu.

Za pomocą punktu końcowego analizy SQL można wykonywać następujące czynności:

  • Przeglądaj tabele odwołujące się do danych Delta Lake zreplikowanych z BigQuery.
  • Tworzenie zapytań i widoków bez kodu oraz wizualne eksplorowanie danych — bez wymaganego języka SQL.
  • Tworzenie widoków SQL, wbudowanych funkcji tabel (TVFs) i procedur składowanych w warstwie w logice biznesowej za pomocą języka T-SQL.
  • Ustawianie uprawnień dla obiektów i zarządzanie nimi.
  • Wykonywanie zapytań o dane w innych magazynach i Lakehouse w tym samym obszarze roboczym.

Oprócz edytora zapytań SQL istnieje szeroki ekosystem narzędzi, które mogą wykonywać zapytania dotyczące punktu końcowego analizy SQL, w tym programu SQL Server Management Studio (SSMS),rozszerzenia mssql z programem Visual Studio Code, a nawet usługi GitHub Copilot.

Zagadnienia dotyczące zabezpieczeń

Istnieją określone wymagania dotyczące uprawnień użytkownika umożliwiające włączenie dublowania sieci szkieletowej.

Fabric udostępnia również funkcje ochrony danych do zarządzania dostępem w usłudze Microsoft Fabric. Aby uzyskać więcej informacji, zobacz dokumentację funkcji ochrony danych.

Zagadnienia dotyczące kosztów odwzorowywania w BigQuery

Zasoby obliczeniowe Fabric używane do replikowania danych do usługi Fabric OneLake są bezpłatne. Koszt magazynu dublowania jest bezpłatny do limitu na podstawie pojemności. Obliczenia na potrzeby wykonywania zapytań dotyczących danych przy użyciu języka SQL, usługi Power BI lub platformy Spark są naliczane według regularnych stawek.

Sieć szkieletowa nie pobiera opłat za ruch przychodzący danych sieciowych do usługi OneLake na potrzeby dublowania.

Podczas dublowania danych są naliczane koszty obliczeniowe BigQuery i zapytań w chmurze Google: BigQuery Change Data Capture (CDC) wykorzystuje obliczenia BigQuery do modyfikacji wierszy, API zapisu Storage Write API do pozyskiwania danych oraz magazyn BigQuery do przechowywania danych, co wiąże się z kosztami.

Aby uzyskać więcej informacji na temat kosztów dublowania Google BigQuery, zobacz objaśnienie cennika.

Następny krok