Dublowanie płatka śniegu (wersja zapoznawcza)

Artykuł
04/24/2024

Dublowanie w sieci szkieletowej zapewnia łatwe środowisko umożliwiające uniknięcie złożonych operacji ETL (wyodrębnianie transformacji ładowania) i zintegrowanie istniejących danych magazynu Snowflake z resztą danych w usłudze Microsoft Fabric. Istniejące dane usługi Snowflake można stale replikować bezpośrednio do usługi OneLake w usłudze Fabric. Wewnątrz sieci szkieletowej można odblokować zaawansowane scenariusze analizy biznesowej, sztucznej inteligencji, inżynierowie danych, Nauka o danych i udostępniania danych.

Aby zapoznać się z samouczkiem dotyczącym konfigurowania bazy danych Snowflake na potrzeby dublowania w sieci szkieletowej, zobacz Samouczek: konfigurowanie dublowanych baz danych usługi Microsoft Fabric z usługi Snowflake (wersja zapoznawcza).

Dlaczego warto używać funkcji dublowania w sieci szkieletowej?

W przypadku dublowania w sieci szkieletowej nie trzeba łączyć różnych usług od wielu dostawców. Zamiast tego możesz korzystać z wysoce zintegrowanego, kompleksowego i łatwego w użyciu produktu, który został zaprojektowany w celu uproszczenia potrzeb analitycznych, a także skompilowany pod kątem otwartości i współpracy między firmą Microsoft, snowflake i 1000 rozwiązań technologicznych, które mogą odczytywać format tabeli delta lake typu open source.

Jakie środowiska analityczne są wbudowane?

Dublowane bazy danych są elementem w usłudze Fabric Synapse Magazyn danych odrębnym od punktu końcowego magazynu i analizy SQL.

Diagram dublowania bazy danych sieci szkieletowej dla płatka śniegu.

Dublowanie tworzy trzy elementy w obszarze roboczym usługi Fabric:

Element dublowanej bazy danych. Dublowanie zarządza replikacją danych do usługi OneLake i konwersją na Parquet w formacie gotowym do analizy. Umożliwia to wykonywanie scenariuszy podrzędnych, takich jak inżynieria danych, nauka o danych i nie tylko.
Punkt końcowy analizy SQL
Domyślny model semantyczny

Każda dublowana baza danych ma automatycznie wygenerowany punkt końcowy analizy SQL, który zapewnia zaawansowane środowisko analityczne na podstawie tabel delty utworzonych przez proces dublowania. Użytkownicy mają dostęp do znanych poleceń języka T-SQL, które mogą definiować obiekty danych i wykonywać względem niego zapytania, ale nie manipulować danymi z punktu końcowego analizy SQL, ponieważ jest to kopia tylko do odczytu. Następujące akcje można wykonać w punkcie końcowym analizy SQL:

Zapoznaj się z tabelami, które odwołują się do danych w tabelach usługi Delta Lake z usługi Snowflake.
Tworzenie żadnych zapytań i widoków kodu oraz eksplorowanie danych wizualnie bez konieczności pisania wiersza kodu.
Twórz widoki SQL, wbudowane funkcje TVF (funkcje z wartościami tabel) i procedury składowane w celu hermetyzacji semantyki i logiki biznesowej w języku T-SQL.
Zarządzanie uprawnieniami do obiektów.
Wykonywanie zapytań o dane w innych magazynach i magazynach Lakehouse w tym samym obszarze roboczym.

Oprócz Edytor Power Query SQL usługi Microsoft Fabric istnieje szeroki ekosystem narzędzi, który umożliwia wykonywanie zapytań dotyczących punktu końcowego analizy SQL, w tym programu SQL Server Management Studio, programu Azure Data Studio, a nawet usługi GitHubCopilot.

Zagadnienia dotyczące zabezpieczeń

Aby włączyć dublowanie sieci szkieletowej, musisz mieć uprawnienia użytkownika dla bazy danych Snowflake, która zawiera następujące uprawnienia:

CREATE STREAM
SELECT table
SHOW tables
DESCRIBE tables

Aby uzyskać więcej informacji, zobacz dokumentację usługi Snowflake dotyczącą uprawnień kontroli dostępu dla tabel przesyłania strumieniowego i Wymaganych uprawnień dla Strumienie.

Ważne

Wszelkie szczegółowe zabezpieczenia ustanowione w źródłowym magazynie Snowflake muszą zostać ponownie skonfigurowane w dublowanej bazie danych w usłudze Microsoft Fabric. Aby uzyskać więcej informacji, zobacz Szczegółowe uprawnienia sql w usłudze Microsoft Fabric.

Zagadnienia dotyczące kosztów dublowania płatka śniegu

Sieć szkieletowa nie pobiera opłat za ruch przychodzący danych sieciowych do usługi OneLake na potrzeby dublowania. Nie ma żadnych kosztów dublowania, gdy dane usługi Snowflake są replikowane do usługi OneLake.

Podczas dublowania danych istnieją koszty obliczeń usługi Snowflake i zapytań w chmurze: zasoby obliczeniowe magazynu wirtualnego i usługi w chmurze.

Opłaty za zasoby obliczeniowe magazynu wirtualnego snowflake:
- Opłaty za obliczenia będą naliczane po stronie usługi Snowflake, jeśli istnieją zmiany danych odczytywane w usłudze Snowflake, a z kolei są dublowane w usłudze Fabric.
- Wszystkie zapytania metadanych są uruchamiane w tle, aby sprawdzić, czy zmiany danych nie są naliczane za żadne obliczenia snowflake; jednak zapytania, które generują dane, takie jak a SELECT * , wznawiają magazyn Snowflake i będą naliczane opłaty za obliczenia.
Opłaty za obliczenia usług Snowflake:
- Chociaż nie ma żadnych opłat za obliczenia dla zadań w tle, takich jak tworzenie, zapytania metadanych, kontrola dostępu, wyświetlanie zmian danych, a nawet zapytania DDL, istnieją koszty chmury związane z tymi zapytaniami.
- W zależności od typu posiadanej wersji Snowflake opłata zostanie naliczona za odpowiednie środki za wszelkie koszty usług w chmurze.

Na poniższym zrzucie ekranu przedstawiono koszty obliczeń magazynu wirtualnego i usług w chmurze dla skojarzonej bazy danych Snowflake, która jest dublowana w sieci szkieletowej. W tym scenariuszu większość kosztów obliczeniowych usług w chmurze (w kolorze żółtym) pochodzi z zapytań dotyczących zmian danych w oparciu o wymienione wcześniej punkty. Opłaty za obliczenia magazynu wirtualnego (w kolorze niebieskim) pochodzą ściśle ze zmian danych są odczytywane z usługi Snowflake i dublowane w usłudze Fabric.

Aby uzyskać więcej informacji na temat kosztów zapytań dotyczących chmury specyficznych dla usługi Snowflake, zobacz Dokumentację usługi Snowflake: Omówienie ogólnego kosztu.

Następny krok

Samouczek: konfigurowanie dublowanych baz danych usługi Microsoft Fabric z usługi Snowflake (wersja zapoznawcza)

Udostępnij za pośrednictwem

Dublowanie płatka śniegu (wersja zapoznawcza)

Dlaczego warto używać funkcji dublowania w sieci szkieletowej?

Jakie środowiska analityczne są wbudowane?

Zagadnienia dotyczące zabezpieczeń

Zagadnienia dotyczące kosztów dublowania płatka śniegu

Następny krok

Opinia

Dodatkowe zasoby

Udostępnij za pośrednictwem

Dublowanie płatka śniegu (wersja zapoznawcza)

Dlaczego warto używać funkcji dublowania w sieci szkieletowej?

Jakie środowiska analityczne są wbudowane?

Zagadnienia dotyczące zabezpieczeń

Zagadnienia dotyczące kosztów dublowania płatka śniegu

Następny krok

Powiązana zawartość

Opinia

Dodatkowe zasoby