Udostępnij przez


Co to jest magazynowanie danych w usłudze Microsoft Fabric?

Dotyczy:✅ punktu końcowego analizy SQL i magazynu danych w usłudze Microsoft Fabric

Usługa Fabric Data Warehouse to relacyjny magazyn relacyjny w skali przedsiębiorstwa na podstawie magazynu data lake.

  • Idealne przypadki użycia magazynu danych sieci szkieletowej to schematy gwiazdy lub płatka śniegu, wyselekcjonowane składnice danych firmowych, zarządzane modele semantyczne na potrzeby analizy biznesowej.
  • Dane magazynu danych sieci szkieletowej, podobnie jak wszystkie dane sieci szkieletowej, są przechowywane w tabelach delty, które są plikami danych z dziennikiem transakcji opartym na plikach. Oparty na otwartym formacie danych sieci szkieletowej magazyn umożliwia udostępnianie i współpracę między inżynierami danych i użytkownikami biznesowymi bez naruszania zabezpieczeń lub ładu.
  • Usługa Fabric Data Warehouse jest opracowywana głównie przy użyciu języka T-SQL i udostępnia duży obszar powierzchni oparty na aparacie bazy danych SQL, z pełną obsługą transakcji ACID w wielu tabelach, zmaterializowanymi widokami, funkcjami i procedurami składowanymi.
  • Zbiorcze ładowanie magazynu danych sieci szkieletowej można wykonać za pośrednictwem połączeń T-SQL i TDS lub za pośrednictwem platformy Spark z danymi zapisywanymi zbiorczo w tabelach delty.
  • Łatwe w użyciu środowisko SaaS jest również ściśle zintegrowane z usługą Power BI w celu łatwej analizy i raportowania.

Klienci magazynu danych korzystają z następujących korzyści:

  • Zapytania obejmujące wiele baz danych mogą używać wielu źródeł danych do szybkiego wglądu w szczegółowe dane z zerowymi duplikacjami danych.
  • Łatwe pozyskiwanie, ładowanie i przekształcanie danych na dużą skalę za pomocą potoków, przepływów danych, zapytania między bazami danych lub polecenia COPY INTO.
  • Autonomiczne zarządzanie obciążeniami z wiodącym w branży aparatem przetwarzania zapytań rozproszonych nie oznacza, że żadne pokrętła nie zwracają się do osiągnięcia najlepszej wydajności klasy.
  • Skalowanie niemal natychmiast w celu spełnienia wymagań biznesowych. Przechowywanie zasobów i obliczenia są oddzielone.
  • Dane są automatycznie replikowane do plików OneLake w celu uzyskania dostępu zewnętrznego.
  • Utworzony dla dowolnego poziomu umiejętności od dewelopera obywatela do administratora bazy danych lub inżyniera danych.

Elementy magazynowania danych

Usługa Fabric Data Warehouse nie jest tradycyjnym magazynem danych przedsiębiorstwa, jest magazynem lake, który obsługuje dwa odrębne elementy magazynowania: element magazynu sieci szkieletowej i element punktu końcowego analizy SQL. Oba są zaprojektowane specjalnie w celu zaspokojenia potrzeb biznesowych klientów, zapewniając jednocześnie najlepszą wydajność klasy, minimalizując koszty i zmniejszając nakład pracy administracyjnej.

Magazyn danych sieci szkieletowej

W obszarze roboczym usługi Microsoft Fabric magazyn sieci szkieletowej jest oznaczony jako Magazyn w kolumnie Typ . Jeśli potrzebujesz pełnej mocy i możliwości transakcyjnych (obsługa zapytań DDL i DML) magazynu danych, jest to szybkie i proste rozwiązanie.

Zrzut ekranu przedstawiający typ magazynu w obszarze roboczym.

Magazyn może być wypełniany przez jedną z obsługiwanych metod pozyskiwania danych, takich jak COPY INTO, Pipelines, Dataflows lub cross database ingestion options, np. CREATE TABLE AS SELECT (CTAS), INSERT.. WYBIERZ LUB WYBIERZ DO.

Aby rozpocząć pracę z magazynem, zobacz:

Punkt końcowy analizy SQL usługi Lakehouse

W obszarze roboczym Microsoft Fabric każdy Lakehouse ma automatycznie wygenerowany "punkt końcowy analizy SQL", który może służyć do przejścia z widoku "Lake" Lakehouse (obsługującego inżynierię danych i platformę Apache Spark) do widoku "SQL" tego samego Lakehouse w celu tworzenia widoków, funkcji, procedur składowanych i stosowania zabezpieczeń SQL.

Zrzut ekranu przedstawiający typ punktu końcowego analizy SQL w obszarze roboczym.

Korzystając z podobnej technologii, zarówno magazyn, baza danych SQL, jak i usługa Fabric OneLake, wszystkie automatycznie aprowizują punkt końcowy analizy SQL podczas tworzenia.

Za pomocą punktu końcowego analizy SQL polecenia języka T-SQL mogą definiować i wykonywać zapytania o obiekty danych, ale nie manipulować ani modyfikować danych. Następujące akcje można wykonać w punkcie końcowym analizy SQL:

  • Wykonywanie zapytań względem tabel odwołujących się do danych w folderach usługi Delta Lake w usłudze Lake.
  • Tworzenie widoków, wbudowanych funkcji TVF i procedur w celu hermetyzacji semantyki i logiki biznesowej w języku T-SQL.
  • Zarządzanie uprawnieniami do obiektów. Aby uzyskać więcej informacji na temat zabezpieczeń w punkcie końcowym SQL Analytics, zobacz Zabezpieczenia usługi OneLake dla punktów końcowych SQL Analytics.

Aby rozpocząć pracę z punktem końcowym analizy SQL, zobacz:

Magazyn lub jezioro

Podczas podejmowania decyzji dotyczących korzystania z magazynu lub magazynu typu lakehouse należy wziąć pod uwagę konkretne potrzeby i kontekst wymagań związanych z zarządzaniem danymi i analizą.

  • Wybierz magazyn danych, gdy potrzebujesz rozwiązania w skali przedsiębiorstwa z otwartym standardowym formatem, bez wydajności pokrętła i minimalnej konfiguracji.  Najlepiej nadaje się do obsługi częściowo ustrukturyzowanych i ustrukturyzowanych formatów danych, magazyn danych jest odpowiedni zarówno dla początkujących, jak i doświadczonych specjalistów ds. danych, oferując proste i intuicyjne środowiska.

  • Wybierz usługę Lakehouse , gdy potrzebujesz dużego repozytorium wysoce nieustrukturyzowanych danych ze źródeł heterogenicznych i chcesz użyć platformy Spark jako podstawowego narzędzia programistycznego. Działając jako "lekki" magazyn danych, zawsze masz możliwość używania punktu końcowego analizy SQL i narzędzi T-SQL do dostarczania scenariuszy raportowania i analizy danych w usłudze Lakehouse.

Zawsze masz możliwość dodania jednego lub drugiego w późniejszym momencie, jeśli potrzeby biznesowe zmienią się i niezależnie od tego, gdzie się rozpoczniesz, zarówno magazyn, jak i lakehouse używają tego samego zaawansowanego aparatu SQL dla wszystkich zapytań T-SQL.

Aby uzyskać bardziej szczegółowe wskazówki dotyczące podejmowania decyzji, zobacz Przewodnik po decyzjach usługi Microsoft Fabric: Wybieranie między magazynem i usługą Lakehouse.

Migration

Użyj narzędzia Fabric Migration Assistant for Data Warehouse , aby przeprowadzić migrację z usług Azure Synapse Analytics, SQL Server i innych platform aparatu bazy danych SQL. Zapoznaj się z artykułem Metody planowania migracji i migracji dla dedykowanych pul SQL usługi Azure Synapse Analytics w usłudze Fabric Data Warehouse.

Aby uzyskać wskazówki dotyczące migracji w usłudze Microsoft Fabric, zapoznaj się z narzędziami i linkami w temacie Omówienie migracji usługi Microsoft Fabric.