Wprowadzenie do magazynów danych

Użytkownicy biznesowi w dużym stopniu korzystają z centralnie zarządzanych źródeł danych utworzonych przez zespoły informatyczne, ale może upłynąć kilka miesięcy, zanim dział IT dostarczy zmianę w danym źródle danych. W odpowiedzi użytkownicy często uciekają się do tworzenia własnych składnic danych z bazami danych programu Access, plikami lokalnymi, witrynami programu SharePoint i arkuszami kalkulacyjnymi, co skutkuje brakiem ładu i odpowiednim nadzorem w celu zapewnienia, że takie źródła danych są obsługiwane i mają rozsądną wydajność.

Usługa Datamarts pomaga wypełnić lukę między użytkownikami biznesowymi i it. Magazyny danych to rozwiązania do samoobsługowej analizy, które umożliwiają użytkownikom przechowywanie i eksplorowanie danych ładowanych w w pełni zarządzanej bazy danych. Moduły Datamarts zapewniają proste i opcjonalne środowisko bez kodu umożliwiające pozyskiwanie danych z różnych źródeł danych, wyodrębnianie transformacji i ładowania (ETL) danych przy użyciu dodatku Power Query, a następnie załadowanie ich do bazy danych Azure SQL Database, która jest w pełni zarządzana i nie wymaga dostrajania ani optymalizacji.

Po załadowaniu danych do elementu datamart można dodatkowo zdefiniować relacje i zasady na potrzeby analizy biznesowej i analizy. Usługa Datamarts automatycznie generuje semantyczny model lub semantyczny model, który może służyć do tworzenia raportów i pulpitów nawigacyjnych usługi Power BI. Możesz również wykonywać zapytania dotyczące elementu datamart przy użyciu punktu końcowego języka T-SQL lub środowiska wizualnego.

Diagram przedstawiający relacje datamarts i power BI.

Usługa Datamarts oferuje następujące korzyści:

  • Użytkownicy samoobsługi mogą łatwo wykonywać analizę relacyjnej bazy danych bez konieczności korzystania z administratora bazy danych
  • Usługa Datamarts zapewnia kompleksowe pozyskiwanie, przygotowywanie i eksplorację danych za pomocą języka SQL, w tym środowiska bez kodu
  • Włączanie tworzenia semantycznych modeli i raportów w jednym holistycznym środowisku

Funkcje elementu Datamart:

  • 100% oparte na sieci Web, żadne inne oprogramowanie nie jest wymagane
  • Środowisko bez kodu, w wyniku czego w pełni zarządzana tabela danych
  • Automatyczne dostrajanie wydajności
  • Wbudowana wizualizacja i edytor zapytań SQL na potrzeby analizy ad hoc
  • Obsługa języka SQL i innych popularnych narzędzi klienckich
  • Natywna integracja z usługami Power BI, Microsoft Office i innymi ofertami analizy firmy Microsoft
  • Uwzględnione w pojemnościach usługi Power BI Premium i warstwie Premium na użytkownika

Kiedy należy używać magazynów danych

Usługa Datamarts jest przeznaczona dla interaktywnych obciążeń danych na potrzeby scenariuszy samoobsługi. Jeśli na przykład pracujesz w księgowości lub finansach, możesz utworzyć własne modele danych i kolekcje, których następnie możesz użyć do samodzielnej obsługi pytań biznesowych i odpowiedzi za pomocą języka T-SQL i wizualnych środowisk zapytań. Ponadto można nadal używać tych kolekcji danych do bardziej tradycyjnych środowisk raportowania usługi Power BI. Usługa Datamarts jest zalecana dla klientów, którzy potrzebują zorientowanej na domenę, zdecentralizowanej własności danych i architektury, takich jak użytkownicy, którzy potrzebują danych jako produktu lub platformy danych samoobsługi.

Usługa Datamarts jest przeznaczona do obsługi następujących scenariuszy:

  • Dane samoobsługowe dla działów: scentralizowanie małych i średnich ilości danych (około 100 GB) w samoobsługowej w pełni zarządzanej bazie danych SQL. Usługa Datamarts umożliwia wyznaczenie pojedynczego magazynu na potrzeby samoobsługowego podrzędnego raportowania podrzędnego (na przykład programu Excel, raportów usługi Power BI, innych), co zmniejsza infrastrukturę w rozwiązaniach samoobsługowych.

  • Analiza relacyjnej bazy danych w usłudze Power BI: uzyskiwanie dostępu do danych na podstawie danych przy użyciu zewnętrznych klientów SQL. Usługa Azure Synapse i inne usługi/narzędzia korzystające z języka T-SQL mogą również używać magazynów danych w usłudze Power BI.

  • Kompleksowe modele semantyczne: umożliwia twórcom usługi Power BI tworzenie kompleksowego rozwiązania bez zależności od innych narzędzi lub zespołów IT. Usługa Datamarts pozbywa się orkiestracji między przepływami danych i modelami semantycznymi za pomocą automatycznie generowanych modeli semantycznych, zapewniając jednocześnie wizualne środowiska do wykonywania zapytań dotyczących danych i analizy ad hoc, a wszystko to jest obsługiwane przez usługę Azure SQL DB.

W poniższej tabeli opisano te oferty i najlepsze zastosowania dla każdego z nich, w tym ich rolę z magazynami danych.

Towar Zalecany przypadek użycia Uzupełnianie roli za pomocą funkcji datamarts
Magazyny danych Magazynowanie danych oparte na użytkownikach i dostęp SQL do danych Magazyny danych mogą służyć jako źródła dla innych magazynów danych lub elementów przy użyciu punktu końcowego SQL:
  • Udostępnianie zewnętrzne
  • Udostępnianie między granicami działów lub organizacji z włączonymi zabezpieczeniami
Przepływy danych Przygotowywanie danych wielokrotnego użytku (ETL) dla modeli semantycznych lub składnic Funkcja Datamarts używa jednego wbudowanego przepływu danych dla etL. Przepływy danych mogą to podkreślić, włączając:
  • Ładowanie danych do magazynów danych przy użyciu różnych harmonogramów odświeżania
  • Oddzielenie procesu ETL i kroków przygotowywania danych z magazynu, dzięki czemu może być ponownie używane przez modele semantyczne
Modele semantyczne Metryki i warstwa semantyczna na potrzeby raportowania analizy biznesowej Usługa Datamarts udostępnia automatycznie generowany semantyczny model raportowania, włączając:
  • Łączenie danych z wielu źródeł
  • Selektywne udostępnianie tabel datamart na potrzeby szczegółowego raportowania
  • Modele złożone — semantyczny model z danymi z schematu danych i innych źródeł danych spoza schematu danych
  • Modele serwerów proxy — semantyczny model, który używa trybu DirectQuery dla modelu generowanego automatycznie przy użyciu pojedynczego źródła prawdy

Integracja z magazynami danych i przepływami danych

W niektórych przypadkach przydatne może być uwzględnienie zarówno przepływów danych, jak i magazynów danych w tym samym rozwiązaniu. W następujących sytuacjach można znaleźć korzystne włączenie zarówno przepływów danych, jak i magazynów danych:

  • W przypadku rozwiązań z istniejącymi przepływami danych:

    • Łatwe korzystanie z danych za pomocą funkcji datamarts w celu zastosowania wszelkich dodatkowych przekształceń lub włączenia analizy ad hoc i wykonywania zapytań przy użyciu zapytań SQL
    • Łatwe integrowanie rozwiązania do magazynowania danych bez kodu bez zarządzania modelami semantycznymi
  • W przypadku rozwiązań z istniejącymi magazynami danych:

    • Wykonywanie wyodrębniania, przekształcania i ładowania wielokrotnego użytku (ETL) na dużą skalę dla dużych woluminów danych
    • Używanie własnego magazynu data lake i używanie przepływów danych jako potoku dla magazynów danych

Diagram przedstawiający magazyny danych i przepływy danych.

Porównywanie przepływów danych z magazynami danych

W tej sekcji opisano różnice między przepływami danych i magazynami danych.

Przepływy danych zapewniają wyodrębnianie, przekształcanie i ładowanie wielokrotnego użytku (ETL). Tabel nie można przeglądać, wykonywać zapytań ani eksplorować bez modelu semantycznego, ale można je zdefiniować do ponownego użycia. Dane są uwidocznione w formacie usługi Power BI lub CDM w przypadku korzystania z własnego magazynu data lake. Przepływy danych są używane przez usługę Power BI do pozyskiwania danych do magazynów danych. Przepływy danych należy używać zawsze, gdy chcesz ponownie użyć logiki ETL.

Użyj przepływów danych, gdy musisz:

  • Tworzenie przygotowywania danych wielokrotnego użytku i udostępniania dla elementów w usłudze Power BI.

Datamarts to w pełni zarządzana baza danych, która umożliwia przechowywanie i eksplorowanie danych w relacyjnej i w pełni zarządzanej bazie danych Azure SQL DB. Usługa Datamarts zapewnia obsługę języka SQL, projektanta zapytań wizualnych bez kodu, zabezpieczeń na poziomie wiersza i automatycznego generowania modelu semantycznego dla każdego elementu datamart. Możesz wykonywać analizę ad hoc i tworzyć raporty— wszystkie w Internecie.

Użyj funkcji datamarts , gdy musisz:

  • Sortowanie, filtrowanie, wykonywanie prostych agregacji wizualnie lub za pomocą wyrażeń zdefiniowanych w języku SQL
  • W przypadku danych wyjściowych, zestawów, tabel i filtrowanych tabel danych
  • Udostępnianie dostępnych danych za pośrednictwem punktu końcowego SQL
  • Włączanie użytkowników, którzy nie mają dostępu do programu Power BI Desktop

W tym artykule przedstawiono omówienie magazynów danych oraz wiele sposobów ich używania.

Następujące artykuły zawierają więcej informacji na temat magazynów danych i usługi Power BI:

Aby uzyskać więcej informacji na temat przepływów danych i przekształcania danych, zobacz następujące artykuły: