Szybki start: tworzenie nowej bazy danych lake korzystającej z szablonów baz danych

Ten przewodnik Szybki start zawiera kompletny przykładowy scenariusz dotyczący sposobu stosowania szablonów baz danych do tworzenia bazy danych typu lake, dopasowywania danych do nowego modelu i używania zintegrowanego środowiska do analizowania danych.

Wymagania wstępne

  • Do eksplorowania szablonu bazy danych lake z galerii wymagane są co najmniej uprawnienia roli użytkownika usługi Synapse .
  • Uprawnienia administratora usługi Synapse lub współautora usługi Synapse są wymagane w obszarze roboczym Azure Synapse do tworzenia bazy danych lake.
  • Uprawnienia współautora danych obiektu blob usługi Storage są wymagane w usłudze Data Lake podczas korzystania z opcji tworzenie tabeli z usługi Data Lake.

Tworzenie bazy danych lake na podstawie szablonów baz danych

Użyj nowych funkcji szablonów baz danych, aby utworzyć bazę danych typu lake, której można użyć do skonfigurowania modelu danych dla bazy danych.

W naszym scenariuszu użyjemy szablonu Retail bazy danych i wybierzemy następujące jednostki:

  • RetailProduct — produkt to wszystko, co może być oferowane na rynku, który może zaspokoić potrzebę potencjalnych klientów. Ten produkt jest sumą wszystkich atrybutów fizycznych, psychologicznych, symbolicznych i usług skojarzonych z nim.
  • Transakcja — najniższy poziom pracy wykonywalnej lub aktywności klienta. Transakcja składa się z co najmniej jednego zdarzenia dyskretnego.
  • TransactionLineItem — składniki transakcji podzielone na wartość Product (Produkt) i Quantity (Ilość), po jednym na element liniowy.
  • Strona — strona jest osobą, organizacją, jednostką prawną, organizacją społeczną lub jednostką biznesową, która interesuje firmę.
  • Klient — klient jest osobą lub osobą prawną, która zakupiła produkt lub usługę.
  • Kanał — kanał jest środkiem, za pomocą którego produkty lub usługi są sprzedawane i/lub dystrybuowane.

Najprostszym sposobem znajdowania jednostek jest użycie pola wyszukiwania powyżej różnych obszarów biznesowych zawierających tabele.

Zrzut ekranu przedstawiający przykładowy szablon bazy danych retail.

Konfigurowanie bazy danych lake

Po utworzeniu bazy danych upewnij się, że konto magazynu i ścieżka pliku jest ustawiona na lokalizację, w której chcesz przechowywać dane. Ścieżka zostanie domyślnie ustawiona na podstawowe konto magazynu w usłudze Azure Synapse Analytics, ale może zostać zmieniona na twoje potrzeby.

Zrzut ekranu przedstawiający właściwości pojedynczej jednostki w szablonie bazy danych retail.

Aby zapisać układ i udostępnić go w Azure Synapse, opublikuj wszystkie zmiany. Ten krok kończy konfigurację bazy danych typu lake i udostępnia ją wszystkim składnikom w usłudze Azure Synapse Analytics i poza nią.

Pozyskiwanie danych do bazy danych lake

Aby pozyskać dane do bazy danych typu lake, możesz wykonywać potoki z mapowaniami przepływu wolnych przepływów kodu, które mają łącznik bazy danych obszaru roboczego , aby załadować dane bezpośrednio do tabeli bazy danych. Możesz również użyć interaktywnych notesów spark do pozyskiwania danych do tabel bazy danych lake:

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

Wykonywanie zapytań na danych

Po utworzeniu bazy danych lake istnieją różne sposoby wykonywania zapytań dotyczących danych. Obecnie bazy danych SQL w bezserwerowych pulach SQL są obsługiwane i automatycznie rozumieją nowo utworzony format bazy danych lake.

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

Innym sposobem uzyskiwania dostępu do danych w Azure Synapse jest otwarcie nowego notesu spark i użycie zintegrowanego środowiska:

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

Trenowanie modeli uczenia maszynowego

Możesz użyć bazy danych lake do trenowania modeli uczenia maszynowego i oceniania danych. Aby uzyskać więcej informacji na temat trenowania modeli uczenia maszynowego

Następne kroki

Kontynuuj eksplorowanie możliwości projektanta bazy danych, korzystając z poniższych linków.