Baza danych typu lake

Baza danych lake w usłudze Azure Synapse Analytics umożliwia klientom łączenie projektu bazy danych, metadanych dotyczących przechowywanych danych oraz możliwość opisania sposobu i miejsca przechowywania danych. Baza danych Lake rozwiązuje wyzwanie dzisiejszych magazynów danych, w których trudno zrozumieć, w jaki sposób dane są ustrukturyzowane.

Omówienie bazy danych lake

Projektant bazy danych

Nowy projektant bazy danych w Synapse Studio umożliwia utworzenie modelu danych dla bazy danych typu lake i dodanie do niego dodatkowych informacji. Każdą jednostkę i atrybut można opisać, aby uzyskać więcej informacji na temat modelu, który zawiera nie tylko jednostki, ale także relacje. W szczególności niezdolność do modelowania relacji była wyzwaniem dla interakcji z usługą Data Lake. To wyzwanie zostało teraz rozwiązane za pomocą zintegrowanego projektanta, który zapewnia możliwości, które były dostępne w bazach danych, ale nie w jeziorze. Ponadto możliwość dodawania opisów i możliwych wartości demonstracyjnych do modelu umożliwia osobom, które wchodzą z nią w interakcje w przyszłości, aby uzyskać informacje, w których potrzebują, aby lepiej zrozumieć dane.

Magazyn danych

Bazy danych typu Lake używają usługi Data Lake na koncie usługi Azure Storage do przechowywania danych bazy danych. Dane mogą być przechowywane w formacie Parquet, Delta lub CSV, a różne ustawienia mogą służyć do optymalizacji magazynu. Każda baza danych typu lake używa połączonej usługi do definiowania lokalizacji folderu danych głównych. Dla każdej jednostki oddzielne foldery są domyślnie tworzone w tym folderze bazy danych w usłudze Data Lake. Domyślnie wszystkie tabele w bazie danych typu lake używają tego samego formatu, ale formaty i lokalizacja danych można zmienić na jednostkę, jeśli jest to wymagane.

Uwaga

Publikowanie bazy danych typu lake nie tworzy żadnych podstawowych struktur ani schematów wymaganych do wykonywania zapytań dotyczących danych na platformie Spark lub SQL. Po opublikowaniu załaduj dane do bazy danych lake przy użyciu potoków , aby rozpocząć wykonywanie zapytań.

Obecnie obsługa formatu delta dla baz danych lake nie jest obsługiwana w Synapse Studio.

Synchronizacja obiektów bazy danych typu lake między magazynem a usługą Synapse jest jednokierunkowa. Pamiętaj, aby wykonać wszelkie modyfikacje tworzenia lub schematu obiektów bazy danych typu lake przy użyciu projektanta bazy danych w Synapse Studio. Jeśli zamiast tego wprowadzisz takie zmiany z platformy Spark lub bezpośrednio w magazynie, definicje baz danych typu lake staną się nieaktualne. W takim przypadku w projektancie bazy danych mogą zostać wyświetlone stare definicje bazy danych lake. Konieczne będzie replikowanie i publikowanie takich zmian w projektancie bazy danych w celu przywrócenia synchronizacji baz danych typu lake.

Obliczenia bazy danych

Baza danych lake jest uwidaczniana w bezserwerowej puli SQL usługi Synapse SQL i platformie Apache Spark, zapewniając użytkownikom możliwość oddzielenia magazynu od zasobów obliczeniowych. Metadane skojarzone z bazą danych lake ułatwiają korzystanie z różnych aparatów obliczeniowych nie tylko w celu zapewnienia zintegrowanego środowiska, ale także używania dodatkowych informacji (na przykład relacji), które nie były pierwotnie obsługiwane w usłudze Data Lake.

Następne kroki

Kontynuuj eksplorowanie możliwości projektanta bazy danych, korzystając z poniższych linków.