Udostępnij przez


OneLake — usługa OneDrive dla danych

OneLake to jedno, ujednolicone, logiczne jezioro danych dla całej organizacji. Podobnie jak usługa OneDrive, usługa OneLake jest automatycznie dostarczana z każdą dzierżawą usługi Microsoft Fabric i jest zaprojektowana jako jedno miejsce dla wszystkich danych analitycznych.

Usługa OneLake oferuje klientom:

  • Jedno jezioro danych dla całej organizacji
  • Jedna kopia danych do użycia z wieloma aparatami analitycznymi

Jedno urządzenie Data Lake dla całej organizacji

Przed usługą OneLake wiele organizacji stworzyło wiele jezior dla różnych grup biznesowych, co doprowadziło do dodatkowego obciążenia związanego z zarządzaniem wieloma zasobami. Usługa OneLake usuwa te wyzwania, poprawiając współpracę:

  • Każda dzierżawa Fabric automatycznie otrzymuje jeden OneLake
  • Nie można utworzyć wielu OneLake ani usunąć OneLake
  • Nie potrzeba dodatkowych zasobów do dostarczania lub zarządzania

Prostota ta pomaga Twojej organizacji we współpracy nad jednolitym data lake.

Zarządzane domyślnie z rozproszoną własnością do współpracy

Najwyższym poziomem organizacji i zarządzania danymi Fabric jest tenant. Dane, które trafiają do OneLake, są automatycznie chronione przez zasady obowiązujące na poziomie dzierżawy, zapewniające bezpieczeństwo, zgodność z przepisami oraz zarządzanie danymi.

W ramach dzierżawy współpraca odbywa się w obszarach roboczych. Możesz utworzyć dowolną liczbę obszarów roboczych w celu organizowania danych. Obszary robocze umożliwiają różnym częściom organizacji dystrybucję własności i zasad dostępu. Każdy obszar roboczy jest częścią pojemności powiązanej z określonym regionem i rozliczanym oddzielnie.

Diagram przedstawiający funkcję i strukturę elementu OneLake.

W obszarze roboczym tworzysz i uzyskujesz dostęp do wszystkich danych za pośrednictwem elementów danych. Podobnie jak w przypadku przechowywania plików programów Word, Excel i PowerPoint w usłudze OneDrive, Fabric przechowuje domy na jeziorze, magazyny danych i inne zasoby w usłudze OneLake. Każdy typ elementu zapewnia spersonalizowane środowiska dla różnych osób, takich jak środowisko deweloperskie platformy Apache Spark w architekturze lakehouse.

Oparte na otwartych standardach i formatach

Usługa OneLake jest oparta na usłudze Azure Data Lake Storage (ADLS) Gen2 i może obsługiwać dowolny typ pliku, ze strukturą lub bez struktury. Wszystkie elementy danych Fabric, takie jak magazyny danych i magazyny lakehouse, automatycznie przechowują swoje dane w usłudze OneLake w formacie Delta Parquet. Jeśli inżynier danych ładuje dane do magazynu danych typu lakehouse przy użyciu platformy Apache Spark, a następnie deweloper SQL używa języka T-SQL do ładowania danych w pełni transakcyjnego magazynu danych, oba działania przyczyniają się do tego samego jeziora danych. Usługa OneLake przechowuje wszystkie dane tabelaryczne w formacie Delta Parquet.

Usługa OneLake obsługuje te same interfejsy API i zestawy SDK usługi ADLS Gen2, które mają być zgodne z istniejącymi aplikacjami usługi ADLS Gen2, w tym z usługą Azure Databricks. Dane w usłudze OneLake można traktować tak, jakby było to jedno duże konto magazynowe ADLS dla całej organizacji. Każdy obszar roboczy jest pokazywany jako kontener na tym koncie magazynowym, a różne elementy danych są pokazywane jako foldery w tych kontenerach.

Diagram przedstawiający sposób uzyskiwania dostępu do danych usługi OneLake za pomocą interfejsów API i zestawów SDK.

Aby uzyskać więcej informacji na temat interfejsów API i punktów końcowych, zobacz OneLake access and APIs (Dostęp do usługi OneLake i interfejsy API). Przykłady integracji usługi OneLake z platformą Azure można znaleźć w artykułach Azure Synapse Analytics, Azure Storage Explorer, Azure Databricks i Azure HDInsight .

Eksplorator plików oneLake dla systemu Windows

Dane usługi OneLake z systemu Windows można eksplorować przy użyciu Eksploratora plików OneLake dla systemu Windows. Możesz nawigować po wszystkich obszarach roboczych i elementach danych, łatwo przekazywać, pobierać lub modyfikować pliki tak jak w pakiecie Office. Eksplorator plików OneLake upraszcza pracę z jeziorami danych, pozwalając nawet osobom nietechnicznym w firmach na ich użycie.

Aby uzyskać więcej informacji, zobacz Eksplorator plików OneLake.

Jedna kopia danych

Usługa OneLake ma na celu zapewnienie możliwie największej wartości z pojedynczej kopii danych bez przenoszenia lub duplikowania danych. Nie musisz kopiować danych tylko po to, aby używać ich z innym silnikiem lub analizować dane z wielu źródeł.

Skróty łączą dane między domenami bez przenoszenia danych

Skrót to odwołanie do danych przechowywanych w innych lokalizacjach plików. Te lokalizacje plików mogą znajdować się w tym samym obszarze roboczym lub w różnych obszarach roboczych, w usłudze OneLake lub poza nią, na przykład w ADLS, S3 lub Dataverse. Niezależnie od lokalizacji skróty sprawiają, że pliki i foldery wyglądają tak, jakby były przechowywane lokalnie.

Skróty umożliwiają organizacji udostępnianie danych użytkownikom i aplikacjom bez konieczności niepotrzebnego przenoszenia i duplikowania informacji. Gdy zespoły działają niezależnie w oddzielnych obszarach roboczych, skróty umożliwiają łączenie danych między różnymi grupami biznesowymi i domenami w produkt danych wirtualnych, aby dopasować je do konkretnych potrzeb użytkownika.

Diagram przedstawiający sposób, w jaki skróty łączą dane między obszarami roboczymi i elementami.

Aby uzyskać więcej informacji na temat używania skrótów, zobacz Skróty OneLake (OneLake shortcuts).

Łączenie danych z wieloma aparatami analitycznymi

Dane są często zoptymalizowane pod kątem pojedynczego silnika, co utrudnia użycie tych samych danych w wielu aplikacjach. W ramach usługi Fabric różne silniki analityczne (T-SQL, Apache Spark, Analysis Services i inne) przechowują dane w otwartym formacie Delta Parquet, aby umożliwić wykorzystanie tych samych danych w wielu silnikach.

Nie musisz kopiować danych tylko po to, aby używać ich z innym silnikiem lub czuć się zmuszonym do korzystania z określonego silnika, ponieważ tam znajdują się dane. Załóżmy na przykład, że zespół inżynierów SQL tworzy w pełni transakcyjny magazyn danych. Mogą używać aparatu T-SQL i wszystkich możliwości języka T-SQL do tworzenia tabel, przekształcania danych i ładowania danych do tabel. Jeśli analityk danych chce korzystać z tych danych, nie musi przechodzić przez specjalny sterownik Spark/SQL. Usługa OneLake przechowuje wszystkie dane w formacie Delta Parquet. Specjalista ds. danych może korzystać z pełnej mocy silnika Spark i jego bibliotek open source bezpośrednio na danych.

Użytkownicy biznesowi mogą tworzyć raporty Power BI bezpośrednio na OneLake, używając trybu Direct Lake w silniku Analysis Services. Aparat usług Analysis Services obsługuje modele semantyczne usługi Power BI i zawsze oferował dwa tryby uzyskiwania dostępu do danych: importowanie i bezpośrednie wykonywanie zapytań. Ten trzeci tryb, tryb Direct Lake, daje użytkownikom całą szybkość importowania bez konieczności kopiowania danych, łącząc najlepsze wyniki importu i zapytania bezpośredniego. Aby uzyskać więcej informacji, zobacz Direct Lake.

Przykładowy diagram przedstawiający ładowanie danych przy użyciu platformy Spark, wykonywanie zapytań przy użyciu języka T-SQL i wyświetlanie danych w raporcie usługi Power BI.

Dalsze kroki

Chcesz rozpocząć korzystanie z usługi OneLake? Oto jak rozpocząć pracę: