Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
OneLake to jedno, ujednolicone, logiczne jezioro danych dla całej organizacji. Podobnie jak usługa OneDrive, usługa OneLake jest automatycznie dostarczana z każdą dzierżawą usługi Microsoft Fabric i jest zaprojektowana jako jedno miejsce dla wszystkich danych analitycznych.
Usługa OneLake oferuje klientom:
- Jedno jezioro danych dla całej organizacji
- Jedna kopia danych do użycia z wieloma aparatami analitycznymi
Jedno urządzenie Data Lake dla całej organizacji
Przed usługą OneLake wiele organizacji stworzyło wiele jezior dla różnych grup biznesowych, co doprowadziło do dodatkowego obciążenia związanego z zarządzaniem wieloma zasobami. Usługa OneLake usuwa te wyzwania, poprawiając współpracę:
- Każda dzierżawa Fabric automatycznie otrzymuje jeden OneLake
- Nie można utworzyć wielu OneLake ani usunąć OneLake
- Nie potrzeba dodatkowych zasobów do dostarczania lub zarządzania
Prostota ta pomaga Twojej organizacji we współpracy nad jednolitym data lake.
Zarządzane domyślnie z rozproszoną własnością do współpracy
Najwyższym poziomem organizacji i zarządzania danymi Fabric jest tenant. Dane, które trafiają do OneLake, są automatycznie chronione przez zasady obowiązujące na poziomie dzierżawy, zapewniające bezpieczeństwo, zgodność z przepisami oraz zarządzanie danymi.
W ramach dzierżawy współpraca odbywa się w obszarach roboczych. Możesz utworzyć dowolną liczbę obszarów roboczych w celu organizowania danych. Obszary robocze umożliwiają różnym częściom organizacji dystrybucję własności i zasad dostępu. Każdy obszar roboczy jest częścią pojemności powiązanej z określonym regionem i rozliczanym oddzielnie.
W obszarze roboczym tworzysz i uzyskujesz dostęp do wszystkich danych za pośrednictwem elementów danych. Podobnie jak w przypadku przechowywania plików programów Word, Excel i PowerPoint w usłudze OneDrive, Fabric przechowuje domy na jeziorze, magazyny danych i inne zasoby w usłudze OneLake. Każdy typ elementu zapewnia spersonalizowane środowiska dla różnych osób, takich jak środowisko deweloperskie platformy Apache Spark w architekturze lakehouse.
Oparte na otwartych standardach i formatach
Usługa OneLake jest oparta na usłudze Azure Data Lake Storage (ADLS) Gen2 i może obsługiwać dowolny typ pliku, ze strukturą lub bez struktury. Wszystkie elementy danych Fabric, takie jak magazyny danych i magazyny lakehouse, automatycznie przechowują swoje dane w usłudze OneLake w formacie Delta Parquet. Jeśli inżynier danych ładuje dane do magazynu danych typu lakehouse przy użyciu platformy Apache Spark, a następnie deweloper SQL używa języka T-SQL do ładowania danych w pełni transakcyjnego magazynu danych, oba działania przyczyniają się do tego samego jeziora danych. Usługa OneLake przechowuje wszystkie dane tabelaryczne w formacie Delta Parquet.
Usługa OneLake obsługuje te same interfejsy API i zestawy SDK usługi ADLS Gen2, które mają być zgodne z istniejącymi aplikacjami usługi ADLS Gen2, w tym z usługą Azure Databricks. Dane w usłudze OneLake można traktować tak, jakby było to jedno duże konto magazynowe ADLS dla całej organizacji. Każdy obszar roboczy jest pokazywany jako kontener na tym koncie magazynowym, a różne elementy danych są pokazywane jako foldery w tych kontenerach.
Aby uzyskać więcej informacji na temat interfejsów API i punktów końcowych, zobacz OneLake access and APIs (Dostęp do usługi OneLake i interfejsy API). Przykłady integracji usługi OneLake z platformą Azure można znaleźć w artykułach Azure Synapse Analytics, Azure Storage Explorer, Azure Databricks i Azure HDInsight .
Eksplorator plików oneLake dla systemu Windows
Dane usługi OneLake z systemu Windows można eksplorować przy użyciu Eksploratora plików OneLake dla systemu Windows. Możesz nawigować po wszystkich obszarach roboczych i elementach danych, łatwo przekazywać, pobierać lub modyfikować pliki tak jak w pakiecie Office. Eksplorator plików OneLake upraszcza pracę z jeziorami danych, pozwalając nawet osobom nietechnicznym w firmach na ich użycie.
Aby uzyskać więcej informacji, zobacz Eksplorator plików OneLake.
Jedna kopia danych
Usługa OneLake ma na celu zapewnienie możliwie największej wartości z pojedynczej kopii danych bez przenoszenia lub duplikowania danych. Nie musisz kopiować danych tylko po to, aby używać ich z innym silnikiem lub analizować dane z wielu źródeł.
Skróty łączą dane między domenami bez przenoszenia danych
Skrót to odwołanie do danych przechowywanych w innych lokalizacjach plików. Te lokalizacje plików mogą znajdować się w tym samym obszarze roboczym lub w różnych obszarach roboczych, w usłudze OneLake lub poza nią, na przykład w ADLS, S3 lub Dataverse. Niezależnie od lokalizacji skróty sprawiają, że pliki i foldery wyglądają tak, jakby były przechowywane lokalnie.
Skróty umożliwiają organizacji udostępnianie danych użytkownikom i aplikacjom bez konieczności niepotrzebnego przenoszenia i duplikowania informacji. Gdy zespoły działają niezależnie w oddzielnych obszarach roboczych, skróty umożliwiają łączenie danych między różnymi grupami biznesowymi i domenami w produkt danych wirtualnych, aby dopasować je do konkretnych potrzeb użytkownika.
Aby uzyskać więcej informacji na temat używania skrótów, zobacz Skróty OneLake (OneLake shortcuts).
Łączenie danych z wieloma aparatami analitycznymi
Dane są często zoptymalizowane pod kątem pojedynczego silnika, co utrudnia użycie tych samych danych w wielu aplikacjach. W ramach usługi Fabric różne silniki analityczne (T-SQL, Apache Spark, Analysis Services i inne) przechowują dane w otwartym formacie Delta Parquet, aby umożliwić wykorzystanie tych samych danych w wielu silnikach.
Nie musisz kopiować danych tylko po to, aby używać ich z innym silnikiem lub czuć się zmuszonym do korzystania z określonego silnika, ponieważ tam znajdują się dane. Załóżmy na przykład, że zespół inżynierów SQL tworzy w pełni transakcyjny magazyn danych. Mogą używać aparatu T-SQL i wszystkich możliwości języka T-SQL do tworzenia tabel, przekształcania danych i ładowania danych do tabel. Jeśli analityk danych chce korzystać z tych danych, nie musi przechodzić przez specjalny sterownik Spark/SQL. Usługa OneLake przechowuje wszystkie dane w formacie Delta Parquet. Specjalista ds. danych może korzystać z pełnej mocy silnika Spark i jego bibliotek open source bezpośrednio na danych.
Użytkownicy biznesowi mogą tworzyć raporty Power BI bezpośrednio na OneLake, używając trybu Direct Lake w silniku Analysis Services. Aparat usług Analysis Services obsługuje modele semantyczne usługi Power BI i zawsze oferował dwa tryby uzyskiwania dostępu do danych: importowanie i bezpośrednie wykonywanie zapytań. Ten trzeci tryb, tryb Direct Lake, daje użytkownikom całą szybkość importowania bez konieczności kopiowania danych, łącząc najlepsze wyniki importu i zapytania bezpośredniego. Aby uzyskać więcej informacji, zobacz Direct Lake.
Dalsze kroki
Chcesz rozpocząć korzystanie z usługi OneLake? Oto jak rozpocząć pracę: