Připojení do Microsoft OneLake

Microsoft OneLake poskytuje otevřený přístup ke všem položkám infrastruktury prostřednictvím existujících rozhraní API a sad SDK Azure Data Lake Storage (ADLS) Gen2. K datům v OneLake můžete přistupovat prostřednictvím libovolného rozhraní API, sady SDK nebo nástroje kompatibilního s ADLS Gen2, a to jenom pomocí identifikátoru URI OneLake. Data můžete nahrát do jezera prostřednictvím Průzkumník služby Azure Storage nebo číst rozdílovou tabulku prostřednictvím zástupce z Azure Databricks.

Vzhledem k tomu, že OneLake je software jako služba (SaaS), některé operace, jako je správa oprávnění nebo aktualizace položek, se musí provádět prostřednictvím prostředí Fabric místo rozhraní API ADLS Gen2. Úplný seznam změn těchto rozhraní API najdete v tématu Parita rozhraní ONELake API.

Syntaxe identifikátoru URI

Vzhledem k tomu, že OneLake existuje v celém tenantovi Microsoft Fabric, můžete v tenantovi odkazovat na cokoli podle jeho pracovního prostoru, položky a cesty:

https://onelake.dfs.fabric.microsoft.com/<workspace>/<item>.<itemtype>/<path>/<fileName>

Poznámka:

Protože můžete opakovaně používat názvy položek napříč více typy položek, je nutné zadat typ položky v rozšíření. Například .lakehouse pro jezerní dům a .datawarehouse sklad.

OneLake také podporuje odkazování na pracovní prostory a položky s globálně jedinečnými identifikátory (GUID). OneLake přiřazuje identifikátory GUID a identifikátory GUID se nemění, ani když se změní název pracovního prostoru nebo položky. Přidružený identifikátor GUID pro váš pracovní prostor nebo položku najdete v adrese URL na portálu Fabric. Pro pracovní prostor i položku musíte použít identifikátory GUID a nepotřebujete typ položky.

https://onelake.dfs.fabric.microsoft.com/<workspaceGUID>/<itemGUID>/<path>/<fileName>

Při zavádění nástroje pro použití přes OneLake místo ADLS Gen2 použijte následující mapování:

  • Název účtu je vždy onelake.
  • Název kontejneru je název vašeho pracovního prostoru.
  • Cesta k datům začíná u položky. Například: /mylakehouse.lakehouse/Files/.

OneLake také podporuje ovladač systému souborů Azure Blob (ABFS) pro zajištění větší kompatibility s ADLS Gen2 a Azure Blob Storage. Ovladač ABFS používá vlastní identifikátor abfs schématu a jiný formát identifikátoru URI k adresám souborů a adresářů v účtech ADLS Gen2. Pokud chcete tento formát identifikátoru URI použít přes OneLake, prohoďte pracovní prostor pro systém souborů a zahrňte položku a typ položky.

abfs[s]://<workspace>@onelake.dfs.fabric.microsoft.com/<item>.<itemtype>/<path>/<fileName>

Autorizace

Rozhraní ONELake API můžete ověřit pomocí ID Microsoft Entra předáním autorizační hlavičky. Pokud nástroj podporuje přihlášení k účtu Azure, abyste povolili předávání tokenů, můžete vybrat libovolné předplatné. OneLake vyžaduje pouze token uživatele a nezajímá vaše předplatné Azure.

Při přímém volání OneLake přes rozhraní API DFS můžete ověřit nosný token pro váš účet Microsoft Entra. Další informace o vyžádání a správě nosných tokenů pro vaši organizaci najdete v knihovně Microsoft Authentication Library.

Pro rychlé ad hoc testování OneLake pomocí přímých volání rozhraní API tady je jednoduchý příklad použití PowerShellu pro přihlášení k účtu Azure, načtení tokenu s vymezeným úložištěm a jeho zkopírování do schránky pro snadné použití jinde. Další informace o načítání přístupových tokenů pomocí PowerShellu najdete v tématu Get-AzAccessToken.

Poznámka:

OneLake podporuje pouze tokeny v cílové skupině Storage . V následujícím příkladu nastavíme cílovou skupinu prostřednictvím parametru ResourceTypeName .

az login --allow-no-subscriptions
$testToken = Get-AzAccessToken -ResourceTypeName Storage
$testToken.Token | Set-Clipboard

Umístění dat

OneLake v současné době nezaručuje rezidenci dat v konkrétní oblasti při použití globálního koncového bodu (https://onelake.dfs.fabric.microsoft.com). Když se dotazujete na data v jiné oblasti než v oblasti vašeho pracovního prostoru, je možné, že během procesu řešení koncového bodu můžou data opustit vaši oblast. Pokud máte obavy o rezidenci dat, pomocí správného regionálního koncového bodu pro váš pracovní prostor zajistíte, že vaše data zůstanou v aktuální oblasti a nepřekračují žádné hranice oblastí. Správný regionální koncový bod můžete zjistit tak, že zkontrolujete oblast kapacity, ke které je pracovní prostor připojený.

Všechny regionální koncové body OneLake mají stejný formát: https://<region>-onelake.dfs.fabric.microsoft.com. Například pracovní prostor připojený ke kapacitě v oblasti USA – západ 2 by byl přístupný prostřednictvím regionálního koncového bodu https://westus-onelake.dfs.fabric.microsoft.com.

Běžné problémy

Pokud nástroj nebo balíček kompatibilní s ADLS Gen2 nefunguje přes OneLake, nejběžnějším problémem je ověření adresy URL. Protože OneLake používá jiný koncový bod (dfs.fabric.microsoft.com) než ADLS Gen2 (dfs.core.windows.net), některé nástroje nerozpozná koncový bod OneLake a blokují ho. Některé nástroje umožňují používat vlastní koncové body (například PowerShell). V opačném případě je to často jednoduchá oprava přidání koncového bodu OneLake jako podporovaného koncového bodu. Pokud najdete problém s ověřením adresy URL nebo máte jakékoli jiné problémy s připojením k OneLake, dejte nám vědět.

Ukázky

Vytvořit soubor

Požádat DÁT https://onelake.dfs.fabric.microsoft.com/{workspace}/{item}.{itemtype}/Files/sample?resource=file
Záhlaví Authorization: Bearer <userAADToken>
Odpověď respondenta ResponseCode:201 Created
Záhlaví:
x-ms-version : 2021-06-08
x-ms-request-id : 272526c7-0995-4cc4-b04a-8ea3477bc67b
x-ms-content-crc64 : OAJ6r0dQWP0=
x-ms-request-server-encrypted : true
ETag : 0x8DA58EE365
Text: