Vytvoření externího umístění pro připojení cloudového úložiště k Azure Databricks
Tento článek popisuje, jak nakonfigurovat externí umístění v katalogu Unity pro připojení cloudového úložiště k Azure Databricks.
Externí umístění přidružují přihlašovací údaje k úložišti katalogu Unity ke kontejnerům cloudového úložiště objektů. Externí umístění slouží k definování spravovaných umístění úložiště pro katalogy a schémata a k definování umístění pro externí tabulky a externí svazky.
Můžete vytvořit externí umístění, které odkazuje na úložiště v kontejneru úložiště Azure Data Lake Storage Gen2 nebo kontejneru Cloudflare R2.
Externí umístění můžete vytvořit pomocí Průzkumníka katalogu, rozhraní příkazového řádku Databricks, příkazů SQL v poznámkovém bloku nebo dotazu SQL Databricks nebo Terraformu.
Poznámka:
Při definování svazku se přístup ke cloudovým identifikátorům URI k datům v cestě ke svazku řídí oprávněními svazku.
Než začnete
Požadavky:
Před vytvořením objektu externího umístění v Azure Databricks musíte vytvořit kontejner úložiště Azure Data Lake Storage Gen2 nebo kontejner Cloudflare R2, který chcete použít jako externí umístění.
Účty úložiště Azure Data Lake Storage Gen2, které používáte jako externí umístění, musí mít hierarchický obor názvů.
Musíte mít přihlašovací údaje úložiště definované v Azure Databricks, které poskytují přístup k cestě k umístění cloudového úložiště. Viz Vytvoření přihlašovacích údajů úložiště pro připojení k Azure Data Lake Storage Gen2 a vytvoření přihlašovacích údajů úložiště pro připojení ke Cloudflare R2.
Požadavky na oprávnění:
- Musíte mít
CREATE EXTERNAL LOCATION
oprávnění k metastoru i přihlašovacím údajům úložiště, na které odkazuje externí umístění. Správci metastoru majíCREATE EXTERNAL LOCATION
ve výchozím nastavení úložiště metastoru.
Vytvoření externího umístění pomocí Průzkumníka katalogu
Externí umístění můžete vytvořit ručně pomocí Průzkumníka katalogu.
Oprávnění a požadavky: Podívejte se, než začnete.
Vytvoření externího umístění:
Přihlaste se k pracovnímu prostoru připojenému k metastoru.
Na bočním panelu klikněte na Katalog.
Klikněte na tlačítko + Přidat a vyberte Přidat externí umístění.
Zadejte název externího umístění.
Volitelně zkopírujte cestu kontejneru z existujícího přípojného bodu (pouze kontejnery Azure Data Lake Storage Gen2).
Pokud nekopírujete z existujícího přípojného bodu, pomocí pole URL zadejte cestu kontejneru úložiště nebo kontejneru R2, kterou chcete použít jako externí umístění.
Například
abfss://my-container-name@my-storage-account.dfs.core.windows.net/<path>
nebor2://my-bucket@my-account-id.r2.cloudflarestorage.com/<path>
.Vyberte přihlašovací údaje úložiště, které uděluje přístup k externímu umístění.
(Volitelné) Pokud chcete, aby uživatelé měli přístup jen pro čtení k externímu umístění, klikněte na Upřesnit možnosti a vyberte Jen pro čtení. Další informace najdete v tématu Označení externího umístění jako jen pro čtení.
Klikněte na Vytvořit.
Udělte oprávnění k používání externího umístění.
Aby mohl někdo používat externí umístění, musíte udělit oprávnění:
- Pokud chcete použít externí umístění k přidání spravovaného umístění úložiště do metastoru, katalogu nebo schématu
CREATE MANAGED LOCATION
, udělte oprávnění. - Chcete-li vytvořit externí tabulky nebo svazky, udělte
CREATE EXTERNAL TABLE
neboCREATE EXTERNAL VOLUME
.
Použití Průzkumníka katalogu k udělení oprávnění:
- Kliknutím na název externího umístění otevřete podokno podrobností.
- Na kartě Oprávnění klikněte na Udělit.
- V dialogovém okně Udělit
<external location>
vyberte uživatele, skupiny nebo instanční objekty v poli Objekty zabezpečení a vyberte oprávnění, která chcete udělit. - Klikněte na Udělit.
- Pokud chcete použít externí umístění k přidání spravovaného umístění úložiště do metastoru, katalogu nebo schématu
Vytvoření externího umístění pomocí SQL
Pokud chcete vytvořit externí umístění pomocí SQL, spusťte v poznámkovém bloku nebo editoru dotazů SQL následující příkaz. Nahraďte zástupné hodnoty.
Oprávnění a požadavky: Podívejte se, než začnete.
<location-name>
: Název externího umístění. Pokudlocation_name
obsahuje speciální znaky, jako jsou spojovníky (-
), musí být obklopené zpětnými znaky (` `
). Viz názvy.<bucket-path>
: Cesta ve vašem cloudovém tenantovi, ke kterému tato externí umístění uděluje přístup. Napříkladabfss://my-container-name@my-storage-account.dfs.core.windows.net/<path>
nebor2://my-bucket@my-account-id.r2.cloudflarestorage.com/<path>
.<storage-credential-name>
: Název přihlašovacích údajů úložiště, které autorizuje čtení a zápis do kontejneru úložiště nebo cesty kontejneru. Pokud název přihlašovacích údajů úložiště obsahuje speciální znaky, jako jsou spojovníky (-
), musí být obklopené zpětnými znaky (` `
).
CREATE EXTERNAL LOCATION [IF NOT EXISTS] `<location-name>`
URL '<bucket-path>'
WITH ([STORAGE] CREDENTIAL `<storage-credential-name>`)
[COMMENT '<comment-string>'];
Další kroky
- Udělte ostatním uživatelům oprávnění k používání externích umístění. Viz Správa externích umístění.
- Definujte spravovaná umístění úložiště pomocí externích umístění. Viz Určení spravovaného umístění úložiště v katalogu Unity.
- Definujte externí tabulky pomocí externích umístění. Viz Vytvoření externí tabulky.
- Definujte externí svazky pomocí externích umístění. Viz Vytvoření svazků a práce se svazky.
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro