Úvod do úložiště clusteru

Důležité

Tato funkce je aktuálně dostupná jako ukázková verze. Doplňkové podmínky použití pro Microsoft Azure Preview obsahují další právní podmínky, které se vztahují na funkce Azure, které jsou v beta verzi, ve verzi Preview nebo ještě nejsou vydány v obecné dostupnosti. Informace o této konkrétní verzi Preview najdete v tématu Azure HDInsight o službě AKS ve verzi Preview. Pokud máte dotazy nebo návrhy funkcí, odešlete prosím žádost na AskHDInsight s podrobnostmi a sledujte nás o dalších aktualizacích v komunitě Azure HDInsight.

Azure HDInsight v AKS se může bezproblémově integrovat se službou Azure Storage, což je řešení úložiště pro obecné účely, které dobře funguje s mnoha dalšími službami Azure. Azure Data Lake Storage Gen2 (ADLS Gen2) je výchozí systém souborů pro clustery.

Účet úložiště se dá použít jako výchozí umístění pro data, protokoly clusteru a další výstupy, které se generují během operace clusteru. Může to být také výchozí úložiště pro katalog Hive, které závisí na typu clusteru.

Další informace najdete v tématu Úvod do Azure Data Lake Storage Gen2.

Spravované identity pro zabezpečený přístup k souborům

Azure HDInsight v AKS používá spravované identity (MSI) k zabezpečení přístupu ke souborům v Azure Data Lake Storage Gen2. Spravovaná identita je funkce ID Microsoft Entra, která poskytuje službám Azure sadu automaticky spravovaných přihlašovacích údajů. Tyto přihlašovací údaje se dají použít k ověření v jakékoli službě, která podporuje ověřování active directory. Spravované identity navíc nevyžadují ukládání přihlašovacích údajů do kódu nebo konfiguračních souborů.

Jakmile v Azure HDInsight v AKS vyberete spravovanou identitu a úložiště během vytváření clusteru, může spravovaná identita bezproblémově pracovat s úložištěm pro správu dat za předpokladu , že je role Vlastník dat objektu blob služby Storage přiřazená uživateli.

Následující tabulka popisuje podporované možnosti úložiště pro Azure HDInsight v AKS (Public Preview):

Typ clusteru Podporované úložiště Connection Role v úložišti
Trino, Apache Flink a Apache Spark ADLS Gen2 Spravovaná identita přiřazená uživatelem clusteru (MSI) Msi přiřazená uživatelem musí mít v účtu úložiště roli Vlastník dat objektů blob úložiště.

Poznámka:

Pokud chcete sdílet účet úložiště napříč několika clustery, stačí přiřadit odpovídající uživatelem přiřazené MSI objektu blob úložiště v účtu sdíleného úložiště. Zjistěte, jak přiřadit roli.

Potom můžete použít úplnou cestu k úložišti abfs:// pro přístup k datům prostřednictvím vašich aplikací.

Další informace najdete v tématu Spravované identity pro prostředky Azure.
Zjistěte, jak vytvořit účet ADLS Gen2.

Architektura úložiště Azure HDInsight v AKS

Následující diagram poskytuje abstraktní zobrazení služby Azure HDInsight v architektuře AKS služby Azure Storage.

Snímek obrazovky znázorňující architekturu úložiště

Správa úložiště

Azure HDInsight v AKS v současné době nepodporuje účty úložiště s povoleným obnovitelným odstraněním, ujistěte se, že pro svůj účet úložiště zakážete obnovitelné odstranění.

Snímek obrazovky s uživatelským rozhraním portálu pro obnovitelné odstranění