Azure DataLake Storage Gen2 を確認する

完了

Azure Data Lake Store (Gen1) は、分析データ レイク用の階層データを格納するための、独立したサービスです。これは多くの場合、ファイルに保存された構造化データ、半構造化データ、および非構造化データを操作する、いわゆる "ビッグデータ" 分析ソリューションによって使用されます。 Azure Data Lake Storage Gen2 は、このサービスの新しいバージョンで、Azure Storage に統合されています。BLOB ストレージのスケーラビリティとストレージ層のコスト制御を活用しつつ、階層ファイル システムの機能や、Azure Data Lake Store の主要な分析システムとの互換性も確保できます。

An Azure blob storage container with a hierarchical namespace

Hadoop in Azure HDInsight、Azure Databricks、Azure Synapse Analytics などのシステムでは、Azure Data Lake Store Gen2 でホストされた分散ファイル システムをマウントし、それを使って膨大な量のデータを処理することができます。

Azure Data Lake Store Gen2 ファイル システムを作成するには、Azure Storage アカウントにある "階層型名前空間" のオプションを有効にする必要があります。 この操作は、最初にストレージ アカウントを作成するときに行うことができます。また、既存の Azure Storage アカウントをアップグレードして、Data Lake Gen2 をサポートすることもできます。 ただし、アップグレードは一方向のプロセスであることに注意してください。 BLOB ストレージ用の階層型名前空間をサポートするため、ストレージ アカウントをアップグレードすると、その後にフラット型名前空間に戻すことはできません。