Opslagopties vergelijken voor gebruik met Azure HDInsight-clusters
U kunt kiezen tussen een aantal verschillende Azure Storage-services bij het maken van HDInsight-clusters:
Dit artikel bevat een overzicht van deze opslagtypen en hun unieke functies.
Opslagtypen en -functies
De volgende tabel bevat een overzicht van de Azure Storage-services die worden ondersteund met verschillende versies van HDInsight:
Opslagservice | Rekeningtype | Type naamruimte | Ondersteunde services | Ondersteunde prestatielagen | Ondersteunde toegangslagen | HDInsight-versie | Clustertype |
---|---|---|---|---|---|---|---|
Azure Data Lake Storage Gen2 | Algemeen v2 | Hiërarchisch (bestandssysteem) | Blob | Standaard | Dynamisch, statisch en archiefopslag | 3.6+ | Alle behalve Spark 2.1 en 2.2 |
Azure Storage | Algemeen v2 | Object | Blob | Standaard | Dynamisch, statisch en archiefopslag | 3.6+ | Alle |
Azure Storage | Algemeen v1 | Object | Blob | Standaard | N.v.t. | Alle | Alle |
Azure Storage | Blob Storage** | Object | Blok-blob | Standaard | Dynamisch, statisch en archiefopslag | Alle | Alle |
Azure Data Lake Storage Gen1 | N.v.t. | Hiërarchisch (bestandssysteem) | N.v.t. | N.v.t. | N.v.t. | Alleen 3.6 | Alle behalve HBase |
Azure Storage | Blok-blob | Object | Blok-blob | Premium | N.v.t. | 3.6+ | Alleen HBase met versnelde schrijfbewerkingen |
Azure Data Lake Storage Gen2 | Blok-blob | Hiërarchisch (bestandssysteem) | Blok-blob | Premium | N.v.t. | 3.6+ | Alleen HBase met versnelde schrijfbewerkingen |
**Voor HDInsight-clusters kunnen alleen secundaire opslagaccounts van het type BlobStorage zijn en pagina-blob is geen ondersteunde opslagoptie.
Zie overzicht van Azure Storage-accounts voor meer informatie over Azure Storage-accounttypen
Zie Azure Blob Storage: Premium (preview), dynamische, statische en archiefopslaglagen voor meer informatie over Azure Storage-toegangslagen
U kunt clusters maken met behulp van combinaties van services voor primaire en optionele secundaire opslag. De volgende tabel bevat een overzicht van de clusteropslagconfiguraties die momenteel worden ondersteund in HDInsight:
HDInsight-versie | Primaire opslag | Secundaire opslag | Ondersteund |
---|---|---|---|
3.6 & 4.0 | Algemeen gebruik V1, Algemeen gebruik V2 | Algemeen gebruik V1, Algemeen gebruik V2, BlobStorage(blok-blobs) | Ja |
3.6 & 4.0 | Algemeen gebruik V1, Algemeen gebruik V2 | Data Lake Storage Gen2 | Nee |
3.6 & 4.0 | Data Lake Storage Gen2* | Data Lake Storage Gen2 | Ja |
3.6 & 4.0 | Data Lake Storage Gen2* | Algemeen gebruik V1, Algemeen gebruik V2, BlobStorage(blok-blobs) | Ja |
3.6 & 4.0 | Data Lake Storage Gen2 | Data Lake Storage Gen1 | Nee |
3,6 | Data Lake Storage Gen1 | Data Lake Storage Gen1 | Ja |
3,6 | Data Lake Storage Gen1 | Algemeen gebruik V1, Algemeen gebruik V2, BlobStorage(blok-blobs) | Ja |
3,6 | Data Lake Storage Gen1 | Data Lake Storage Gen2 | Nee |
4.0 | Data Lake Storage Gen1 | Alle | Nee |
4.0 | Algemeen gebruik V1, Algemeen gebruik V2 | Data Lake Storage Gen1 | Nee |
*=Dit kan een of meerdere Data Lake Storage Gen2 zijn, zolang ze allemaal zijn ingesteld om dezelfde beheerde identiteit te gebruiken voor toegang tot clusters.
Notitie
Primaire opslag van Data Lake Storage Gen2 wordt niet ondersteund voor Spark 2.1- of 2.2-clusters.
Gegevensreplicatie
Azure HDInsight slaat geen klantgegevens op. De primaire opslagmiddelen voor een cluster zijn de bijbehorende opslagaccounts. U kunt uw cluster koppelen aan een bestaand opslagaccount of een nieuw opslagaccount maken tijdens het maken van het cluster. Als er een nieuw account wordt gemaakt, wordt dit gemaakt als een lokaal redundant opslagaccount (LRS) en voldoet aan de vereisten voor gegevenslocatie in de regio, inclusief de vereisten die zijn opgegeven in het Vertrouwenscentrum.
U kunt controleren of HDInsight correct is geconfigureerd voor het opslaan van gegevens in één regio door ervoor te zorgen dat het opslagaccount dat is gekoppeld aan uw HDInsight LRS is of een andere opslagoptie die wordt vermeld in het Vertrouwenscentrum.
Notitie
Het upgraden van het primaire of secundaire opslagaccount van een actief cluster met Azure Data Lake Storage Gen2-mogelijkheden wordt niet ondersteund. Als u het opslagtype van een bestaand HDInsight-cluster wilt wijzigen in Data Lake Storage Gen2, moet u het cluster opnieuw maken en een hiërarchisch opslagaccount met een naamruimte selecteren.