URI van Azure Data Lake Storage Gen2 gebruiken
Het Hadoop Filesystem-stuurprogramma dat compatibel is met Azure Data Lake Storage Gen2 is bekend onder de schema-id abfs
(Azure Blob File System). In overeenstemming met andere Stuurprogramma's van het Hadoop-bestandssysteem gebruikt het ABFS-stuurprogramma een URI-indeling om bestanden en mappen binnen een Data Lake Storage Gen2 ingeschakeld account te adresseert.
URI-syntaxis
Het stuurprogramma Azure Blob File System kan worden gebruikt met het Data Lake Storage eindpunt van een account, zelfs als voor dat account geen hiërarchische naamruimte is ingeschakeld. Als het opslagaccount geen hiërarchische naamruimte heeft, is de verkorte URI-syntaxis:
abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
Schema-id: het
abfs
protocol wordt gebruikt als de schema-id. Als u eens
toevoegt aan het einde (abfss), gebruikt het ABFS Hadoop-clientstuurprogramma altijd TLS (Transport Layer Security), ongeacht de gekozen verificatiemethode. Als u OAuth als verificatie kiest, gebruikt het clientstuurprogramma altijd TLS, zelfs als u dit opgeeftabfs
in plaats van omdat OAuth alleen afhankelijk is vanabfss
de TLS-laag. Ten slotte, als u ervoor kiest om de oudere methode van de opslagaccountsleutel te gebruiken, betekent het clientstuurprogrammaabfs
dat u TLS niet wilt gebruiken.Bestandssysteem: de bovenliggende locatie met de bestanden en mappen. Dit is hetzelfde als containers in de Azure Storage Blob-service.
Accountnaam: de naam die aan uw opslagaccount is gegeven tijdens het maken.
Paden: een door slash gescheiden (
/
) weergave van de mapstructuur.Bestandsnaam: de naam van het afzonderlijke bestand. Deze parameter is optioneel als u een map adresseert.
Als het account dat u wilt adresseert echter wel een hiërarchische naamruimte heeft, is de verkorte URI-syntaxis:
/<path>1/<file_name>2
Pad: een door slash gescheiden (
/
) weergave van de mapstructuur.Bestandsnaam: de naam van het afzonderlijke bestand.