Verwenden des Azure Data Lake Storage Gen2-URI
Der mit Azure Data Lake Storage Gen2 kompatible Hadoop-Dateisystemtreiber ist unter seinem Schemabezeichner abfs
(Azure Blob File System) bekannt. Wie andere Hadoop-Dateisystemtreiber verwendet auch der ABFS-Treiber ein URI-Format zur Angabe von Dateien und Verzeichnissen in einem Azure Data Lake Storage Gen2-fähigen Konto.
URI-Syntax
Der Azure Blob File System-Treiber kann beim Data Lake Storage-Endpunkt eines Kontos selbst dann verwendet werden, wenn für dieses Konto kein hierarchischer Namespace aktiviert wurde. Wenn das Speicherkonto keinen hierarchischen Namespace hat, lautet die Kurzform der URI-Syntax:
abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
Schemabezeichner: Das
abfs
-Protokoll wird als Schemabezeichner verwendet. Wenn Sie am Ende eins
hinzufügen (abfss), verwendet der ABFS-Hadoop-Clienttreiber stets TLS (Transport Layer Security), unabhängig von der ausgewählten Authentifizierungsmethode. Wenn Sie OAuth als Authentifizierung auswählen, verwendet der Clienttreiber immer TLS, auch wenn Sieabfs
anstelle vonabfss
angeben, da OAuth ausschließlich auf der TLS-Ebene aufbaut. Wenn Sie sich schließlich für die ältere Methode mit Speicherkontoschlüssel entscheiden, interpretiert der Clienttreiberabfs
so, dass Sie TLS nicht verwenden möchten.Dateisystem: Der übergeordnete Speicherort, in dem sich die Dateien und Ordner befinden. Dies entspricht Containern im Azure Storage Blob-Dienst.
Kontoname: Der Name, der Ihrem Speicherkonto während der Erstellung gegeben wurde.
Pfade: Eine durch Schrägstriche (
/
) getrennte Darstellung der Verzeichnisstruktur.Dateiname: Der Name der jeweiligen Datei. Dieser Parameter ist optional, wenn Sie auf ein Verzeichnis verweisen.
Wenn aber das Konto, das Sie adressieren möchten, keinen hierarchischen Namespace hat, lautet die Kurzform der URI-Syntax:
/<path>1/<file_name>2
Pfad: Eine durch Schrägstriche (
/
) getrennte Darstellung der Verzeichnisstruktur.Dateiname: Der Name der jeweiligen Datei.