Använda Azure Data Lake Storage Gen2 URI

Drivrutinen för Hadoop-filsystemet som är kompatibel med Azure Data Lake Storage Gen2 är känd av dess schemaidentifierare abfs (Azure Blob File System). I enlighet med andra Hadoop-filsystemdrivrutiner använder ABFS-drivrutinen ett URI-format för att adressera filer och kataloger i ett Data Lake Storage Gen2 aktiverat konto.

URI-syntax

Drivrutinen för Azure Blob File System kan användas med Data Lake Storage slutpunkten för ett konto även om det kontot inte har ett hierarkiskt namnområde aktiverat. Om lagringskontot inte har ett hierarkiskt namnområde är den korta URI-syntaxen:

abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
  1. Schemaidentifierare: Protokollet abfs används som schemaidentifierare. Om du lägger till en s i slutet (abfs s) använder ABFS Hadoop-klientdrivrutinen alltid TLS (Transport Layer Security) oavsett vilken autentiseringsmetod som valts. Om du väljer OAuth som autentisering använder klientdrivrutinen alltid TLS även om du anger abfs i stället för abfss eftersom OAuth enbart förlitar sig på TLS-lagret. Om du väljer att använda den äldre metoden för lagringskontonyckel tolkas abfs klientdrivrutinen som att du inte vill använda TLS.

  2. Filsystem: Den överordnade platsen som innehåller filerna och mapparna. Det här är samma som containrar i Azure Storage Blob-tjänsten.

  3. Kontonamn: Namnet som angavs för ditt lagringskonto när det skapades.

  4. Sökvägar: En snedstrecksavgränsad (/) representation av katalogstrukturen.

  5. Filnamn: Namnet på den enskilda filen. Den här parametern är valfri om du adresserar en katalog.

Men om det konto som du vill adressera har ett hierarkiskt namnområde är den korta URI-syntaxen:

/<path>1/<file_name>2
  1. Sökväg: En snedstrecksavgränsad (/) representation av katalogstrukturen.

  2. Filnamn: Namnet på den enskilda filen.

Nästa steg