Korzystanie z identyfikatora URI usługi Azure Data Lake Storage Gen2

Sterownik systemu plików hadoop zgodny z Azure Data Lake Storage Gen2 jest znany przez jego identyfikator abfs schematu (System plików obiektów blob platformy Azure). Zgodnie z innymi sterownikami systemu plików hadoop sterownik ABFS stosuje format identyfikatora URI w celu adresowania plików i katalogów w ramach Data Lake Storage Gen2 włączonego konta.

Składnia identyfikatora URI

Sterownik systemu plików obiektów blob platformy Azure może być używany z punktem końcowym Data Lake Storage konta, nawet jeśli to konto nie ma włączonej hierarchicznej przestrzeni nazw. Jeśli konto magazynu nie ma hierarchicznej przestrzeni nazw, skrócona składnia identyfikatora URI to:

abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
  1. Identyfikator schematu: abfs protokół jest używany jako identyfikator schematu. Jeśli dodasz element s na końcu (abfss), sterownik klienta ABFS Hadoop zawsze będzie używać protokołu Transport Layer Security (TLS) niezależnie od wybranej metody uwierzytelniania. Jeśli wybierzesz uwierzytelnianie OAuth, sterownik klienta będzie zawsze używać protokołu TLS nawet wtedy, gdy zostanie określony abfs zamiast abfss , ponieważ uwierzytelnianie OAuth opiera się wyłącznie na warstwie TLS. Jeśli na koniec zdecydujesz się użyć starszej metody klucza konta magazynu, sterownik klienta interpretuje abfs , aby oznaczać, że nie chcesz używać protokołu TLS.

  2. System plików: lokalizacja nadrzędna zawierająca pliki i foldery. Jest to takie samo jak kontenery w usłudze Azure Storage Blob Service.

  3. Nazwa konta: nazwa nadana kontu magazynu podczas tworzenia.

  4. Ścieżki: rozdzielany ukośnikiem (/) reprezentacja struktury katalogów.

  5. Nazwa pliku: nazwa pojedynczego pliku. Ten parametr jest opcjonalny, jeśli adresujesz katalog.

Jeśli jednak konto, którego adres ma mieć hierarchiczną przestrzeń nazw, składnia skrótowego identyfikatora URI to:

/<path>1/<file_name>2
  1. Ścieżka: rozdzielany ukośnikiem (/) reprezentacja struktury katalogów.

  2. Nazwa pliku: nazwa pojedynczego pliku.

Następne kroki