Usar o URI do Armazenamento do Azure Data Lake
O driver do sistema de arquivos Hadoop compatível com o Armazenamento do Azure Data Lake é conhecido por seu identificador abfs
de esquema (Sistema de Arquivos de Blob do Azure). Consistente com outros drivers do sistema de arquivos Hadoop, o driver ABFS emprega um formato URI para endereçar arquivos e diretórios em uma conta habilitada para armazenamento Data Lake.
Sintaxe URI
O driver do Sistema de Arquivos de Blob do Azure pode ser usado com o ponto de extremidade do Armazenamento Data Lake de uma conta, mesmo que essa conta não tenha um namespace hierárquico habilitado. Se a conta de armazenamento não tiver um namespace hierárquico, a sintaxe URI abreviada será:
abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
Identificador de esquema: O
abfs
protocolo é usado como identificador de esquema. Se você adicionar ums
no final (abfss), o driver do cliente Hadoop ABFS sempre usará Transport Layer Security (TLS), independentemente do método de autenticação escolhido. Se você escolher OAuth como sua autenticação, o driver do cliente sempre usará TLS, mesmo se você especificarabfs
em vez deabfss
porque OAuth depende exclusivamente da camada TLS. Finalmente, se você optar por usar o método mais antigo de chave de conta de armazenamento, o driver do cliente interpretaráabfs
como significando que você não deseja usar TLS.Sistema de arquivos: o local pai que contém os arquivos e pastas. Isso é o mesmo que contêineres no serviço de Blob de Armazenamento do Azure.
Nome da conta: o nome dado à sua conta de armazenamento durante a criação.
Caminhos: Uma representação delimitada (
/
) da estrutura de diretórios.Nome do arquivo: o nome do arquivo individual. Este parâmetro é opcional se você estiver endereçando um diretório.
No entanto, se a conta que você deseja endereçar tiver um namespace hierárquico, a sintaxe URI abreviada é:
/<path>1/<file_name>2
Caminho: Uma representação delimitada (
/
) da estrutura de diretórios.Nome do arquivo: O nome do arquivo individual.