Partilhar via


Utilizar o URI do Azure Data Lake Storage Gen2

O controlador do Sistema de Ficheiros hadoop compatível com Azure Data Lake Storage Gen2 é conhecido pelo respetivo identificador abfs de esquema (Sistema de Ficheiros de Blobs do Azure). Consistente com outros controladores do Sistema de Ficheiros do Hadoop, o controlador do ABFS emprega um formato URI para endereçar ficheiros e diretórios numa conta Data Lake Storage Gen2 ativada.

Sintaxe do URI

O controlador do Sistema de Ficheiros de Blobs do Azure pode ser utilizado com o ponto final Data Lake Storage de uma conta, mesmo que essa conta não tenha um espaço de nomes hierárquico ativado. Se a conta de armazenamento não tiver um espaço de nomes hierárquico, a sintaxe de URI abreviada será:

abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
  1. Identificador do esquema: o abfs protocolo é utilizado como identificador do esquema. Se adicionar um s no final (abfss), o controlador de cliente do Hadoop do ABFS utilizará sempre o Transport Layer Security (TLS), independentemente do método de autenticação escolhido. Se escolher OAuth como autenticação, o controlador de cliente utilizará sempre o TLS, mesmo que especifique abfs em vez de abfss porque o OAuth depende apenas da camada TLS. Por fim, se optar por utilizar o método mais antigo da chave da conta de armazenamento, o controlador de cliente interpreta abfs para significar que não quer utilizar o TLS.

  2. Sistema de ficheiros: a localização principal que contém os ficheiros e pastas. Isto é o mesmo que os contentores no serviço Blob de Armazenamento do Azure.

  3. Nome da conta: o nome dado à sua conta de armazenamento durante a criação.

  4. Caminhos: uma representação delimitada por barra (/) da estrutura do diretório.

  5. Nome do ficheiro: o nome do ficheiro individual. Este parâmetro é opcional se estiver a abordar um diretório.

No entanto, se a conta que pretende abordar tiver um espaço de nomes hierárquico, a sintaxe de URI abreviada será:

/<path>1/<file_name>2
  1. Caminho: uma representação delimitada por barra (/) da estrutura do diretório.

  2. Nome do Ficheiro: o nome do ficheiro individual.

Passos seguintes