DataReference Classe

Representa uma referência aos dados num arquivo de dados.

Uma DataReference representa um caminho num arquivo de dados e pode ser utilizada para descrever como e onde os dados devem ser disponibilizados numa execução. Já não é a abordagem recomendada para o acesso e entrega de dados no Azure Machine Learning. O conjunto de dados suporta o acesso a dados a partir do armazenamento de Blobs do Azure, Ficheiros do Azure, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Base de Dados SQL do Azure e Base de Dados do Azure para PostgreSQL através de uma interface unificada com funcionalidades de gestão de dados adicionadas. É recomendado utilizar o conjunto de dados para ler dados nos seus projetos de machine learning.

Para obter mais informações sobre como utilizar o conjunto de dados do Azure ML em dois cenários comuns, veja os artigos:

Construtor Class DataReference.

Herança
builtins.object
DataReference

Construtor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parâmetros

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Necessário

O arquivo de dados a referenciar.

data_reference_name
str
valor predefinido: None

O nome da referência de dados.

path_on_datastore
str
valor predefinido: None

O caminho relativo no armazenamento de cópia de segurança da referência de dados.

mode
str
valor predefinido: mount

A operação na referência de dados. Os valores suportados são "montar" (a predefinição) e "transferir".

Utilize o modo de "transferência" quando o script esperar um caminho específico (por exemplo, codificado) para os dados de entrada. Neste caso, especifique o caminho com o path_on_compute parâmetro quando declarar a DataReference. O Azure Machine Learning irá transferir os dados especificados por esse caminho antes de executar o script.

Com o modo de "montagem", é criado um diretório temporário com os dados montados e uma variável de ambiente $AZUREML_DATAREFERENCE_<data_reference_name> é definida com o caminho para o diretório temporário. Se transmitir uma DataReference para a lista de argumentos para um passo de pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local no runtime.

path_on_compute
str
valor predefinido: None

O caminho no destino de computação para a referência de dados.

overwrite
bool
valor predefinido: False

Indica se pretende substituir dados existentes.

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Necessário

O arquivo de dados a referenciar.

data_reference_name
str
Necessário

O nome da referência de dados.

path_on_datastore
str
Necessário

O caminho relativo no armazenamento de cópia de segurança da referência de dados.

mode
str
Necessário

A operação na referência de dados. Valores suportados "montar" (a predefinição) e "transferir".

Utilize o modo de "transferência" quando o script esperar um caminho específico (por exemplo, codificado) para os dados de entrada. Neste caso, especifique o caminho com o path_on_compute parâmetro quando declarar a DataReference. O Azure Machine Learning irá transferir os dados especificados por esse caminho antes de executar o script.

Com o modo de "montagem", é criado um diretório temporário com os dados montados e uma variável de ambiente $AZUREML_DATAREFERENCE_<data_reference_name> é definida com o caminho para o diretório temporário. Se transmitir uma DataReference para a lista de argumentos para um passo de pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local no runtime.

path_on_compute
str
Necessário

O caminho no destino de computação para a referência de dados.

overwrite
bool
Necessário

Indica se pretende substituir dados existentes.

Observações

Uma DataReference define a localização dos dados e a forma como os dados são utilizados no enlace de computação de destino (montagem ou carregamento). O caminho para os dados no arquivo de dados pode ser a raiz /, um diretório no arquivo de dados ou um ficheiro no arquivo de dados.

Métodos

as_download

Mude a operação de referência de dados para transferir.

A transferência de DataReference só suporta o Blob do Azure e a Partilha de Ficheiros do Azure. Para transferir dados do Blob do Azure, da Partilha de Ficheiros do Azure, do Azure Data Lake Gen1 e do Azure Data Lake Gen2, recomendamos que utilize o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Mudar a operação de referência de dados para montagem.

A montagem DataReference só suporta o Blob do Azure. Para montar dados no Blob do Azure, na Partilha de Ficheiros do Azure, no Azure Data Lake Gen1 e no Azure Data Lake Gen2, recomendamos a utilização do Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Mude a operação de referência de dados para carregar.

Para obter mais informações sobre que computação e arquivos de dados suportam o carregamento dos dados, consulte: https://aka.ms/datastore-matrix.

create

Crie uma DataReference com DataPath e DataPathComputeBinding.

path

Crie uma instância dataReference com base no caminho especificado.

to_config

Converta o objeto DataReference para o objeto DataReferenceConfiguration.

as_download

Mude a operação de referência de dados para transferir.

A transferência de DataReference só suporta o Blob do Azure e a Partilha de Ficheiros do Azure. Para transferir dados do Blob do Azure, da Partilha de Ficheiros do Azure, do Azure Data Lake Gen1 e do Azure Data Lake Gen2, recomendamos que utilize o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parâmetros

path_on_compute
str
valor predefinido: None

O caminho na computação para a referência de dados.

overwrite
bool
valor predefinido: False

Indica se pretende substituir dados existentes.

Devoluções

Um novo objeto de referência de dados.

Tipo de retorno

as_mount

Mudar a operação de referência de dados para montagem.

A montagem DataReference só suporta o Blob do Azure. Para montar dados no Blob do Azure, na Partilha de Ficheiros do Azure, no Azure Data Lake Gen1 e no Azure Data Lake Gen2, recomendamos a utilização do Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Devoluções

Um novo objeto de referência de dados.

Tipo de retorno

as_upload

Mude a operação de referência de dados para carregar.

Para obter mais informações sobre que computação e arquivos de dados suportam o carregamento dos dados, consulte: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parâmetros

path_on_compute
str
valor predefinido: None

O caminho na computação para a referência de dados.

overwrite
bool
valor predefinido: False

Indica se pretende substituir dados existentes.

Devoluções

Um novo objeto de referência de dados.

Tipo de retorno

create

Crie uma DataReference com DataPath e DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parâmetros

data_reference_name
str
valor predefinido: None

O nome da referência de dados a criar.

datapath
DataPath
valor predefinido: None

[Obrigatório] O caminho de dados a utilizar.

datapath_compute_binding
DataPathComputeBinding
valor predefinido: None

[Obrigatório] O enlace de computação datapath a utilizar.

Devoluções

Um objeto DataReference.

Tipo de retorno

path

Crie uma instância dataReference com base no caminho especificado.

path(path=None, data_reference_name=None)

Parâmetros

path
str
valor predefinido: None

O caminho no arquivo de dados.

data_reference_name
str
valor predefinido: None

O nome da referência de dados.

Devoluções

O objeto de referência de dados.

Tipo de retorno

to_config

Converta o objeto DataReference para o objeto DataReferenceConfiguration.

to_config()

Devoluções

Um novo objeto DataReferenceConfiguration.

Tipo de retorno