DataReference Classe
Representa uma referência aos dados num arquivo de dados.
Uma DataReference representa um caminho num arquivo de dados e pode ser utilizada para descrever como e onde os dados devem ser disponibilizados numa execução. Já não é a abordagem recomendada para o acesso e entrega de dados no Azure Machine Learning. O conjunto de dados suporta o acesso a dados a partir do armazenamento de Blobs do Azure, Ficheiros do Azure, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Base de Dados SQL do Azure e Base de Dados do Azure para PostgreSQL através de uma interface unificada com funcionalidades de gestão de dados adicionadas. É recomendado utilizar o conjunto de dados para ler dados nos seus projetos de machine learning.
Para obter mais informações sobre como utilizar o conjunto de dados do Azure ML em dois cenários comuns, veja os artigos:
Construtor Class DataReference.
- Herança
-
builtins.objectDataReference
Construtor
DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)
Parâmetros
- datastore
- Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
O arquivo de dados a referenciar.
- path_on_datastore
- str
O caminho relativo no armazenamento de cópia de segurança da referência de dados.
- mode
- str
A operação na referência de dados. Os valores suportados são "montar" (a predefinição) e "transferir".
Utilize o modo de "transferência" quando o script esperar um caminho específico (por exemplo, codificado) para os dados de entrada.
Neste caso, especifique o caminho com o path_on_compute
parâmetro quando declarar a DataReference.
O Azure Machine Learning irá transferir os dados especificados por esse caminho antes de executar o script.
Com o modo de "montagem", é criado um diretório temporário com os dados montados e uma variável de ambiente $AZUREML_DATAREFERENCE_<data_reference_name> é definida com o caminho para o diretório temporário. Se transmitir uma DataReference para a lista de argumentos para um passo de pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local no runtime.
- path_on_compute
- str
O caminho no destino de computação para a referência de dados.
- datastore
- Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
O arquivo de dados a referenciar.
- path_on_datastore
- str
O caminho relativo no armazenamento de cópia de segurança da referência de dados.
- mode
- str
A operação na referência de dados. Valores suportados "montar" (a predefinição) e "transferir".
Utilize o modo de "transferência" quando o script esperar um caminho específico (por exemplo, codificado) para os dados de entrada.
Neste caso, especifique o caminho com o path_on_compute
parâmetro quando declarar a DataReference.
O Azure Machine Learning irá transferir os dados especificados por esse caminho antes de executar o script.
Com o modo de "montagem", é criado um diretório temporário com os dados montados e uma variável de ambiente $AZUREML_DATAREFERENCE_<data_reference_name> é definida com o caminho para o diretório temporário. Se transmitir uma DataReference para a lista de argumentos para um passo de pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local no runtime.
Observações
Uma DataReference define a localização dos dados e a forma como os dados são utilizados no enlace de computação de destino (montagem ou carregamento). O caminho para os dados no arquivo de dados pode ser a raiz /, um diretório no arquivo de dados ou um ficheiro no arquivo de dados.
Métodos
as_download |
Mude a operação de referência de dados para transferir. A transferência de DataReference só suporta o Blob do Azure e a Partilha de Ficheiros do Azure. Para transferir dados do Blob do Azure, da Partilha de Ficheiros do Azure, do Azure Data Lake Gen1 e do Azure Data Lake Gen2, recomendamos que utilize o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets. |
as_mount |
Mudar a operação de referência de dados para montagem. A montagem DataReference só suporta o Blob do Azure. Para montar dados no Blob do Azure, na Partilha de Ficheiros do Azure, no Azure Data Lake Gen1 e no Azure Data Lake Gen2, recomendamos a utilização do Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets. |
as_upload |
Mude a operação de referência de dados para carregar. Para obter mais informações sobre que computação e arquivos de dados suportam o carregamento dos dados, consulte: https://aka.ms/datastore-matrix. |
create |
Crie uma DataReference com DataPath e DataPathComputeBinding. |
path |
Crie uma instância dataReference com base no caminho especificado. |
to_config |
Converta o objeto DataReference para o objeto DataReferenceConfiguration. |
as_download
Mude a operação de referência de dados para transferir.
A transferência de DataReference só suporta o Blob do Azure e a Partilha de Ficheiros do Azure. Para transferir dados do Blob do Azure, da Partilha de Ficheiros do Azure, do Azure Data Lake Gen1 e do Azure Data Lake Gen2, recomendamos que utilize o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_download(path_on_compute=None, overwrite=False)
Parâmetros
Devoluções
Um novo objeto de referência de dados.
Tipo de retorno
as_mount
Mudar a operação de referência de dados para montagem.
A montagem DataReference só suporta o Blob do Azure. Para montar dados no Blob do Azure, na Partilha de Ficheiros do Azure, no Azure Data Lake Gen1 e no Azure Data Lake Gen2, recomendamos a utilização do Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_mount()
Devoluções
Um novo objeto de referência de dados.
Tipo de retorno
as_upload
Mude a operação de referência de dados para carregar.
Para obter mais informações sobre que computação e arquivos de dados suportam o carregamento dos dados, consulte: https://aka.ms/datastore-matrix.
as_upload(path_on_compute=None, overwrite=False)
Parâmetros
Devoluções
Um novo objeto de referência de dados.
Tipo de retorno
create
Crie uma DataReference com DataPath e DataPathComputeBinding.
static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)
Parâmetros
- datapath_compute_binding
- DataPathComputeBinding
[Obrigatório] O enlace de computação datapath a utilizar.
Devoluções
Um objeto DataReference.
Tipo de retorno
path
Crie uma instância dataReference com base no caminho especificado.
path(path=None, data_reference_name=None)
Parâmetros
Devoluções
O objeto de referência de dados.
Tipo de retorno
to_config
Converta o objeto DataReference para o objeto DataReferenceConfiguration.
to_config()
Devoluções
Um novo objeto DataReferenceConfiguration.
Tipo de retorno
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários