DataReference Klas
Vertegenwoordigt een verwijzing naar gegevens in een gegevensarchief.
Een DataReference vertegenwoordigt een pad in een gegevensarchief en kan worden gebruikt om te beschrijven hoe en waar gegevens beschikbaar moeten worden gesteld in een uitvoering. Het is niet langer de aanbevolen benadering voor gegevenstoegang en -levering in Azure Machine Learning. Gegevensset biedt ondersteuning voor toegang tot gegevens vanuit Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database en Azure Database for PostgreSQL via geïntegreerde interface met toegevoegde mogelijkheden voor gegevensbeheer. Het wordt aanbevolen om gegevensset te gebruiken voor het lezen van gegevens in uw machine learning-projecten.
Zie de artikelen voor meer informatie over het gebruik van Azure ML-gegevensset in twee veelvoorkomende scenario's:
Klasse DataReference-constructor.
Constructor
DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)
Parameters
Name | Description |
---|---|
datastore
Vereist
|
Het gegevensarchief waarnaar moet worden verwezen. |
data_reference_name
|
De naam van de gegevensreferentie. Default value: None
|
path_on_datastore
|
Het relatieve pad in de back-upopslag voor de gegevensverwijzing. Default value: None
|
mode
|
De bewerking op de gegevensreferentie. Ondersteunde waarden zijn 'koppelen' (de standaardinstelling) en 'downloaden'. Gebruik de modus 'download' wanneer uw script een specifiek (bijvoorbeeld in code vastgelegd) pad verwacht voor de invoergegevens.
Geef in dit geval het pad op met de Met de koppelingsmodus wordt een tijdelijke map gemaakt met de gekoppelde gegevens en wordt een omgevingsvariabele $AZUREML_DATAREFERENCE_<data_reference_name> ingesteld met het pad naar de tijdelijke map. Als u een DataReference doorgeeft aan de argumentenlijst voor een pijplijnstap (bijvoorbeeld PythonScriptStep), wordt de verwijzing tijdens runtime uitgebreid naar het lokale gegevenspad. Default value: mount
|
path_on_compute
|
Het pad op het rekendoel voor de gegevensreferentie. Default value: None
|
overwrite
|
Hiermee wordt aangegeven of bestaande gegevens moeten worden overschreven. Default value: False
|
datastore
Vereist
|
Het gegevensarchief waarnaar moet worden verwezen. |
data_reference_name
Vereist
|
De naam van de gegevensreferentie. |
path_on_datastore
Vereist
|
Het relatieve pad in de back-upopslag voor de gegevensverwijzing. |
mode
Vereist
|
De bewerking op de gegevensreferentie. Ondersteunde waarden 'koppelen' (de standaardinstelling) en 'downloaden'. Gebruik de modus 'download' wanneer uw script een specifiek (bijvoorbeeld in code vastgelegd) pad verwacht voor de invoergegevens.
Geef in dit geval het pad op met de Met de koppelingsmodus wordt een tijdelijke map gemaakt met de gekoppelde gegevens en wordt een omgevingsvariabele $AZUREML_DATAREFERENCE_<data_reference_name> ingesteld met het pad naar de tijdelijke map. Als u een DataReference doorgeeft aan de argumentenlijst voor een pijplijnstap (bijvoorbeeld PythonScriptStep), wordt de verwijzing tijdens runtime uitgebreid naar het lokale gegevenspad. |
path_on_compute
Vereist
|
Het pad op het rekendoel voor de gegevensreferentie. |
overwrite
Vereist
|
Hiermee wordt aangegeven of bestaande gegevens moeten worden overschreven. |
Opmerkingen
Een DataReference definieert zowel de gegevenslocatie als hoe de gegevens worden gebruikt op de doel-rekenbinding (koppelen of uploaden). Het pad naar de gegevens in het gegevensarchief kan de hoofdmap /, een map in het gegevensarchief of een bestand in het gegevensarchief zijn.
Methoden
as_download |
Schakel over naar een andere gegevensreferentiebewerking om te downloaden. Het downloaden van DataReference ondersteunt alleen Azure Blob en Azure-bestandsshare. Als u gegevens wilt downloaden uit Azure Blob, Azure-bestandsshare, Azure Data Lake Gen1 en Azure Data Lake Gen2, raden we u aan Azure Machine Learning Dataset te gebruiken. Ga naar https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasetsvoor meer informatie over het maken en gebruiken van gegevenssets. |
as_mount |
Schakel de gegevensreferentiebewerking om te koppelen. DataReference-koppeling ondersteunt alleen Azure Blob. Als u gegevens wilt koppelen in Azure Blob, Azure-bestandsshare, Azure Data Lake Gen1 en Azure Data Lake Gen2, raden we u aan Om Azure Machine Learning Dataset te gebruiken. Ga naar https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasetsvoor meer informatie over het maken en gebruiken van gegevenssets. |
as_upload |
Schakel de gegevensreferentiebewerking om te uploaden. Zie voor meer informatie over welke berekeningen en gegevensarchieven ondersteuning bieden voor het uploaden van de gegevens: https://aka.ms/datastore-matrix. |
create |
Maak een DataReference met Behulp van DataPath en DataPathComputeBinding. |
path |
Maak een DataReference-exemplaar op basis van het opgegeven pad. |
to_config |
Converteer het DataReference-object naar het DataReferenceConfiguration-object. |
as_download
Schakel over naar een andere gegevensreferentiebewerking om te downloaden.
Het downloaden van DataReference ondersteunt alleen Azure Blob en Azure-bestandsshare. Als u gegevens wilt downloaden uit Azure Blob, Azure-bestandsshare, Azure Data Lake Gen1 en Azure Data Lake Gen2, raden we u aan Azure Machine Learning Dataset te gebruiken. Ga naar https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasetsvoor meer informatie over het maken en gebruiken van gegevenssets.
as_download(path_on_compute=None, overwrite=False)
Parameters
Name | Description |
---|---|
path_on_compute
|
Het pad op de berekening voor de gegevensreferentie. Default value: None
|
overwrite
|
Hiermee wordt aangegeven of bestaande gegevens moeten worden overschreven. Default value: False
|
Retouren
Type | Description |
---|---|
Een nieuw gegevensverwijzingsobject. |
as_mount
Schakel de gegevensreferentiebewerking om te koppelen.
DataReference-koppeling ondersteunt alleen Azure Blob. Als u gegevens wilt koppelen in Azure Blob, Azure-bestandsshare, Azure Data Lake Gen1 en Azure Data Lake Gen2, raden we u aan Om Azure Machine Learning Dataset te gebruiken. Ga naar https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasetsvoor meer informatie over het maken en gebruiken van gegevenssets.
as_mount()
Retouren
Type | Description |
---|---|
Een nieuw gegevensverwijzingsobject. |
as_upload
Schakel de gegevensreferentiebewerking om te uploaden.
Zie voor meer informatie over welke berekeningen en gegevensarchieven ondersteuning bieden voor het uploaden van de gegevens: https://aka.ms/datastore-matrix.
as_upload(path_on_compute=None, overwrite=False)
Parameters
Name | Description |
---|---|
path_on_compute
|
Het pad op de berekening voor de gegevensreferentie. Default value: None
|
overwrite
|
Hiermee wordt aangegeven of bestaande gegevens moeten worden overschreven. Default value: False
|
Retouren
Type | Description |
---|---|
Een nieuw gegevensverwijzingsobject. |
create
Maak een DataReference met Behulp van DataPath en DataPathComputeBinding.
static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)
Parameters
Name | Description |
---|---|
data_reference_name
|
De naam voor de gegevensreferentie die moet worden gemaakt. Default value: None
|
datapath
|
[Vereist] Het gegevenspad dat moet worden gebruikt. Default value: None
|
datapath_compute_binding
|
[Vereist] De datapath-rekenbinding die moet worden gebruikt. Default value: None
|
Retouren
Type | Description |
---|---|
Een DataReference-object. |
path
Maak een DataReference-exemplaar op basis van het opgegeven pad.
path(path=None, data_reference_name=None)
Parameters
Name | Description |
---|---|
path
|
Het pad in het gegevensarchief. Default value: None
|
data_reference_name
|
De naam van de gegevensreferentie. Default value: None
|
Retouren
Type | Description |
---|---|
Het gegevensverwijzingsobject. |
to_config
Converteer het DataReference-object naar het DataReferenceConfiguration-object.
to_config()
Retouren
Type | Description |
---|---|
Een nieuw DataReferenceConfiguration-object. |