DataReference Klass

Representerar en referens till data i ett datalager.

En DataReference representerar en sökväg i ett datalager och kan användas för att beskriva hur och var data ska göras tillgängliga i en körning. Det är inte längre den rekommenderade metoden för dataåtkomst och leverans i Azure Machine Learning. Datauppsättningen har stöd för åtkomst till data från Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database och Azure Database for PostgreSQL via ett enhetligt gränssnitt med ytterligare funktioner för datahantering. Vi rekommenderar att du använder datauppsättningen för att läsa data i dina maskininlärningsprojekt.

Mer information om hur du använder Azure ML-datauppsättning i två vanliga scenarier finns i artiklarna:

Class DataReference-konstruktor.

Arv
builtins.object
DataReference

Konstruktor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parametrar

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Obligatorisk

Det datalager som ska refereras till.

data_reference_name
str
standardvärde: None

Namnet på datareferensen.

path_on_datastore
str
standardvärde: None

Den relativa sökvägen i säkerhetskopieringslagringen för datareferensen.

mode
str
standardvärde: mount

Åtgärden för datareferensen. Värden som stöds är "mount" (standard) och "download".

Använd nedladdningsläget när skriptet förväntar sig en specifik (t.ex. hårdkodad) sökväg för indata. I det här fallet anger du sökvägen med parametern path_on_compute när du deklarerar DataReference. Azure Machine Learning laddar ned de data som anges av den sökvägen innan skriptet körs.

Med monteringsläget skapas en tillfällig katalog med monterade data och en miljövariabel $AZUREML_DATAREFERENCE_<data_reference_name> anges med sökvägen till den tillfälliga katalogen. Om du skickar en DataReference till argumentlistan för ett pipelinesteg (t.ex. PythonScriptStep) expanderas referensen till den lokala datasökvägen vid körning.

path_on_compute
str
standardvärde: None

Sökvägen till beräkningsmålet för datareferensen.

overwrite
bool
standardvärde: False

Anger om befintliga data ska skrivas över.

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Obligatorisk

Det datalager som ska refereras till.

data_reference_name
str
Obligatorisk

Namnet på datareferensen.

path_on_datastore
str
Obligatorisk

Den relativa sökvägen i säkerhetskopieringslagringen för datareferensen.

mode
str
Obligatorisk

Åtgärden för datareferensen. Värdena "mount" (standard) och "download" stöds.

Använd nedladdningsläget när skriptet förväntar sig en specifik (t.ex. hårdkodad) sökväg för indata. I det här fallet anger du sökvägen med parametern path_on_compute när du deklarerar DataReference. Azure Machine Learning laddar ned de data som anges av den sökvägen innan skriptet körs.

Med monteringsläget skapas en tillfällig katalog med monterade data och en miljövariabel $AZUREML_DATAREFERENCE_<data_reference_name> anges med sökvägen till den tillfälliga katalogen. Om du skickar en DataReference till argumentlistan för ett pipelinesteg (t.ex. PythonScriptStep) expanderas referensen till den lokala datasökvägen vid körning.

path_on_compute
str
Obligatorisk

Sökvägen till beräkningsmålet för datareferensen.

overwrite
bool
Obligatorisk

Anger om befintliga data ska skrivas över.

Kommentarer

En DataReference definierar både dataplatsen och hur data används på målberäkningsbindningen (montera eller ladda upp). Sökvägen till data i datalagret kan vara roten /, en katalog i datalagret eller en fil i datalagret.

Metoder

as_download

Växla datareferensåtgärd för nedladdning.

DataReference-nedladdning stöder endast Azure Blob och Azure File Share. Om du vill ladda ned data från Azure Blob, Azure File Share, Azure Data Lake Gen1 och Azure Data Lake Gen2 rekommenderar vi att du använder Azure Machine Learning Dataset. Mer information om hur du skapar och använder Dataset finns i https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Växla datareferensåtgärd till montering.

DataReference-montering stöder endast Azure Blob. För att montera data i Azure Blob, Azure File Share, Azure Data Lake Gen1 och Azure Data Lake Gen2 rekommenderar vi att du använder Azure Machine Learning Dataset. Mer information om hur du skapar och använder Dataset finns i https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Växla datareferensåtgärd för att ladda upp.

Mer information om vilka beräkningar och datalager som stöder uppladdning av data finns i: https://aka.ms/datastore-matrix.

create

Skapa en DataReference med DataPath och DataPathComputeBinding.

path

Skapa en DataReference-instans baserat på den angivna sökvägen.

to_config

Konvertera DataReference-objektet till DataReferenceConfiguration-objektet.

as_download

Växla datareferensåtgärd för nedladdning.

DataReference-nedladdning stöder endast Azure Blob och Azure File Share. Om du vill ladda ned data från Azure Blob, Azure File Share, Azure Data Lake Gen1 och Azure Data Lake Gen2 rekommenderar vi att du använder Azure Machine Learning Dataset. Mer information om hur du skapar och använder Dataset finns i https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parametrar

path_on_compute
str
standardvärde: None

Sökvägen till beräkningen för datareferensen.

overwrite
bool
standardvärde: False

Anger om befintliga data ska skrivas över.

Returer

Ett nytt datareferensobjekt.

Returtyp

as_mount

Växla datareferensåtgärd till montering.

DataReference-montering stöder endast Azure Blob. För att montera data i Azure Blob, Azure File Share, Azure Data Lake Gen1 och Azure Data Lake Gen2 rekommenderar vi att du använder Azure Machine Learning Dataset. Mer information om hur du skapar och använder Dataset finns i https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Returer

Ett nytt datareferensobjekt.

Returtyp

as_upload

Växla datareferensåtgärd för att ladda upp.

Mer information om vilka beräkningar och datalager som stöder uppladdning av data finns i: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parametrar

path_on_compute
str
standardvärde: None

Sökvägen till beräkningen för datareferensen.

overwrite
bool
standardvärde: False

Anger om befintliga data ska skrivas över.

Returer

Ett nytt datareferensobjekt.

Returtyp

create

Skapa en DataReference med DataPath och DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parametrar

data_reference_name
str
standardvärde: None

Namnet på datareferensen som ska skapas.

datapath
DataPath
standardvärde: None

[Krävs] Den datasökväg som ska användas.

datapath_compute_binding
DataPathComputeBinding
standardvärde: None

[Krävs] Datapath-beräkningsbindningen som ska användas.

Returer

Ett DataReference-objekt.

Returtyp

path

Skapa en DataReference-instans baserat på den angivna sökvägen.

path(path=None, data_reference_name=None)

Parametrar

path
str
standardvärde: None

Sökvägen till dataarkivet.

data_reference_name
str
standardvärde: None

Namnet på datareferensen.

Returer

Datareferensobjektet.

Returtyp

to_config

Konvertera DataReference-objektet till DataReferenceConfiguration-objektet.

to_config()

Returer

Ett nytt DataReferenceConfiguration-objekt.

Returtyp