DataReference Třída

Představuje odkaz na data v úložišti dat.

DataReference představuje cestu v úložišti dat a dá se použít k popisu, jak a kde mají být data zpřístupněna při spuštění. Už to není doporučený přístup pro přístup k datům a jejich doručování ve službě Azure Machine Learning. Datová sada podporuje přístup k datům ze služby Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database a Azure Database for PostgreSQL prostřednictvím sjednoceného rozhraní s přidanými možnostmi správy dat. Ke čtení dat v projektech strojového učení se doporučuje používat datovou sadu.

Další informace o tom, jak používat datovou sadu Azure ML ve dvou běžných scénářích, najdete v článcích:

Class DataReference – konstruktor.

Dědičnost
builtins.object
DataReference

Konstruktor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parametry

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Vyžadováno

Úložiště dat, na které se má odkazovat.

data_reference_name
str
výchozí hodnota: None

Název odkazu na data.

path_on_datastore
str
výchozí hodnota: None

Relativní cesta v záložním úložišti pro odkaz na data.

mode
str
výchozí hodnota: mount

Operace s odkazem na data. Podporované hodnoty jsou "mount" (výchozí) a "download".

Režim stahování použijte, pokud skript očekává konkrétní (např. pevně zakódovanou) cestu ke vstupním datům. V tomto případě zadejte cestu s parametrem path_on_compute při deklaraci DataReference. Azure Machine Learning stáhne data určená v této cestě před spuštěním skriptu.

V režimu připojení se vytvoří dočasný adresář s připojenými daty a proměnná prostředí $AZUREML_DATAREFERENCE_<data_reference_name> nastaví cestu k dočasnému adresáři. Pokud do seznamu argumentů předáte odkaz DataReference pro krok kanálu (např. PythonScriptStep), odkaz se rozbalí na místní cestu k datům za běhu.

path_on_compute
str
výchozí hodnota: None

Cesta na cílovém výpočetním objektu pro odkaz na data.

overwrite
bool
výchozí hodnota: False

Určuje, jestli se mají přepsat existující data.

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Vyžadováno

Úložiště dat, na které se má odkazovat.

data_reference_name
str
Vyžadováno

Název odkazu na data.

path_on_datastore
str
Vyžadováno

Relativní cesta v záložním úložišti pro odkaz na data.

mode
str
Vyžadováno

Operace s odkazem na data. Podporované hodnoty "mount" (výchozí) a "download".

Režim stahování použijte, pokud skript očekává konkrétní (např. pevně zakódovanou) cestu ke vstupním datům. V tomto případě zadejte cestu s parametrem path_on_compute při deklaraci DataReference. Azure Machine Learning stáhne data určená v této cestě před spuštěním skriptu.

V režimu připojení se vytvoří dočasný adresář s připojenými daty a proměnná prostředí $AZUREML_DATAREFERENCE_<data_reference_name> nastaví cestu k dočasnému adresáři. Pokud do seznamu argumentů předáte odkaz DataReference pro krok kanálu (např. PythonScriptStep), odkaz se rozbalí na místní cestu k datům za běhu.

path_on_compute
str
Vyžadováno

Cesta na cílovém výpočetním objektu pro odkaz na data.

overwrite
bool
Vyžadováno

Určuje, jestli se mají přepsat existující data.

Poznámky

DataReference definuje umístění dat i způsob použití dat v cílové vazbě výpočetních prostředků (připojení nebo nahrání). Cesta k datům v úložišti dat může být kořenový adresář /, adresář v úložišti dat nebo soubor v úložišti dat.

Metody

as_download

Přepnutí operace odkazu na data na stažení

Stahování DataReference podporuje pouze objekty blob Azure a sdílené složky Azure. Pokud chcete stáhnout data z azure blob, sdílené složky Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, najdete na stránce https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Přepněte operaci odkazu na data na připojení.

Připojení DataReference podporuje pouze objekty blob Azure. Pokud chcete připojit data v Azure Blob, sdílené složce Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, najdete na stránce https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Přepnutí operace odkazu na data na nahrání

Další informace o tom, které výpočetní prostředky a úložiště dat podporují nahrávání dat, najdete tady: https://aka.ms/datastore-matrix.

create

Vytvořte DataReference pomocí dataPath a DataPathComputeBinding.

path

Vytvořte instanci DataReference na základě dané cesty.

to_config

Převeďte objekt DataReference na objekt DataReferenceConfiguration.

as_download

Přepnutí operace odkazu na data na stažení

Stahování DataReference podporuje pouze objekty blob Azure a sdílené složky Azure. Pokud chcete stáhnout data z azure blob, sdílené složky Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, najdete na stránce https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parametry

path_on_compute
str
výchozí hodnota: None

Cesta na výpočetním prostředí pro odkaz na data.

overwrite
bool
výchozí hodnota: False

Určuje, jestli se mají přepsat existující data.

Návraty

Nový objekt odkazu na data.

Návratový typ

as_mount

Přepněte operaci odkazu na data na připojení.

Připojení DataReference podporuje pouze objekty blob Azure. Pokud chcete připojit data v Azure Blob, sdílené složce Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, najdete na stránce https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Návraty

Nový objekt odkazu na data.

Návratový typ

as_upload

Přepnutí operace odkazu na data na nahrání

Další informace o tom, které výpočetní prostředky a úložiště dat podporují nahrávání dat, najdete tady: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parametry

path_on_compute
str
výchozí hodnota: None

Cesta na výpočetním prostředí pro odkaz na data.

overwrite
bool
výchozí hodnota: False

Určuje, jestli se mají přepsat existující data.

Návraty

Nový objekt odkazu na data.

Návratový typ

create

Vytvořte DataReference pomocí dataPath a DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parametry

data_reference_name
str
výchozí hodnota: None

Název vytvořeného odkazu na data.

datapath
DataPath
výchozí hodnota: None

[Povinné] Cesta k datům, která se má použít.

datapath_compute_binding
DataPathComputeBinding
výchozí hodnota: None

[Povinné] Výpočetní vazba cesty k datům, která se má použít.

Návraty

Objekt DataReference.

Návratový typ

path

Vytvořte instanci DataReference na základě dané cesty.

path(path=None, data_reference_name=None)

Parametry

path
str
výchozí hodnota: None

Cesta k úložišti dat.

data_reference_name
str
výchozí hodnota: None

Název odkazu na data.

Návraty

Objekt odkazu na data.

Návratový typ

to_config

Převeďte objekt DataReference na objekt DataReferenceConfiguration.

to_config()

Návraty

Nový DataReferenceConfiguration objekt.

Návratový typ