Sdílet prostřednictvím


DataReference Třída

Představuje odkaz na data v úložišti dat.

DataReference představuje cestu v úložišti dat a dá se použít k popisu, jak a kde mají být data zpřístupněna při spuštění. Už to není doporučený přístup pro přístup k datům a jejich doručování ve službě Azure Machine Learning. Datová sada podporuje přístup k datům ze služby Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database a Azure Database for PostgreSQL prostřednictvím sjednoceného rozhraní s přidanými možnostmi správy dat. Ke čtení dat v projektech strojového učení se doporučuje používat datovou sadu.

Další informace o tom, jak používat datovou sadu Azure ML ve dvou běžných scénářích, najdete v článcích:

Class DataReference – konstruktor.

Dědičnost
builtins.object
DataReference

Konstruktor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parametry

Name Description
datastore
Vyžadováno

Úložiště dat, na které se má odkazovat.

data_reference_name
str

Název odkazu na data.

Default value: None
path_on_datastore
str

Relativní cesta v záložním úložišti pro odkaz na data.

Default value: None
mode
str

Operace s odkazem na data. Podporované hodnoty jsou "mount" (výchozí) a "download".

Režim stahování použijte, pokud skript očekává konkrétní (např. pevně zakódovanou) cestu ke vstupním datům. V tomto případě zadejte cestu s parametrem path_on_compute při deklaraci DataReference. Azure Machine Learning stáhne data určená v této cestě před spuštěním skriptu.

V režimu připojení se vytvoří dočasný adresář s připojenými daty a proměnná prostředí $AZUREML_DATAREFERENCE_<data_reference_name> nastaví cestu k dočasnému adresáři. Pokud do seznamu argumentů předáte odkaz DataReference pro krok kanálu (např. PythonScriptStep), odkaz se rozbalí na místní cestu k datům za běhu.

Default value: mount
path_on_compute
str

Cesta na cílovém výpočetním objektu pro odkaz na data.

Default value: None
overwrite

Určuje, jestli se mají přepsat existující data.

Default value: False
datastore
Vyžadováno

Úložiště dat, na které se má odkazovat.

data_reference_name
Vyžadováno
str

Název odkazu na data.

path_on_datastore
Vyžadováno
str

Relativní cesta v záložním úložišti pro odkaz na data.

mode
Vyžadováno
str

Operace s odkazem na data. Podporované hodnoty "mount" (výchozí) a "download".

Režim stahování použijte, pokud skript očekává konkrétní (např. pevně zakódovanou) cestu ke vstupním datům. V tomto případě zadejte cestu s parametrem path_on_compute při deklaraci DataReference. Azure Machine Learning stáhne data určená v této cestě před spuštěním skriptu.

V režimu připojení se vytvoří dočasný adresář s připojenými daty a proměnná prostředí $AZUREML_DATAREFERENCE_<data_reference_name> nastaví cestu k dočasnému adresáři. Pokud do seznamu argumentů předáte odkaz DataReference pro krok kanálu (např. PythonScriptStep), odkaz se rozbalí na místní cestu k datům za běhu.

path_on_compute
Vyžadováno
str

Cesta na cílovém výpočetním objektu pro odkaz na data.

overwrite
Vyžadováno

Určuje, jestli se mají přepsat existující data.

Poznámky

DataReference definuje umístění dat a způsob použití dat na cílové výpočetní vazbě (připojení nebo nahrání). Cesta k datům v úložišti dat může být kořenový adresář /, adresář v úložišti dat nebo soubor v úložišti dat.

Metody

as_download

Přepnutí operace odkazu na data na stažení

Stahování DataReference podporuje pouze objekty blob Azure a sdílené složky Azure. Pokud chcete stáhnout data z azure blob, sdílené složky Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, najdete na stránce https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Přepněte operaci odkazu na data na připojení.

Připojení DataReference podporuje pouze objekty blob Azure. Pokud chcete připojit data v Azure Blob, sdílené složce Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, najdete na stránce https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Přepnutí operace odkazu na data na nahrání

Další informace o tom, které výpočetní prostředky a úložiště dat podporují nahrávání dat, najdete tady: https://aka.ms/datastore-matrix.

create

Create DataReference pomocí dataPath a DataPathComputeBinding.

path

Create instanci DataReference na základě dané cesty.

to_config

Převeďte objekt DataReference na objekt DataReferenceConfiguration.

as_download

Přepnutí operace odkazu na data na stažení

Stahování DataReference podporuje pouze objekty blob Azure a sdílené složky Azure. Pokud chcete stáhnout data z azure blob, sdílené složky Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, najdete na stránce https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parametry

Name Description
path_on_compute
str

Cesta na výpočetním prostředí pro odkaz na data.

Default value: None
overwrite

Určuje, jestli se mají přepsat existující data.

Default value: False

Návraty

Typ Description

Nový objekt odkazu na data.

as_mount

Přepněte operaci odkazu na data na připojení.

Připojení DataReference podporuje pouze objekty blob Azure. Pokud chcete připojit data v Azure Blob, sdílené složce Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, najdete na stránce https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Návraty

Typ Description

Nový objekt odkazu na data.

as_upload

Přepnutí operace odkazu na data na nahrání

Další informace o tom, které výpočetní prostředky a úložiště dat podporují nahrávání dat, najdete tady: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parametry

Name Description
path_on_compute
str

Cesta na výpočetním prostředí pro odkaz na data.

Default value: None
overwrite

Určuje, jestli se mají přepsat existující data.

Default value: False

Návraty

Typ Description

Nový objekt odkazu na data.

create

Create DataReference pomocí dataPath a DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parametry

Name Description
data_reference_name
str

Název vytvořeného odkazu na data.

Default value: None
datapath

[Povinné] Cesta k datům, která se má použít.

Default value: None
datapath_compute_binding

[Povinné] Výpočetní vazba cesty k datům, která se má použít.

Default value: None

Návraty

Typ Description

Objekt DataReference.

path

Create instanci DataReference na základě dané cesty.

path(path=None, data_reference_name=None)

Parametry

Name Description
path
str

Cesta k úložišti dat.

Default value: None
data_reference_name
str

Název odkazu na data.

Default value: None

Návraty

Typ Description

Objekt odkazu na data.

to_config

Převeďte objekt DataReference na objekt DataReferenceConfiguration.

to_config()

Návraty

Typ Description

Nový DataReferenceConfiguration objekt.