Sdílet prostřednictvím


DataReference Třída

Představuje odkaz na data v úložišti dat.

DataReference představuje cestu v úložišti dat a lze ji použít k popisu, jak a kde se mají data zpřístupnit při spuštění. Už se nedoporučuje přístup k datům a jejich doručování ve službě Azure Machine Learning. Datová sada podporuje přístup k datům ze služby Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database a Azure Database for PostgreSQL prostřednictvím sjednoceného rozhraní s přidanými možnostmi správy dat. Pro čtení dat v projektech strojového učení se doporučuje použít datovou sadu.

Další informace o tom, jak používat datovou sadu Azure ML ve dvou běžných scénářích, najdete v článcích:

Konstruktor DataReference třídy.

Konstruktor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parametry

Name Description
datastore
Vyžadováno

Úložiště dat, na které chcete odkazovat.

data_reference_name
str

Název odkazu na data.

Default value: None
path_on_datastore
str

Relativní cesta v záložním úložišti pro odkaz na data.

Default value: None
mode
str

Operace s odkazem na data. Podporované hodnoty jsou mount (výchozí) a "download".

Režim "download" použijte, pokud váš skript očekává konkrétní (např. pevně zakódovanou) cestu pro vstupní data. V tomto případě zadejte cestu s parametrem path_on_compute při deklarování DataReference. Azure Machine Learning stáhne data zadaná touto cestou před spuštěním skriptu.

V režimu "mount" se vytvoří dočasný adresář s připojenými daty a proměnnou prostředí $AZUREML_DATAREFERENCE_<data_reference_name> se nastaví s cestou k dočasnému adresáři. Pokud předáte dataReference do seznamu argumentů pro krok kanálu (např. PythonScriptStep), odkaz se rozbalí na místní cestu k datům za běhu.

Default value: mount
path_on_compute
str

Cesta k cílovému výpočetnímu objektu pro odkaz na data.

Default value: None
overwrite

Určuje, zda chcete přepsat existující data.

Default value: False
datastore
Vyžadováno

Úložiště dat, na které chcete odkazovat.

data_reference_name
Vyžadováno
str

Název odkazu na data.

path_on_datastore
Vyžadováno
str

Relativní cesta v záložním úložišti pro odkaz na data.

mode
Vyžadováno
str

Operace s odkazem na data. Podporované hodnoty "mount" (výchozí) a "download".

Režim "download" použijte, pokud váš skript očekává konkrétní (např. pevně zakódovanou) cestu pro vstupní data. V tomto případě zadejte cestu s parametrem path_on_compute při deklarování DataReference. Azure Machine Learning stáhne data zadaná touto cestou před spuštěním skriptu.

V režimu "mount" se vytvoří dočasný adresář s připojenými daty a proměnnou prostředí $AZUREML_DATAREFERENCE_<data_reference_name> se nastaví s cestou k dočasnému adresáři. Pokud předáte dataReference do seznamu argumentů pro krok kanálu (např. PythonScriptStep), odkaz se rozbalí na místní cestu k datům za běhu.

path_on_compute
Vyžadováno
str

Cesta k cílovému výpočetnímu objektu pro odkaz na data.

overwrite
Vyžadováno

Určuje, zda chcete přepsat existující data.

Poznámky

DataReference definuje umístění dat i způsob použití dat v cílové výpočetní vazbě (připojení nebo nahrání). Cesta k datům v úložišti dat může být kořen /, adresář v úložišti dat nebo soubor v úložišti dat.

Metody

as_download

Přepnutí operace odkazu na data ke stažení

Stahování DataReference podporuje pouze objekty blob Azure a sdílenou složku Azure. Pokud chcete stahovat data z Azure Blob, sdílené složky Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, naleznete v tématu https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Přepnutí referenční operace dat pro připojení.

Připojení DataReference podporuje pouze Azure Blob. Pokud chcete připojit data v Azure Blob, sdílené složce Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, naleznete v tématu https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Přepnutí operace odkazu na data k nahrání

Další informace o tom, které výpočetní prostředky a úložiště dat podporují nahrávání dat, najdete v tématu: https://aka.ms/datastore-matrix.

create

Vytvořte DataReference pomocí DataPath a DataPathComputeBinding.

path

Vytvořte instanci DataReference na základě dané cesty.

to_config

Převeďte objekt DataReference na objekt DataReferenceConfiguration.

as_download

Přepnutí operace odkazu na data ke stažení

Stahování DataReference podporuje pouze objekty blob Azure a sdílenou složku Azure. Pokud chcete stahovat data z Azure Blob, sdílené složky Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, naleznete v tématu https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parametry

Name Description
path_on_compute
str

Cesta k výpočetním prostředkům pro odkaz na data.

Default value: None
overwrite

Určuje, zda chcete přepsat existující data.

Default value: False

Návraty

Typ Description

Nový objekt odkazu na data.

as_mount

Přepnutí referenční operace dat pro připojení.

Připojení DataReference podporuje pouze Azure Blob. Pokud chcete připojit data v Azure Blob, sdílené složce Azure, Azure Data Lake Gen1 a Azure Data Lake Gen2, doporučujeme použít datovou sadu Azure Machine Learning. Další informace o tom, jak vytvořit a používat datovou sadu, naleznete v tématu https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Návraty

Typ Description

Nový objekt odkazu na data.

as_upload

Přepnutí operace odkazu na data k nahrání

Další informace o tom, které výpočetní prostředky a úložiště dat podporují nahrávání dat, najdete v tématu: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parametry

Name Description
path_on_compute
str

Cesta k výpočetním prostředkům pro odkaz na data.

Default value: None
overwrite

Určuje, zda chcete přepsat existující data.

Default value: False

Návraty

Typ Description

Nový objekt odkazu na data.

create

Vytvořte DataReference pomocí DataPath a DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parametry

Name Description
data_reference_name
str

Název odkazu na data, která se mají vytvořit.

Default value: None
datapath

[Povinné] Cesta k datům, která se má použít.

Default value: None
datapath_compute_binding

[Povinné] Výpočetní vazba datové cesty, která se má použít.

Default value: None

Návraty

Typ Description

A DataReference objekt.

path

Vytvořte instanci DataReference na základě dané cesty.

path(path=None, data_reference_name=None)

Parametry

Name Description
path
str

Cesta k úložišti dat.

Default value: None
data_reference_name
str

Název odkazu na data.

Default value: None

Návraty

Typ Description

Objekt odkazu na data.

to_config

Převeďte objekt DataReference na objekt DataReferenceConfiguration.

to_config()

Návraty

Typ Description

Nový objekt DataReferenceConfiguration.