DataReference Klasse

Stellt einen Verweis auf Daten in einem Datenspeicher dar.

Eine DataReference-Klasse stellt einen Pfad in einem Datenspeicher dar und kann verwendet werden, um zu beschreiben, wie und wo Daten in einer Ausführung verfügbar gemacht werden sollen. Hierbei handelt es sich nicht mehr um den empfohlenen Ansatz für den Datenzugriff und die Datenbereitstellung in Azure Machine Learning. Das Dataset unterstützt das Zugreifen auf Daten aus Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL-Datenbank und Azure Database for PostgreSQL über eine einheitliche Schnittstelle mit zusätzlichen Datenverwaltungsfunktionen. Es wird empfohlen, das Dataset zum Lesen von Daten in Ihren Machine Learning-Projekten zu verwenden.

Weitere Informationen zur Verwendung des Azure ML-Datasets in zwei gängigen Szenarios finden Sie in den folgenden Artikeln:

DataReference-Konstruktor der Klasse.

Vererbung
builtins.object
DataReference

Konstruktor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parameter

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Erforderlich

Der Datenspeicher, auf den verwiesen wird.

data_reference_name
str
Standardwert: None

Der Name des Datentverweises.

path_on_datastore
str
Standardwert: None

Der relative Pfad im Sicherungsspeicher für den Datenverweis.

mode
str
Standardwert: mount

Der Vorgang für den Datenverweis. Unterstützte Werte sind 'mount' (Standard) und 'download'.

Verwenden Sie den Modus 'download', wenn Ihr Skript einen bestimmten (z. B. hartcodierten) Pfad für die Eingabedaten erwartet. Geben Sie in diesem Fall den Pfad mit dem Parameter path_on_compute an, wenn Sie „DataReference“ deklarieren. Azure Machine Learning lädt die Daten herunter, die vor der Ausführung Ihres Skripts von diesem Pfad angegeben werden.

Beim Modus 'mount' wird ein temporäres Verzeichnis mit den bereitgestellten Daten erstellt, und die Umgebungsvariable $AZUREML_DATAREFERENCE_<data_reference_name> wird mit dem Pfad zum temporären Verzeichnis festgelegt. Wenn Sie „DataReference“ für einen Pipelineschritt (z. B. „PythonScriptStep“) an die Argumentliste übergeben, wird der Verweis zur Laufzeit auf den lokalen Datenpfad erweitert.

path_on_compute
str
Standardwert: None

Der Pfad für das Computeziel für den Datenverweis.

overwrite
bool
Standardwert: False

Gibt an, ob vorhandene Daten überschrieben werden.

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Erforderlich

Der Datenspeicher, auf den verwiesen wird.

data_reference_name
str
Erforderlich

Der Name des Datentverweises.

path_on_datastore
str
Erforderlich

Der relative Pfad im Sicherungsspeicher für den Datenverweis.

mode
str
Erforderlich

Der Vorgang für den Datenverweis. Unterstützte Werte "mount" (Standard) und "download".

Verwenden Sie den Modus 'download', wenn Ihr Skript einen bestimmten (z. B. hartcodierten) Pfad für die Eingabedaten erwartet. Geben Sie in diesem Fall den Pfad mit dem Parameter path_on_compute an, wenn Sie „DataReference“ deklarieren. Azure Machine Learning lädt die Daten herunter, die vor der Ausführung Ihres Skripts von diesem Pfad angegeben werden.

Beim Modus 'mount' wird ein temporäres Verzeichnis mit den bereitgestellten Daten erstellt, und die Umgebungsvariable $AZUREML_DATAREFERENCE_<data_reference_name> wird mit dem Pfad zum temporären Verzeichnis festgelegt. Wenn Sie „DataReference“ für einen Pipelineschritt (z. B. „PythonScriptStep“) an die Argumentliste übergeben, wird der Verweis zur Laufzeit auf den lokalen Datenpfad erweitert.

path_on_compute
str
Erforderlich

Der Pfad für das Computeziel für den Datenverweis.

overwrite
bool
Erforderlich

Gibt an, ob vorhandene Daten überschrieben werden.

Hinweise

„DataReference“ definiert sowohl den Datenspeicherort als auch die Verwendung der Daten für die Zielcomputebindung ('mount' oder 'upload'). Der Pfad zu den Daten im Datenspeicher kann das Stammverzeichnis, ein Verzeichnis innerhalb des Datenspeichers oder eine Datei im Datenspeicher sein.

Methoden

as_download

Ändern Sie den Datenverweisvorgang in 'download'.

Der DataReference-Modus 'download' unterstützt nur Azure Blob Storage und Azure-Dateifreigaben. Zum Herunterladen von Daten aus Azure Blob Storage, Azure-Dateifreigaben, Azure Data Lake Gen1 und Azure Data Lake Gen2 wird die Verwendung von Azure Machine Learning-Datasets empfohlen. Weitere Informationen zum Erstellen und Verwenden von Datasets finden Sie unter https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Ändern Sie den Datenverweisvorgang in 'mount'.

Der DataReference-Modus 'mount' unterstützt nur Azure Blob Storage. Zum Einbinden von Daten in Azure Blob Storage, Azure-Dateifreigaben, Azure Data Lake Gen1 und Azure Data Lake Gen2 wird die Verwendung von Azure Machine Learning-Datasets empfohlen. Weitere Informationen zum Erstellen und Verwenden von Datasets finden Sie unter https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Ändern Sie den Datenverweisvorgang in 'upload'.

Weitere Informationen dazu, welche Compute- und Datenspeicher das Hochladen der Daten unterstützen, finden Sie unter https://aka.ms/datastore-matrix.

create

Erstellen Sie eine DataReference-Klasse mit „DataPath“ und „DataPathComputeBinding“.

path

Erstellen Sie eine DataReference-Instanz basierend auf dem angegebenen Pfad.

to_config

Konvertieren Sie das DataReference-Objekt in das DataReferenceConfiguration-Objekt.

as_download

Ändern Sie den Datenverweisvorgang in 'download'.

Der DataReference-Modus 'download' unterstützt nur Azure Blob Storage und Azure-Dateifreigaben. Zum Herunterladen von Daten aus Azure Blob Storage, Azure-Dateifreigaben, Azure Data Lake Gen1 und Azure Data Lake Gen2 wird die Verwendung von Azure Machine Learning-Datasets empfohlen. Weitere Informationen zum Erstellen und Verwenden von Datasets finden Sie unter https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parameter

path_on_compute
str
Standardwert: None

Der Pfad für die Compute für den Datenverweis.

overwrite
bool
Standardwert: False

Gibt an, ob vorhandene Daten überschrieben werden.

Gibt zurück

Ein neues Datenverweisobjekt.

Rückgabetyp

as_mount

Ändern Sie den Datenverweisvorgang in 'mount'.

Der DataReference-Modus 'mount' unterstützt nur Azure Blob Storage. Zum Einbinden von Daten in Azure Blob Storage, Azure-Dateifreigaben, Azure Data Lake Gen1 und Azure Data Lake Gen2 wird die Verwendung von Azure Machine Learning-Datasets empfohlen. Weitere Informationen zum Erstellen und Verwenden von Datasets finden Sie unter https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Gibt zurück

Ein neues Datenverweisobjekt.

Rückgabetyp

as_upload

Ändern Sie den Datenverweisvorgang in 'upload'.

Weitere Informationen dazu, welche Compute- und Datenspeicher das Hochladen der Daten unterstützen, finden Sie unter https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parameter

path_on_compute
str
Standardwert: None

Der Pfad für die Compute für den Datenverweis.

overwrite
bool
Standardwert: False

Gibt an, ob vorhandene Daten überschrieben werden.

Gibt zurück

Ein neues Datenverweisobjekt.

Rückgabetyp

create

Erstellen Sie eine DataReference-Klasse mit „DataPath“ und „DataPathComputeBinding“.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parameter

data_reference_name
str
Standardwert: None

Der Name für den zu erstellenden Datenverweis.

datapath
DataPath
Standardwert: None

[Erforderlich] Der zu verwendende Datenpfad.

datapath_compute_binding
DataPathComputeBinding
Standardwert: None

[Erforderlich] Die zu verwendende Computebindung für den Datenpfad.

Gibt zurück

Ein DataReference-Objekt.

Rückgabetyp

path

Erstellen Sie eine DataReference-Instanz basierend auf dem angegebenen Pfad.

path(path=None, data_reference_name=None)

Parameter

path
str
Standardwert: None

Der Pfad im Datenspeicher.

data_reference_name
str
Standardwert: None

Der Name des Datentverweises.

Gibt zurück

Das Datenverweisobjekt.

Rückgabetyp

to_config

Konvertieren Sie das DataReference-Objekt in das DataReferenceConfiguration-Objekt.

to_config()

Gibt zurück

Ein neues DataReferenceConfiguration-Objekt.

Rückgabetyp