Grundlegendes zu URIs

Abgeschlossen

Sie können Daten auf Ihrem lokalen Gerät oder irgendwo in der Cloud speichern. Unabhängig davon, wo Sie Ihre Daten speichern, müssen Sie zum Trainieren von Machine Learning-Modellen auf die Daten zugreifen. Zum Suchen von und Zugreifen auf Daten in Azure Machine Learning können Sie Uniform Resource Identifiers (URIs) verwenden.

Grundlegendes zu URIs

Ein URI verweist auf den Speicherort Ihrer Daten. Damit Azure Machine Learning eine Verbindung mit Ihren Daten herstellen kann, müssen Sie dem URI das entsprechende Protokoll voranstellen. Beim Arbeiten mit Daten im Kontext von Azure Machine Learning gibt es drei gängige Protokolle:

Diagram of different types of protocols that Azure Machine Learning uses to connect to external data sources.

  • http(s): Wählen Sie diese Option für öffentlich oder privat gespeicherte Daten in einer Azure Blob Storage-Instanz oder einem öffentlich zugänglichen HTTP(S)-Speicherort.
  • abfs(s): Wählen Sie diese Option für Datenspeicher in einer Azure Data Lake Storage Gen2-Instanz.
  • azureml: Wählen Sie diese Option für Daten, die in einem Datenspeicher gespeichert sind.

Sie können beispielsweise eine Azure Blob Storage-Instanz in Azure erstellen. Zum Speichern von Daten erstellen Sie einen Container mit dem Namen training-data. Erstellen Sie im Container den Ordner datastore-path. Speichern Sie in diesem Ordner die CSV-Datei diabetes.csv.

Screenshot of data stored in an Azure Blob Storage.

Wenn Sie im Azure Machine Learning-Arbeitsbereich auf die Daten zugreifen möchten, können Sie den Pfad zum Ordner oder zur Datei direkt verwenden. Wenn Sie sich direkt mit dem Ordner oder der Datei verbinden möchten, können Sie das Protokoll http(s) verwenden. Wenn der Container auf „Privat“ festgelegt ist, müssen Sie eine Authentifizierung vornehmen, um Zugriff auf die Daten zu erhalten, z. B. eine Shared Access Signature (SAS).

Wenn Sie in Azure Machine Learning einen Datenspeicher erstellen, speichern Sie die Verbindungs- und Authentifizierungsinformationen im Arbeitsbereich. Für den Zugriff auf die Daten im Container können Sie dann das Protokoll azureml verwenden.

Tipp

Ein Datenspeicher ist ein Verweis auf ein vorhandenes Speicherkonto in Azure. Wenn Sie also auf in einem Datenspeicher gespeicherte Daten verweisen, verweisen Sie möglicherweise auf Daten, die in Azure Blob Storage oder Azure Data Lake Storage gespeichert sind. Wenn Sie jedoch auf den Datenspeicher verweisen, müssen Sie sich nicht authentifizieren, da die mit dem Datenspeicher gespeicherten Verbindungsinformationen von Azure Machine Learning verwendet werden.

Es gilt als bewährte Methode, vertrauliche Daten, z. B. Authentifizierungsinformationen, in Ihrem Code zu vermeiden. Daher sollten Sie in Azure Machine Learning nach Möglichkeit mit Datenspeichern und Datenressourcen arbeiten. Beim Experimentieren in Notebooks können Sie jedoch eine direkte Verbindung mit einem Speicherort herstellen, um unnötigen Mehraufwand zu vermeiden.