Meer informatie over URI's

Voltooid

U kunt gegevens opslaan op uw lokale apparaat of ergens in de cloud. Waar u uw gegevens ook opslaat, wilt u toegang krijgen tot de gegevens bij het trainen van machine learning-modellen. Als u gegevens wilt zoeken en openen in Azure Machine Learning, kunt u Uniform Resource Identifiers (URI's) gebruiken.

Meer informatie over URI's

Een URI verwijst naar de locatie van uw gegevens. Als u met Azure Machine Learning verbinding wilt maken met uw gegevens, moet u de URI vooraf laten gaan met het juiste protocol. Er zijn drie algemene protocollen voor het werken met gegevens in de context van Azure Machine Learning:

Diagram of different types of protocols that Azure Machine Learning uses to connect to external data sources.

  • http(s): Gebruiken voor gegevensarchieven openbaar of privé in een Azure Blob Storage of openbaar beschikbare http(s) locatie.
  • abfs(s): Gebruiken voor gegevensarchieven in een Azure Data Lake Storage Gen 2.
  • azureml: Gebruiken voor gegevens die zijn opgeslagen in een gegevensarchief.

U kunt bijvoorbeeld een Azure Blob Storage maken in Azure. Als u gegevens wilt opslaan, maakt u een container met de naam training-data. In de container maakt u een map datastore-path. In de map slaat u het CSV-bestand diabetes.csvop.

Screenshot of data stored in an Azure Blob Storage.

Als u toegang wilt tot de gegevens vanuit de Azure Machine Learning-werkruimte, kunt u het pad rechtstreeks naar de map of het bestand gebruiken. Als u rechtstreeks verbinding wilt maken met de map of het bestand, kunt u het http(s) protocol gebruiken. Als de container is ingesteld op privé, moet u een soort verificatie opgeven om toegang te krijgen tot de gegevens, zoals een Shared Access Signature (SAS).

Wanneer u een gegevensarchief maakt in Azure Machine Learning, slaat u de verbindings- en verificatiegegevens op in de werkruimte. Vervolgens kunt u het azureml protocol gebruiken om toegang te krijgen tot de gegevens in de container.

Tip

Een gegevensarchief is een verwijzing naar een bestaand opslagaccount in Azure. Als u verwijst naar gegevens die zijn opgeslagen in een gegevensarchief, verwijst u mogelijk naar gegevens die worden opgeslagen in een Azure Blob Storage of Azure Data Lake Storage. Wanneer u echter naar het gegevensarchief verwijst, hoeft u zich niet te verifiëren als de verbindingsgegevens die zijn opgeslagen met het gegevensarchief, worden gebruikt door Azure Machine Learning.

Het wordt beschouwd als een best practice om gevoelige gegevens in uw code te voorkomen, zoals verificatiegegevens. Daarom moet u, waar mogelijk, werken met gegevensarchieven en gegevensassets in Azure Machine Learning. Tijdens experimenten in notebooks wilt u echter mogelijk rechtstreeks verbinding maken met een opslaglocatie om onnodige overhead te voorkomen.