Förstå URI:er

Slutförd

Du kan lagra data på din lokala enhet eller någonstans i molnet. Oavsett var du lagrar dina data vill du komma åt data när du tränar maskininlärningsmodeller. Om du vill hitta och komma åt data i Azure Machine Learning kan du använda URI:er (Uniform Resource Identifiers).

Förstå URI:er

En URI refererar till platsen för dina data. För att Azure Machine Learning ska kunna ansluta till dina data måste du prefixa URI:n med lämpligt protokoll. Det finns tre vanliga protokoll när du arbetar med data i samband med Azure Machine Learning:

Diagram of different types of protocols that Azure Machine Learning uses to connect to external data sources.

  • http(s): Används för datalager offentligt eller privat på en Azure Blob Storage- eller offentligt tillgänglig http-plats.
  • abfs(s): Används för datalager i en Azure Data Lake Storage Gen 2.
  • azureml: Används för data som lagras i ett datalager.

Du kan till exempel skapa en Azure Blob Storage i Azure. Om du vill lagra data skapar du en container med namnet training-data. I containern skapar du en mapp datastore-path. I mappen lagrar du CSV-filen diabetes.csv.

Screenshot of data stored in an Azure Blob Storage.

När du vill komma åt data från Azure Machine Learning-arbetsytan kan du använda sökvägen till mappen eller filen direkt. När du vill ansluta till mappen eller filen direkt kan du använda protokollet http(s) . Om containern är inställd på privat måste du ange någon form av autentisering för att få åtkomst till data, till exempel en signatur för delad åtkomst (SAS).

När du skapar ett datalager i Azure Machine Learning lagrar du anslutningsinformationen och autentiseringsinformationen på arbetsytan. Sedan kan du använda protokollet för att komma åt data i containern azureml .

Dricks

Ett datalager är en referens till ett befintligt lagringskonto i Azure. När du refererar till data som lagras i ett datalager kanske du refererar till data som lagras i en Azure Blob Storage eller Azure Data Lake Storage. När du refererar till datalagringen behöver du dock inte autentisera eftersom anslutningsinformationen som lagras med datalagringen används av Azure Machine Learning.

Det anses vara en bra idé att undvika känsliga data i koden, till exempel autentiseringsinformation. När det är möjligt bör du därför arbeta med datalager och datatillgångar i Azure Machine Learning. Men under experimenteringen i notebook-filer kanske du vill ansluta direkt till en lagringsplats för att undvika onödiga omkostnader.