URI'leri anlama
Verileri yerel cihazınızda veya bulutta bir yerde depolayabilirsiniz. Verilerinizi nerede depolarsanız depolayın, makine öğrenmesi modellerini eğitirken verilere erişmek istiyorsunuz. Azure Machine Learning'de verileri bulmak ve verilere erişmek için Tekdüzen Kaynak Tanımlayıcıları'nı (URI' ler) kullanabilirsiniz.
URI'leri anlama
URI, verilerinizin konumuna başvurur. Azure Machine Learning'in verilerinize bağlanması için URI'ye uygun protokolün ön ekini eklemeniz gerekir. Azure Machine Learning bağlamında verilerle çalışırken üç yaygın protokol vardır:
-
http(s): Azure Blob Depolama veya genel kullanıma açık http(ler) konumundaki veri depoları için kullanın. -
abfs(s): Azure Data Lake Storage 2. Nesil'deki veri depoları için kullanın. -
azureml: Veri deposunda depolanan veriler için kullanın.
Örneğin, Azure'da bir Azure Blob Depolama oluşturabilirsiniz. Verileri depolamak için adlı training-databir kapsayıcı oluşturursunuz. Kapsayıcı içinde bir klasör datastore-patholuşturursunuz. klasöründe CSV dosyasını diabetes.csvdepolarsınız.
Azure Machine Learning çalışma alanından verilere erişmek istediğinizde doğrudan klasör veya dosyanın yolunu kullanabilirsiniz. Klasöre veya dosyaya doğrudan bağlanmak istediğinizde, protokolü kullanabilirsiniz http(s) . Kapsayıcı özel olarak ayarlandıysa, verilere erişmek için Paylaşılan Erişim İmzası (SAS) gibi bir tür kimlik doğrulaması sağlamanız gerekir.
Azure Machine Learning'de bir veri deposu oluşturduğunuzda, bağlantı ve kimlik doğrulama bilgilerini çalışma alanında depolayacaksınız. Ardından kapsayıcıdaki verilere erişmek için protokolü kullanabilirsiniz azureml .
İpucu
Veri deposu, Azure'daki mevcut bir depolama hesabına başvurudur. Bu nedenle, bir veri deposunda depolanan verilere başvurduğunda, bir Azure Blob Depolama veya Azure Data Lake Storage'da depolanan verilere başvuruyor olabilirsiniz. Ancak veri deposuna başvurduğunda, veri deposuyla depolanan bağlantı bilgileri Azure Machine Learning tarafından kullanılacağından kimlik doğrulaması yapmanız gerekmez.
Kodunuzda kimlik doğrulama bilgileri gibi hassas verilerden kaçınmak en iyi yöntem olarak kabul edilir. Bu nedenle mümkün olduğunda Azure Machine Learning'deki veri depoları ve veri varlıklarıyla çalışmanız gerekir. Ancak not defterlerindeki denemeler sırasında gereksiz ek yüklerden kaçınmak için doğrudan bir depolama konumuna bağlanmak isteyebilirsiniz.