Veri deposu oluşturma

Tamamlandı

Azure Machine Learning'de veri depoları, bulut veri kaynaklarına yönelik soyutlamalardır. Veri kaynaklarına bağlanmak için gereken bilgileri kapsüller ve bu bağlantı bilgilerini betiklerinizde kodlamanız gerekmeyecek şekilde güvenli bir şekilde depolar.

Veri depolarını kullanmanın avantajları şunlardır:

  • Veri depolamanıza kullanımı kolay URI'ler sağlar.
  • Azure Machine Learning'de veri bulmayı kolaylaştırır.
  • Gizli dizileri ve anahtarları veri bilimciler için göstermeden bağlantı bilgilerini güvenli bir şekilde depolar.

Azure'da mevcut depolama hesabıyla bir veri deposu oluştururken iki farklı kimlik doğrulama yöntemi seçeneği sağlanır:

Azure Machine Learning veri depolarının dış veri kaynaklarına bağlanmak için kullandığı iki farklı kimlik doğrulama yönteminin diyagramı.

  • Kimlik bilgisi tabanlı: Depolama hesabınıza erişimin kimliğini doğrulamak için hizmet sorumlusu, paylaşılan erişim imzası (SAS) belirteci veya hesap anahtarı kullanın.
  • Kimlik tabanlı: Microsoft Entra kimliğinizi veya yönetilen kimliğinizi kullanın.

Veri deposu türlerini anlama

Azure Machine Learning, aşağıdakiler dahil olmak üzere birden çok Azure veri kaynağı türü için veri depoları oluşturmayı destekler:

  • Azure Blob Storage
  • Azure Dosya Paylaşımı
  • Azure Data Lake (2. Nesil)

Yerleşik veri depolarını kullanma

Her çalışma alanında, Azure Machine Learning tarafından sistem depolama alanı olarak kullanılan dört yerleşik veri deposu (ikisi Azure Depolama blob kapsayıcılarına ve ikisi Azure Depolama dosya paylaşımlarına bağlanıyor) bulunur.

Çoğu makine öğrenmesi projesinde kendi veri kaynaklarınızla çalışmanız gerekir. Örneğin, makine öğrenmesi çözümünüzü mevcut uygulamalardan veya veri mühendisliği işlem hatlarından alınan verilerle tümleştirebilirsiniz.

Veri deposu oluşturma

Veri depoları çalışma alanlarına eklenir ve depolama hizmetlerine bağlantı bilgilerini depolamak için kullanılır. Veri deposu oluşturduğunuzda, bağlantı bilgilerini almak için kullanılabilecek bir ad sağlarsınız.

Veri depoları, verileri her okumak veya yazmak istediğinizde gerekli tüm ayrıntıları sağlamak zorunda kalmadan depolama hizmetlerine kolayca bağlanmanızı sağlar. Ayrıca, kullanıcıların verileri kullanmasını ancak temel alınan depolama hizmetine doğrudan bağlanmamasını istiyorsanız koruyucu bir katman oluşturur.

Azure Blob Depolama kapsayıcısı için veri deposu oluşturma

Grafik kullanıcı arabirimi, Azure komut satırı arabirimi (CLI) veya Python yazılım geliştirme seti (SDK) aracılığıyla bir veri deposu oluşturabilirsiniz.

Bağlanmak istediğiniz depolama hizmetine bağlı olarak, Azure Machine Learning'in kimlik doğrulaması için farklı seçenekleri vardır.

Örneğin, bir Azure Blob Depolama kapsayıcısına bağlanmak için bir veri deposu oluşturmak istediğinizde, bir hesap anahtarı kullanabilirsiniz:

blob_datastore = AzureBlobDatastore(
    			name = "blob_example",
    			description = "Datastore pointing to a blob container",
    			account_name = "mytestblobstore",
    			container_name = "data-container",
    			credentials = AccountKeyConfiguration(
        			account_key="XXXxxxXXXxXXXXxxXXX"
    			),
)
ml_client.create_or_update(blob_datastore)

Alternatif olarak, kimlik doğrulaması için SAS belirteci kullanarak bir Azure Blob Depolama kapsayıcısına bağlanmak için bir veri deposu oluşturabilirsiniz:

blob_datastore = AzureBlobDatastore(
name="blob_sas_example",
description="Datastore pointing to a blob container",
account_name="mytestblobstore",
container_name="data-container",
credentials=SasTokenConfiguration(
sas_token="?xx=XXXX-XX-XX&xx=xxxx&xxx=xxx&xx=xxxxxxxxxxx&xx=XXXX-XX-XXXXX:XX:XXX&xx=XXXX-XX-XXXXX:XX:XXX&xxx=xxxxx&xxx=XXxXXXxxxxxXXXXXXXxXxxxXXXXXxxXXXXXxXXXXxXXXxXXxXX"
),
)
ml_client.create_or_update(blob_datastore)

İpucu

Diğer bulut depolama çözümü türlerine bağlanmak için veri depoları oluşturma hakkında daha fazla bilgi edinin.