Datastore Sınıf

Azure Machine Learning depolama hesabı üzerindeki bir depolama soyutlama değerini temsil eder.

Veri depoları çalışma alanlarına eklenir ve Azure depolama hizmetlerine bağlantı bilgilerini depolamak için kullanılır, böylece bunlara ada göre başvurabilirsiniz ve depolama hizmetlerine bağlanmak için kullanılan bağlantı bilgilerini ve gizli diziyi hatırlamanız gerekmez.

Veri deposu olarak kaydedilebilen desteklenen Azure depolama hizmetlerine örnek olarak şunlar verilebilir:

  • Azure Blob Kapsayıcısı

  • Azure Dosya Paylaşımı

  • Azure Data Lake

  • Azure Data Lake 2. Nesil

  • Azure SQL Veritabanı

  • PostgreSQL için Azure Veritabanı

  • Databricks Dosya Sistemi

  • MySQL için Azure Veritabanı

Veri depolarını kaydetme, listeleme, alma ve kaldırma gibi yönetim işlemlerini gerçekleştirmek için bu sınıfı kullanın. Her hizmet için veri depoları bu sınıfın register* yöntemleriyle oluşturulur. Verilere erişmek için bir veri deposu kullanırken, veri deposuna kayıtlı kimlik bilgilerine bağlı olarak bu verilere erişim izniniz olmalıdır.

Veri depoları ve bunların makine öğrenmesinde nasıl kullanılabildikleri hakkında daha fazla bilgi için aşağıdaki makalelere bakın:

Ada göre bir veri deposu alın. Bu çağrı, veri deposu hizmetine bir istekte bulunur.

Devralma
builtins.object
Datastore

Oluşturucu

Datastore(workspace, name=None)

Parametreler

workspace
Workspace
Gerekli

Çalışma alanı.

name
str, <xref:optional>
varsayılan değer: None

Veri deposunun adı varsayılan olarak Yok olur ve bu da varsayılan veri depolarını alır.

Açıklamalar

Eğitim gibi makine öğrenmesi görevleri için veri depolarınızdaki verilerle etkileşim kurmak için bir Azure Machine Learning veri kümesi oluşturun. Veri kümeleri, tablosal verileri pandas veya Spark DataFrame'e yükleyen işlevler sağlar. Veri kümeleri ayrıca Azure Blob depolama, Azure Dosyalar, Azure Data Lake Storage 1. Nesil, Azure Data Lake Storage 2. Nesil, Azure SQL Veritabanı ve PostgreSQL için Azure Veritabanı. Veri kümeleriyle eğitim hakkında daha fazla bilgi edinin.

Aşağıdaki örnekte, Azure Blob Kapsayıcısı'na bağlı bir Veri Deposunun nasıl oluşturulacağı gösterilmektedir.


   from azureml.exceptions import UserErrorException

   blob_datastore_name='MyBlobDatastore'
   account_name=os.getenv("BLOB_ACCOUNTNAME_62", "<my-account-name>") # Storage account name
   container_name=os.getenv("BLOB_CONTAINER_62", "<my-container-name>") # Name of Azure blob container
   account_key=os.getenv("BLOB_ACCOUNT_KEY_62", "<my-account-key>") # Storage account key

   try:
       blob_datastore = Datastore.get(ws, blob_datastore_name)
       print("Found Blob Datastore with name: %s" % blob_datastore_name)
   except UserErrorException:
       blob_datastore = Datastore.register_azure_blob_container(
           workspace=ws,
           datastore_name=blob_datastore_name,
           account_name=account_name, # Storage account name
           container_name=container_name, # Name of Azure blob container
           account_key=account_key) # Storage account key
       print("Registered blob datastore with name: %s" % blob_datastore_name)

   blob_data_ref = DataReference(
       datastore=blob_datastore,
       data_reference_name="blob_test_data",
       path_on_datastore="testdata")

Tam örnek şu kaynaktan edinilebilir: https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-data-transfer.ipynb

Yöntemler

get

Ada göre bir veri deposu alın. Bu, oluşturucuyu çağırmakla aynıdır.

get_default

Çalışma alanı için varsayılan veri depolarını alın.

register_azure_blob_container

Veri deposuna bir Azure Blob Kapsayıcısı kaydedin.

Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir; SAS Belirteci veya Depolama Hesabı Anahtarı'nı kullanmayı seçebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci doğrudan şu işlevlerden birini çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.

register_azure_data_lake

Yeni bir Azure Data Lake Datastore başlatın.

Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir. Kimlik bilgisi tabanlı veri erişimi için hizmet sorumlusuna bir veri deposu kaydedebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci doğrudan şu işlevlerden birini çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.

Azure Data Lake 1. Nesil'i Datastore olarak kaydetme örneği için lütfen aşağıya bakın.


   adlsgen1_datastore_name='adlsgen1datastore'

   store_name=os.getenv("ADL_STORENAME", "<my_datastore_name>") # the ADLS name
   subscription_id=os.getenv("ADL_SUBSCRIPTION", "<my_subscription_id>") # subscription id of the ADLS
   resource_group=os.getenv("ADL_RESOURCE_GROUP", "<my_resource_group>") # resource group of ADLS
   tenant_id=os.getenv("ADL_TENANT", "<my_tenant_id>") # tenant id of service principal
   client_id=os.getenv("ADL_CLIENTID", "<my_client_id>") # client id of service principal
   client_secret=os.getenv("ADL_CLIENT_SECRET", "<my_client_secret>") # the secret of service principal

   adls_datastore = Datastore.register_azure_data_lake(
       workspace=ws,
       datastore_name=aslsgen1_datastore_name,
       subscription_id=subscription_id, # subscription id of ADLS account
       resource_group=resource_group, # resource group of ADLS account
       store_name=store_name, # ADLS account name
       tenant_id=tenant_id, # tenant id of service principal
       client_id=client_id, # client id of service principal
       client_secret=client_secret) # the secret of service principal
register_azure_data_lake_gen2

Yeni bir Azure Data Lake 2. Nesil Veri Deposu başlatın.

Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir. Kimlik bilgisi tabanlı veri erişimi için hizmet sorumlusuna bir veri deposu kaydedebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci doğrudan şu işlevlerden birini çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.

register_azure_file_share

Azure Dosya Paylaşımı'nı veri deposuna kaydedin.

SAS Belirteci veya Depolama Hesabı Anahtarı kullanmayı seçebilirsiniz

register_azure_my_sql

Yeni bir Azure MySQL Veri Deposu başlatın.

MySQL veri deposu yalnızca Azure Machine Learning işlem hatlarında DataTransferStep'e giriş ve çıkış olarak DataReference oluşturmak için kullanılabilir. Daha fazla ayrıntıya buradan ulaşabilirsiniz.

Azure MySQL veritabanını Veri Deposu olarak kaydetme örneği için lütfen aşağıya bakın.

register_azure_postgre_sql

Yeni bir Azure PostgreSQL Veri Deposu başlatın.

Azure PostgreSQL veritabanını Veri Deposu olarak kaydetme örneği için lütfen aşağıya bakın.

register_azure_sql_database

Yeni bir Azure SQL veritabanı Veri Deposu başlatın.

Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir; Hizmet Sorumlusu veya kullanıcı adı + parola kullanmayı seçebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci şu işlevlerden birini doğrudan çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.

Azure SQL veritabanını Veri Deposu olarak kaydetme örneği için lütfen aşağıya bakın.

register_dbfs

Yeni bir Databricks Dosya Sistemi (DBFS) veri deposu başlatın.

DBFS veri deposu yalnızca Giriş olarak DataReference ve Azure Machine Learning işlem hatlarında DatabricksStep çıkışı olarak PipelineData oluşturmak için kullanılabilir. Daha fazla ayrıntıya buradan ulaşabilirsiniz..

register_hdfs

Not

Bu deneysel bir yöntemdir ve herhangi bir zamanda değişebilir. Daha fazla bilgi için lütfen bkz. https://aka.ms/azuremlexperimental.

Yeni bir HDFS veri deposu başlatın.

set_as_default

Varsayılan veri depoyu ayarlayın.

unregister

Veri deposunun kaydını kaldırıyor. temel depolama hizmeti silinmez.

get

Ada göre bir veri deposu alın. Bu, oluşturucuyu çağırmakla aynıdır.

static get(workspace, datastore_name)

Parametreler

workspace
Workspace
Gerekli

Çalışma alanı.

datastore_name
str, <xref:optional>
Gerekli

Veri deposunun adı varsayılan olarak Yok olur ve bu da varsayılan veri depolarını alır.

Döndürülenler

Bu ad için karşılık gelen veri deposu.

Dönüş türü

get_default

Çalışma alanı için varsayılan veri depolarını alın.

static get_default(workspace)

Parametreler

workspace
Workspace
Gerekli

Çalışma alanı.

Döndürülenler

Çalışma alanı için varsayılan veri deposu

Dönüş türü

register_azure_blob_container

Veri deposuna bir Azure Blob Kapsayıcısı kaydedin.

Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir; SAS Belirteci veya Depolama Hesabı Anahtarı'nı kullanmayı seçebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci doğrudan şu işlevlerden birini çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.

static register_azure_blob_container(workspace, datastore_name, container_name, account_name, sas_token=None, account_key=None, protocol=None, endpoint=None, overwrite=False, create_if_not_exists=False, skip_validation=False, blob_cache_timeout=None, grant_workspace_access=False, subscription_id=None, resource_group=None)

Parametreler

workspace
Workspace
Gerekli

Çalışma alanı.

datastore_name
str
Gerekli

Büyük/küçük harfe duyarlı olmayan veri deposunun adı yalnızca alfasayısal karakterler ve _içerebilir.

container_name
str
Gerekli

Azure blob kapsayıcısının adı.

account_name
str
Gerekli

Depolama hesabı adı.

sas_token
str, <xref:optional>
varsayılan değer: None

Hesap SAS belirteci varsayılan olarak Yok olarak ayarlanır. Veri okuma için Kapsayıcılar & Nesneleri için Liste & Okuma izinleri ve veri yazma için de Yazma & Ekle izinleri gerekir.

account_key
str, <xref:optional>
varsayılan değer: None

Depolama hesabınızın erişim anahtarları varsayılan olarak Yok olarak ayarlanır.

protocol
str, <xref:optional>
varsayılan değer: None

Blob kapsayıcısına bağlanmak için kullanılacak protokol. Hiçbiri ise, varsayılan olarak https olur.

endpoint
str, <xref:optional>
varsayılan değer: None

Depolama hesabının uç noktası. Hiçbiri ise, varsayılan olarak core.windows.net olur.

overwrite
bool, <xref:optional>
varsayılan değer: False

varolan bir veri deposu üzerine yazar. Veri deposu yoksa, bir veri deposu oluşturur ve varsayılan olarak False olur

create_if_not_exists
bool, <xref:optional>
varsayılan değer: False

yoksa blob kapsayıcısını oluşturun, varsayılan değer False'tur

skip_validation
bool, <xref:optional>
varsayılan değer: False

depolama anahtarlarının doğrulamasını atlar, varsayılan değer False'tur

blob_cache_timeout
int, <xref:optional>
varsayılan değer: None

Bu blob bağlandığında önbellek zaman aşımını şu kadar saniye olarak ayarlayın. Hiçbiri ise, varsayılan olarak zaman aşımı yoktur (bloblar okunduğunda iş süresi boyunca önbelleğe alınır).

grant_workspace_access
bool, <xref:optional>
varsayılan değer: False

Varsayılan değer False'tur. Machine Learning Studio'dan sanal ağın arkasındaki verilere erişmek için True olarak ayarlayın.Bu, Machine Learning Studio'dan veri erişiminin kimlik doğrulaması için çalışma alanı yönetilen kimliğini kullanmasını sağlar ve çalışma alanı tarafından yönetilen kimliği depolamanın Okuyucusu olarak ekler. Kabul etmek için depolama alanının sahibi veya kullanıcı erişim yöneticisi olmanız gerekir. Gerekli izne sahip değilseniz yöneticinizden bunu sizin için yapılandırmasını isteyin. Daha fazla bilgi edinin 'https://docs.microsoft.com/azure/machine-learning/how-to-enable-studio-virtual-network'

subscription_id
str, <xref:optional>
varsayılan değer: None

Depolama hesabının abonelik kimliği varsayılan olarak Yok olarak ayarlanır.

resource_group
str, <xref:optional>
varsayılan değer: None

Depolama hesabının kaynak grubu varsayılan olarak Yok olarak ayarlanır.

Döndürülenler

Blob veri deposu.

Dönüş türü

Açıklamalar

Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliıyorsanız, bu daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.

register_azure_data_lake

Yeni bir Azure Data Lake Datastore başlatın.

Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir. Kimlik bilgisi tabanlı veri erişimi için hizmet sorumlusuna bir veri deposu kaydedebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci doğrudan şu işlevlerden birini çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.

Azure Data Lake 1. Nesil'i Datastore olarak kaydetme örneği için lütfen aşağıya bakın.


   adlsgen1_datastore_name='adlsgen1datastore'

   store_name=os.getenv("ADL_STORENAME", "<my_datastore_name>") # the ADLS name
   subscription_id=os.getenv("ADL_SUBSCRIPTION", "<my_subscription_id>") # subscription id of the ADLS
   resource_group=os.getenv("ADL_RESOURCE_GROUP", "<my_resource_group>") # resource group of ADLS
   tenant_id=os.getenv("ADL_TENANT", "<my_tenant_id>") # tenant id of service principal
   client_id=os.getenv("ADL_CLIENTID", "<my_client_id>") # client id of service principal
   client_secret=os.getenv("ADL_CLIENT_SECRET", "<my_client_secret>") # the secret of service principal

   adls_datastore = Datastore.register_azure_data_lake(
       workspace=ws,
       datastore_name=aslsgen1_datastore_name,
       subscription_id=subscription_id, # subscription id of ADLS account
       resource_group=resource_group, # resource group of ADLS account
       store_name=store_name, # ADLS account name
       tenant_id=tenant_id, # tenant id of service principal
       client_id=client_id, # client id of service principal
       client_secret=client_secret) # the secret of service principal
static register_azure_data_lake(workspace, datastore_name, store_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, subscription_id=None, resource_group=None, overwrite=False, grant_workspace_access=False)

Parametreler

workspace
Workspace
Gerekli

Bu veri deposunun ait olduğu çalışma alanı.

datastore_name
str
Gerekli

Veri deposu adı.

store_name
str
Gerekli

ADLS depolama adı.

tenant_id
str, <xref:optional>
varsayılan değer: None

Verilere erişmek için kullanılan hizmet sorumlusunun Dizin Kimliği/Kiracı Kimliği.

client_id
str, <xref:optional>
varsayılan değer: None

Verilere erişmek için kullanılan hizmet sorumlusunun İstemci Kimliği/Uygulama Kimliği.

client_secret
str, <xref:optional>
varsayılan değer: None

Verilere erişmek için kullanılan hizmet sorumlusunun İstemci Gizli Anahtarı.

resource_url
str, <xref:optional>
varsayılan değer: None

Data Lake deposunda gerçekleştirilecek işlemleri belirleyen kaynak URL'si ( Yok ise), varsayılan olarak https://datalake.azure.net/ dosya sistemi işlemlerini gerçekleştirmemize olanak tanır.

authority_url
str, <xref:optional>
varsayılan değer: None

Kullanıcının kimliğini doğrulamak için kullanılan yetkili URL'si varsayılan olarak kullanılır https://login.microsoftonline.com.

subscription_id
str, <xref:optional>
varsayılan değer: None

ADLS deposunun ait olduğu aboneliğin kimliği.

resource_group
str, <xref:optional>
varsayılan değer: None

ADLS deposunun ait olduğu kaynak grubu.

overwrite
bool, <xref:optional>
varsayılan değer: False

Var olan bir veri deposu üzerine yazıp yazılmayacağı. Veri deposu yoksa bir veri deposu oluşturur. Varsayılan değer False'tur.

grant_workspace_access
bool, <xref:optional>
varsayılan değer: False

Varsayılan değer False'tur. Machine Learning Studio'dan sanal ağın arkasındaki verilere erişmek için True olarak ayarlayın.Bu, Machine Learning Studio'dan veri erişiminin kimlik doğrulaması için çalışma alanı yönetilen kimliğini kullanmasını sağlar ve çalışma alanı tarafından yönetilen kimliği depolamanın Okuyucusu olarak ekler. Kabul etmek için depolama alanının Sahibi veya Kullanıcı Erişimi Yöneticisi olmanız gerekir. Gerekli izne sahip değilseniz yöneticinizden bunu sizin için yapılandırmasını isteyin. Daha fazla bilgi edinin 'https://docs.microsoft.com/azure/machine-learning/how-to-enable-studio-virtual-network'

Döndürülenler

Azure Data Lake Datastore döndürür.

Dönüş türü

Açıklamalar

Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliıyorsanız, bu daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.

Not

Azure Data Lake Datastore, Azure Machine Learning İşlem Hatlarını kullanarak veri aktarımını ve U-Sql işlerini çalıştırmayı destekler.

Azure Machine Learning Veri Kümesi için desteklenen herhangi bir işlemden indirilebilen veya bağlanabilen bir veri kaynağı olarak da kullanabilirsiniz.

register_azure_data_lake_gen2

Yeni bir Azure Data Lake 2. Nesil Veri Deposu başlatın.

Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir. Kimlik bilgisi tabanlı veri erişimi için hizmet sorumlusuna bir veri deposu kaydedebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci doğrudan şu işlevlerden birini çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.

static register_azure_data_lake_gen2(workspace, datastore_name, filesystem, account_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, protocol=None, endpoint=None, overwrite=False, subscription_id=None, resource_group=None, grant_workspace_access=False)

Parametreler

workspace
Workspace
Gerekli

Bu veri deposunun ait olduğu çalışma alanı.

datastore_name
str
Gerekli

Veri deposu adı.

filesystem
str
Gerekli

Data Lake 2. Nesil dosya sisteminin adı.

account_name
str
Gerekli

Depolama hesabı adı.

tenant_id
str, <xref:optional>
varsayılan değer: None

Hizmet sorumlusunun Dizin Kimliği/Kiracı Kimliği.

client_id
str, <xref:optional>
varsayılan değer: None

Hizmet sorumlusunun İstemci Kimliği/Uygulama Kimliği.

client_secret
str, <xref:optional>
varsayılan değer: None

Hizmet sorumlusunun sırrı.

resource_url
str, <xref:optional>
varsayılan değer: None

Data Lake Store'da gerçekleştirilecek işlemleri belirleyen kaynak URL'si, varsayılan olarak https://storage.azure.com/ dosya sistemi işlemlerini gerçekleştirmemize olanak tanır.

authority_url
str, <xref:optional>
varsayılan değer: None

Kullanıcının kimliğini doğrulamak için kullanılan yetkili URL'si varsayılan olarak kullanılır https://login.microsoftonline.com.

protocol
str, <xref:optional>
varsayılan değer: None

Blob kapsayıcısına bağlanmak için kullanılacak protokol. Hiçbiri ise, varsayılan olarak https olur.

endpoint
str, <xref:optional>
varsayılan değer: None

Depolama hesabının uç noktası. Hiçbiri ise, varsayılan olarak core.windows.net olur.

overwrite
bool, <xref:optional>
varsayılan değer: False

Var olan bir veri deposu üzerine yazıp yazılmayacağı. Veri deposu yoksa bir veri deposu oluşturur. Varsayılan değer False'tur.

subscription_id
str, <xref:optional>
varsayılan değer: None

ADLS deposunun ait olduğu aboneliğin kimliği.

resource_group
str, <xref:optional>
varsayılan değer: None

ADLS deposunun ait olduğu kaynak grubu.

grant_workspace_access
bool, <xref:optional>
varsayılan değer: False

Varsayılan değer False'tur. Machine Learning Studio'dan sanal ağın arkasındaki verilere erişmek için True olarak ayarlayın.Bu, Machine Learning Studio'dan veri erişiminin kimlik doğrulaması için çalışma alanı yönetilen kimliğini kullanmasını sağlar ve çalışma alanı tarafından yönetilen kimliği depolamanın Okuyucusu olarak ekler. Kabul etmek için depolama alanının sahibi veya kullanıcı erişim yöneticisi olmanız gerekir. Gerekli izne sahip değilseniz yöneticinizden bunu sizin için yapılandırmasını isteyin. Daha fazla bilgi edinin 'https://docs.microsoft.com/azure/machine-learning/how-to-enable-studio-virtual-network'

Döndürülenler

Azure Data Lake 2. Nesil Veri deposu döndürür.

Dönüş türü

Açıklamalar

Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliıyorsanız, bu daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.

register_azure_file_share

Azure Dosya Paylaşımı'nı veri deposuna kaydedin.

SAS Belirteci veya Depolama Hesabı Anahtarı kullanmayı seçebilirsiniz

static register_azure_file_share(workspace, datastore_name, file_share_name, account_name, sas_token=None, account_key=None, protocol=None, endpoint=None, overwrite=False, create_if_not_exists=False, skip_validation=False)

Parametreler

workspace
Workspace
Gerekli

Bu veri deposunun ait olduğu çalışma alanı.

datastore_name
str
Gerekli

Büyük/küçük harfe duyarlı olmayan veri deposunun adı yalnızca alfasayısal karakterler ve _içerebilir.

file_share_name
str
Gerekli

Azure dosya kapsayıcısının adı.

account_name
str
Gerekli

Depolama hesabı adı.

sas_token
str, <xref:optional>
varsayılan değer: None

Hesap SAS belirteci varsayılan olarak Yok olarak ayarlanır. Veri okuma için Kapsayıcılar & Nesneleri için Liste & Okuma izinleri ve veri yazma için de Yazma & Ekle izinleri gerekir.

account_key
str, <xref:optional>
varsayılan değer: None

Depolama hesabınızın erişim anahtarları varsayılan olarak Yok olarak ayarlanır.

protocol
str, <xref:optional>
varsayılan değer: None

Dosya paylaşımına bağlanmak için kullanılacak protokol. Hiçbiri ise, varsayılan olarak https olur.

endpoint
str, <xref:optional>
varsayılan değer: None

Dosya paylaşımının uç noktası. Hiçbiri ise, varsayılan olarak core.windows.net olur.

overwrite
bool, <xref:optional>
varsayılan değer: False

Var olan bir veri deposu üzerine yazıp yazılmayacağı. Veri deposu yoksa bir veri deposu oluşturur. Varsayılan değer False'tur.

create_if_not_exists
bool, <xref:optional>
varsayılan değer: False

Dosya paylaşımı yoksa oluşturulup oluşturulmayacağı. Varsayılan değer False'tur.

skip_validation
bool, <xref:optional>
varsayılan değer: False

Depolama anahtarlarını doğrulamanın atlanıp atlanmadığı. Varsayılan değer False'tur.

Döndürülenler

Dosya veri deposu.

Dönüş türü

Açıklamalar

Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliıyorsanız, bu daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.

register_azure_my_sql

Yeni bir Azure MySQL Veri Deposu başlatın.

MySQL veri deposu yalnızca Azure Machine Learning işlem hatlarında DataTransferStep'e giriş ve çıkış olarak DataReference oluşturmak için kullanılabilir. Daha fazla ayrıntıya buradan ulaşabilirsiniz.

Azure MySQL veritabanını Veri Deposu olarak kaydetme örneği için lütfen aşağıya bakın.

static register_azure_my_sql(workspace, datastore_name, server_name, database_name, user_id, user_password, port_number=None, endpoint=None, overwrite=False, **kwargs)

Parametreler

workspace
Workspace
Gerekli

Bu veri deposunun ait olduğu çalışma alanı.

datastore_name
str
Gerekli

Veri deposu adı.

server_name
str
Gerekli

MySQL sunucu adı.

database_name
str
Gerekli

MySQL veritabanı adı.

user_id
str
Gerekli

MySQL sunucusunun Kullanıcı Kimliği.

user_password
str
Gerekli

MySQL sunucusunun kullanıcı parolası.

port_number
str
varsayılan değer: None

MySQL sunucusunun bağlantı noktası numarası.

endpoint
str, <xref:optional>
varsayılan değer: None

MySQL sunucusunun uç noktası. Hiçbiri ise varsayılan olarak mysql.database.azure.com.

overwrite
bool, <xref:optional>
varsayılan değer: False

Var olan bir veri deposu üzerine yazıp yazılmayacağı. Veri deposu yoksa bir veri deposu oluşturur. Varsayılan değer False'tur.

Döndürülenler

MySQL veritabanı Veri deposu döndürür.

Dönüş türü

Açıklamalar

Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliıyorsanız, bu daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.


   mysql_datastore_name="mysqldatastore"
   server_name=os.getenv("MYSQL_SERVERNAME", "<my_server_name>") # FQDN name of the MySQL server
   database_name=os.getenv("MYSQL_DATBASENAME", "<my_database_name>") # Name of the MySQL database
   user_id=os.getenv("MYSQL_USERID", "<my_user_id>") # The User ID of the MySQL server
   user_password=os.getenv("MYSQL_USERPW", "<my_user_password>") # The user password of the MySQL server.

   mysql_datastore = Datastore.register_azure_my_sql(
       workspace=ws,
       datastore_name=mysql_datastore_name,
       server_name=server_name,
       database_name=database_name,
       user_id=user_id,
       user_password=user_password)

register_azure_postgre_sql

Yeni bir Azure PostgreSQL Veri Deposu başlatın.

Azure PostgreSQL veritabanını Veri Deposu olarak kaydetme örneği için lütfen aşağıya bakın.

static register_azure_postgre_sql(workspace, datastore_name, server_name, database_name, user_id, user_password, port_number=None, endpoint=None, overwrite=False, enforce_ssl=True, **kwargs)

Parametreler

workspace
Workspace
Gerekli

Bu veri deposunun ait olduğu çalışma alanı.

datastore_name
str
Gerekli

Veri deposu adı.

server_name
str
Gerekli

PostgreSQL sunucu adı.

database_name
str
Gerekli

PostgreSQL veritabanı adı.

user_id
str
Gerekli

PostgreSQL sunucusunun Kullanıcı Kimliği.

user_password
str
Gerekli

PostgreSQL sunucusunun Kullanıcı Parolası.

port_number
str
varsayılan değer: None

PostgreSQL sunucusunun Bağlantı Noktası Numarası

endpoint
str, <xref:optional>
varsayılan değer: None

PostgreSQL sunucusunun uç noktası. Hiçbiri ise, varsayılan olarak postgres.database.azure.com olur.

overwrite
bool, <xref:optional>
varsayılan değer: False

Var olan bir veri deposu üzerine yazıp yazılmayacağı. Veri deposu yoksa bir veri deposu oluşturur. Varsayılan değer False'tur.

enforce_ssl
bool
varsayılan değer: True

PostgreSQL sunucusunun SSL gereksinimini gösterir. Varsayılan değer True'dır.

Döndürülenler

PostgreSQL veritabanı Veri deposu döndürür.

Dönüş türü

Açıklamalar

Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliıyorsanız, bu daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.


   psql_datastore_name="postgresqldatastore"
   server_name=os.getenv("PSQL_SERVERNAME", "<my_server_name>") # FQDN name of the PostgreSQL server
   database_name=os.getenv("PSQL_DATBASENAME", "<my_database_name>") # Name of the PostgreSQL database
   user_id=os.getenv("PSQL_USERID", "<my_user_id>") # The database user id
   user_password=os.getenv("PSQL_USERPW", "<my_user_password>") # The database user password

   psql_datastore = Datastore.register_azure_postgre_sql(
       workspace=ws,
       datastore_name=psql_datastore_name,
       server_name=server_name,
       database_name=database_name,
       user_id=user_id,
       user_password=user_password)

register_azure_sql_database

Yeni bir Azure SQL veritabanı Veri Deposu başlatın.

Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir; Hizmet Sorumlusu veya kullanıcı adı + parola kullanmayı seçebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci şu işlevlerden birini doğrudan çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.

Azure SQL veritabanını Veri Deposu olarak kaydetme örneği için lütfen aşağıya bakın.

static register_azure_sql_database(workspace, datastore_name, server_name, database_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, endpoint=None, overwrite=False, username=None, password=None, subscription_id=None, resource_group=None, grant_workspace_access=False, **kwargs)

Parametreler

workspace
Workspace
Gerekli

Bu veri deposunun ait olduğu çalışma alanı.

datastore_name
str
Gerekli

Veri deposu adı.

server_name
str
Gerekli

SQL server adı. "sample.database.windows.net" gibi tam etki alanı adı için server_name değeri "örnek" ve uç nokta değeri "database.windows.net" olmalıdır.

database_name
str
Gerekli

SQL veritabanı adı.

tenant_id
str
varsayılan değer: None

Hizmet sorumlusunun Dizin Kimliği/Kiracı Kimliği.

client_id
str
varsayılan değer: None

Hizmet sorumlusunun İstemci Kimliği/Uygulama Kimliği.

client_secret
str
varsayılan değer: None

Hizmet sorumlusunun gizli dizisi.

resource_url
str, <xref:optional>
varsayılan değer: None

Sql veritabanı deposunda gerçekleştirilecek işlemleri belirleyen kaynak URL'si ( Yok ise) varsayılan olarak https://database.windows.net/kullanılır.

authority_url
str, <xref:optional>
varsayılan değer: None

Kullanıcının kimliğini doğrulamak için kullanılan yetkili URL'si varsayılan olarak kullanılır https://login.microsoftonline.com.

endpoint
str, <xref:optional>
varsayılan değer: None

SQL sunucusunun uç noktası. Hiçbiri ise, varsayılan olarak database.windows.net olur.

overwrite
bool, <xref:optional>
varsayılan değer: False

Var olan bir veri deposuna yazıp yazmayacağınız. Veri deposu yoksa bir tane oluşturur. Varsayılan değer False'tur.

username
str
varsayılan değer: None

Veritabanına erişmek için veritabanı kullanıcısının kullanıcı adı.

password
str
varsayılan değer: None

Veritabanına erişmek için veritabanı kullanıcısının parolası.

skip_validation
bool, <xref:optional>
Gerekli

SQL veritabanına bağlanma doğrulamasının atlanıp atlanmadığı. Varsayılan değer False'tur.

subscription_id
str, <xref:optional>
varsayılan değer: None

ADLS deposunun ait olduğu aboneliğin kimliği.

resource_group
str, <xref:optional>
varsayılan değer: None

ADLS deposunun ait olduğu kaynak grubu.

grant_workspace_access
bool, <xref:optional>
varsayılan değer: False

Varsayılan değer False'tur. Machine Learning Studio'dan sanal ağın arkasındaki verilere erişmek için Bunu True olarak ayarlayın.Bu, Machine Learning Studio'dan veri erişiminin kimlik doğrulaması için çalışma alanı yönetilen kimliğini kullanmasını sağlar ve çalışma alanı yönetilen kimliğini depolamanın Okuyucusu olarak ekler. Kabul etmek için depolama alanının sahibi veya kullanıcı erişim yöneticisi olmanız gerekir. Gerekli izne sahip değilseniz yöneticinizden bunu sizin için yapılandırmasını isteyin. Daha fazla bilgi edinin 'https://docs.microsoft.com/azure/machine-learning/how-to-enable-studio-virtual-network'

Döndürülenler

SQL veritabanı Veri Deposu'nı döndürür.

Dönüş türü

Açıklamalar

Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliiyorsanız daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.


   sql_datastore_name="azuresqldatastore"
   server_name=os.getenv("SQL_SERVERNAME", "<my_server_name>") # Name of the Azure SQL server
   database_name=os.getenv("SQL_DATABASENAME", "<my_database_name>") # Name of the Azure SQL database
   username=os.getenv("SQL_USER_NAME", "<my_sql_user_name>") # The username of the database user.
   password=os.getenv("SQL_USER_PASSWORD", "<my_sql_user_password>") # The password of the database user.

   sql_datastore = Datastore.register_azure_sql_database(
       workspace=ws,
       datastore_name=sql_datastore_name,
       server_name=server_name,  # name should not contain fully qualified domain endpoint
       database_name=database_name,
       username=username,
       password=password,
       endpoint='database.windows.net')

register_dbfs

Yeni bir Databricks Dosya Sistemi (DBFS) veri deposu başlatın.

DBFS veri deposu yalnızca Giriş olarak DataReference ve Azure Machine Learning işlem hatlarında DatabricksStep çıkışı olarak PipelineData oluşturmak için kullanılabilir. Daha fazla ayrıntıya buradan ulaşabilirsiniz..

static register_dbfs(workspace, datastore_name)

Parametreler

workspace
Workspace
Gerekli

Bu veri deposunun ait olduğu çalışma alanı.

datastore_name
str
Gerekli

Veri deposu adı.

Döndürülenler

DBFS Veri Deposu'nı döndürür.

Dönüş türü

Açıklamalar

Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliiyorsanız daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.

register_hdfs

Not

Bu deneysel bir yöntemdir ve herhangi bir zamanda değişebilir. Daha fazla bilgi için lütfen bkz. https://aka.ms/azuremlexperimental.

Yeni bir HDFS veri deposu başlatın.

static register_hdfs(workspace, datastore_name, protocol, namenode_address, hdfs_server_certificate, kerberos_realm, kerberos_kdc_address, kerberos_principal, kerberos_keytab=None, kerberos_password=None, overwrite=False)

Parametreler

workspace
Workspace
Gerekli

bu veri deposunun ait olduğu çalışma alanı

datastore_name
str
Gerekli

veri deposu adı

protocol
str veya <xref:_restclient.models.enum>
Gerekli

HDFS kümesiyle iletişim kurarken kullanılacak protokol. http veya https. Olası değerler şunlardır: 'http', 'https'

namenode_address
str
Gerekli

HDFS ad düğümünün IP adresi veya DNS ana bilgisayar adı. İsteğe bağlı olarak bir bağlantı noktası içerir.

hdfs_server_certificate
str, <xref:optional>
Gerekli

OTOMATIK olarak imzalanan bir sertifikayla TLS kullanılıyorsa HDFS ad düğümünün TLS imzalama sertifikasının yolu.

kerberos_realm
str
Gerekli

Kerberos bölgesi.

kerberos_kdc_address
str
Gerekli

Kerberos KDC'sinin IP adresi veya DNS ana bilgisayar adı.

kerberos_principal
str
Gerekli

Kimlik doğrulaması ve yetkilendirme için kullanılacak Kerberos sorumlusu.

kerberos_keytab
str, <xref:optional>
Gerekli

Kerberos sorumlusuna karşılık gelen anahtarları içeren anahtar sekmesi dosyasının yolu. Bunu veya parolayı belirtin.

kerberos_password
str, <xref:optional>
Gerekli

Kerberos sorumlusuna karşılık gelen parola. Bunu veya bir tuş sekmesi dosyasının yolunu belirtin.

overwrite
bool, <xref:optional>
Gerekli

varolan bir veri deposu üzerine yazar. Veri deposu yoksa bir tane oluşturur. Varsayılan değer False'tur.

set_as_default

Varsayılan veri depoyu ayarlayın.

set_as_default()

Parametreler

datastore_name
str
Gerekli

Veri deposunun adı.

unregister

Veri deposunun kaydını kaldırıyor. temel depolama hizmeti silinmez.

unregister()