Öğretici: Veri ürünü toplu işlemini ayarlama
Bu öğreticide, zaten dağıtılmış olan veri ürün hizmetlerini ayarlamayı öğrenin. Verilerinizi tümleştirmek ve yönetmek için Azure Data Factory'yi ve veri varlıklarını keşfetmek, yönetmek ve yönetmek için Microsoft Purview'u kullanın.
Şunları nasıl yapacağınızı öğrenin:
- Gerekli kaynakları oluşturma ve dağıtma
- Rol atama ve erişim izinleri
- Veri tümleştirmesi için kaynakları Bağlan
Bu öğretici, örnek veri ürünü kaynak grubunda dağıtılan <DMLZ-prefix>-dev-dp001
hizmetleri tanımanıza yardımcı olur. Azure hizmetleri arabiriminin birbirleriyle nasıl ve hangi güvenlik önlemlerinin yerinde olduğunu deneyimleyin.
Yeni bileşenleri dağıtırken Purview'un hizmet idaresini nasıl bağlayarak veri ortamınızın bütünsel, güncel bir haritasını oluşturacağını araştırma fırsatınız olur. Sonuç olarak otomatik veri bulma, hassas veri sınıflandırması ve uçtan uca veri kökeni elde edilir.
Önkoşullar
Veri ürünü toplu işleminizi ayarlamaya başlamadan önce şu önkoşulları karşıladığınızdan emin olun:
Azure aboneliği. Azure aboneliğiniz yoksa azure ücretsiz hesabınızı bugün oluşturun.
Azure aboneliği izinleri. Dağıtım için Purview ve Azure Synapse Analytics'i ayarlamak için Azure aboneliğinde Kullanıcı Erişimi Yönetici istrator rolüne veya Sahip rolüne sahip olmanız gerekir. Öğreticide hizmetler ve hizmet sorumluları için daha fazla rol ataması ayarlayacaksınız.
Dağıtılan kaynaklar. Öğreticiyi tamamlamak için bu kaynakların Azure aboneliğinizde zaten dağıtılması gerekir:
- Veri yönetimi giriş bölgesi. Daha fazla bilgi için bkz . Veri yönetimi giriş bölgesi GitHub deposu.
- Veri giriş bölgesi. Daha fazla bilgi için bkz . Veri giriş bölgesi GitHub deposu.
- Veri ürünü toplu işlemi. Daha fazla bilgi için bkz . Veri ürünü toplu işlemi GitHub deposu.
Microsoft Purview hesabı. Hesap, veri yönetimi giriş bölgesi dağıtımınızın bir parçası olarak oluşturulur.
Şirket içinde barındırılan tümleştirme çalışma zamanı. Çalışma zamanı, veri giriş bölgesi dağıtımınızın bir parçası olarak oluşturulur.
Not
Bu öğreticide yer tutucular, öğreticiye başlamadan önce dağıttığınız önkoşul kaynaklarına başvurur:
<DMLZ-prefix>
, veri yönetimi giriş bölgesi dağıtımınızı oluştururken girdiğiniz ön eki ifade eder.<DLZ-prefix>
, veri giriş bölgesi dağıtımınızı oluştururken girdiğiniz ön eki ifade eder.<DP-prefix>
, veri ürünü toplu dağıtımınızı oluştururken girdiğiniz ön eki ifade eder.
Azure SQL Veritabanı örnekleri oluşturma
Bu öğreticiye başlamak için iki örnek SQL Veritabanı örneği oluşturun. Sonraki bölümlerde CRM ve ERP veri kaynaklarının benzetimini yapmak için veritabanlarını kullanacaksınız.
Azure portalında, portal genel denetimlerinde Cloud Shell simgesini seçerek bir Azure Cloud Shell terminali açın. Terminal türü için Bash'i seçin.
Cloud Shell'de aşağıdaki betiği çalıştırın. Betik, kaynak grubunda yer alan
<DLZ-prefix>-dev-dp001
kaynak grubunu ve<DP-prefix>-dev-sqlserver001
Azure SQL sunucusunu bulur. Ardından betik sunucuda iki SQL Veritabanı örneği<DP-prefix>-dev-sqlserver001
oluşturur. Veritabanları AdventureWorks örnek verileriyle önceden doldurulur. Veriler, bu öğreticide kullandığınız tabloları içerir.Parametre yer tutucu değerini kendi Azure abonelik kimliğiniz ile değiştirdiğinizden
subscription
emin olun.# Azure SQL Database instances setup # Create the AdatumCRM and AdatumERP databases to simulate customer and sales data. # Use the ID for the Azure subscription you used to deployed the data product. az account set --subscription "<your-subscription-ID>" # Get the resource group for the data product. resourceGroupName=$(az group list -o tsv --query "[?contains(@.name, 'dp001')==\`true\`].name") # Get the existing Azure SQL Database server name. sqlServerName=$(az sql server list -g $resourceGroupName -o tsv --query "[?contains(@.name, 'sqlserver001')==\`true\`].name") # Create the first SQL Database instance, AdatumCRM, to create the customer's data source. az sql db create --resource-group $resourceGroupName --server $sqlServerName --name AdatumCRM --service-objective Basic --sample-name AdventureWorksLT # Create the second SQL Database instance, AdatumERP, to create the sales data source. az sql db create --resource-group $resourceGroupName --server $sqlServerName --name AdatumERP --service-objective Basic --sample-name AdventureWorksLT
Betiğin çalışması tamamlandığında, <DP-prefix>-dev-sqlserver001
Azure SQL sunucusunda iki yeni SQL Veritabanı örneğiniz ve AdatumERP
vardırAdatumCRM
. Her iki veritabanı da Temel işlem katmanındadır. Veritabanları, veri ürünü toplu işlemini dağıtmak için kullandığınız kaynak grubunda bulunur <DLZ-prefix>-dev-dp001
.
Purview'u veri ürünü toplu işlemini kataloglaya ayarlama
Ardından, purview'u veri ürünü toplu işlemini kataloglayacak şekilde ayarlama adımlarını tamamlayın. Bir hizmet sorumlusu oluşturarak başlarsınız. Ardından gerekli kaynakları ayarlar, roller ve erişim izinleri atarsınız.
Hizmet sorumlusu oluşturma
Azure portalında, portal genel denetimlerinde Cloud Shell simgesini seçerek bir Azure Cloud Shell terminali açın. Terminal türü için Bash'i seçin.
Aşağıdaki betiği düzeltin:
subscriptionId
Parametre yer tutucu değerini kendi Azure abonelik kimliğiniz ile değiştirin.spname
Parametre yer tutucu değerini hizmet sorumlunuz için kullanmak istediğiniz adla değiştirin. Hizmet asıl adı abonelikte benzersiz olmalıdır.
Parametre değerlerini güncelleştirdikten sonra betiği Cloud Shell'de çalıştırın.
# Replace the parameter values with the name you want to use for your service principal name and your Azure subscription ID. spname="<your-service-principal-name>" subscriptionId="<your-subscription-id>" # Set the scope to the subscription. scope="/subscriptions/$subscriptionId" # Create the service principal. az ad sp create-for-rbac \ --name $spname \ --role "Contributor" \ --scope $scope
Aşağıdaki örneğe benzer bir sonuç için JSON çıkışını denetleyin. Sonraki adımlarda kullanmak üzere çıkıştaki değerleri not edin veya kopyalayın.
{ "appId": "<your-app-id>", "displayName": "<service-principal-display-name>", "name": "<your-service-principal-name>", "password": "<your-service-principal-password>", "tenant": "<your-tenant>" }
Hizmet sorumlusu erişimini ve izinlerini ayarlama
Önceki adımda oluşturulan JSON çıkışından aşağıdaki döndürülen değerleri alın:
- Hizmet sorumlusu kimliği (
appId
) - Hizmet sorumlusu anahtarı (
password
)
Hizmet sorumlusu aşağıdaki izinlere sahip olmalıdır:
- Depolama hesaplarında Blob Veri Okuyucusu rolünü Depolama.
- SQL Veritabanı örnekleri üzerinde Veri Okuyucu izinleri.
Hizmet sorumlusunu gerekli rol ve izinlerle ayarlamak için aşağıdaki adımları tamamlayın.
Azure Depolama hesabı izinleri
Azure portalında Azure Depolama hesabına gidin
<DLZ-prefix>devraw
. Kaynak menüsünde Erişim Denetimi (IAM) öğesini seçin.Ekle>Rol ataması ekle’yi seçin.
Rol ataması ekle'nin Rol sekmesinde Blob Veri Okuyucusu'Depolama arayın ve seçin. Ardından İleri'yi seçin.
Üyeler'de Üye seç'i seçin.
Üyeleri seçin bölümünde, oluşturduğunuz hizmet sorumlusunun adını arayın.
Arama sonuçlarında hizmet sorumlusunu ve ardından Seç'i seçin.
Rol atamasını tamamlamak için Gözden geçir ve ata'yı iki kez seçin.
Kalan depolama hesapları için bu bölümdeki adımları yineleyin:
<DLZ-prefix>devencur
<DLZ-prefix>devwork
SQL Veritabanı izinleri
SQL Veritabanı izinlerini ayarlamak için sorgu düzenleyicisini kullanarak Azure SQL sanal makinesine bağlanırsınız. Tüm kaynaklar özel bir uç noktanın arkasında olduğundan, önce Bir Azure Bastion konak sanal makinesi kullanarak Azure portalında oturum açmanız gerekir.
Azure portalında, kaynak grubunda dağıtılan sanal makineye bağlanın <DMLZ-prefix>-dev-bastion
. Bastion konak hizmetini kullanarak sanal makineye nasıl bağlanabileceğinizden emin değilseniz bkz. VM'ye Bağlan.
Hizmet sorumlusunu veritabanına kullanıcı olarak eklemek için önce kendinizi Microsoft Entra yöneticisi olarak eklemeniz gerekebilir. 1. ve 2. adımlarda kendinizi Microsoft Entra yöneticisi olarak eklersiniz. 3- 5. adımlarda, hizmet sorumlusuna bir veritabanı için izinler verirsiniz. Bastion ana bilgisayar sanal makinesinden portalda oturum açtığınızda, Azure portalında Azure SQL sanal makinelerini arayın.
Azure SQL sanal makinesine
<DP-prefix>-dev-sqlserver001
gidin. Ayarlar altındaki kaynak menüsünde Microsoft Entra ID'yi seçin.Komut çubuğunda Yönetici ayarla'yı seçin. Kendi hesabınızı arayın ve seçin. Seç'i seçin.
Kaynak menüsünde SQL veritabanları'nı
AdatumCRM
ve ardından veritabanını seçin.AdatumCRM kaynak menüsünde Sorgu düzenleyicisi (önizleme) öğesini seçin. Oturum açmak için Active Directory kimlik doğrulaması altında Farklı devam et düğmesini seçin.
Sorgu düzenleyicisinde, aşağıdaki deyimleri değiştirerek
<service principal name>
oluşturduğunuz hizmet sorumlusunun adıyla değiştirin (örneğin,purview-service-principal
). Ardından deyimlerini çalıştırın.CREATE USER [<service principal name>] FROM EXTERNAL PROVIDER GO EXEC sp_addrolemember 'db_datareader', [<service principal name>] GO
Veritabanı için 3 ile 5 arasındaki AdatumERP
adımları yineleyin.
Anahtar kasasını ayarlama
Purview, Azure Key Vault örneğinden hizmet sorumlusu anahtarını okur. Anahtar kasası, veri yönetimi giriş bölgesi dağıtımınızda oluşturulur. Anahtar kasasını ayarlamak için aşağıdaki adımlar gereklidir:
Hizmet sorumlusu anahtarını anahtar kasasına gizli dizi olarak ekleyin.
Anahtar kasasında Purview MSI Gizli Dizi Okuyucusu izinlerini verin.
Anahtar kasasını Purview'a anahtar kasası bağlantısı olarak ekleyin.
Purview'da anahtar kasası gizli dizisine işaret eden bir kimlik bilgisi oluşturun.
Anahtar kasasına gizli dizi ekleme izinleri ekleme
Azure portalında Azure Key Vault hizmetine gidin. Anahtar kasasını
<DMLZ-prefix>-dev-vault001
arayın.Kaynak menüsünde Erişim denetimi (IAM) öğesini seçin. Komut çubuğunda Ekle'yi ve ardından Rol ataması ekle'yi seçin.
Rol sekmesinde Key Vault Yönetici istrator'ı arayın ve seçin. İleri'yi seçin.
Üyeler'de, o anda oturum açmış olan hesabı eklemek için Üye seç'i seçin.
Üyeleri seçin bölümünde, şu anda oturum açmış olan hesabı arayın. Hesabı seçin ve ardından Seç'i seçin.
Rol atama işlemini tamamlamak için Gözden geçir ve ata'yı iki kez seçin.
Anahtar kasasına gizli dizi ekleme
Bastion konak sanal makinesinden Azure portalında oturum açmak için aşağıdaki adımları tamamlayın.
<DMLZ-prefix>-dev-vault001
Anahtar kasası kaynak menüsünde Gizli Diziler'i seçin. Komut çubuğunda Oluştur/İçeri Aktar'ı seçerek yeni bir gizli dizi oluşturun.Gizli dizi oluştur bölümünde aşağıdaki değerleri seçin veya girin:
Ayar Eylem Karşıya yükleme seçenekleri El ile'yi seçin. Ad Hizmet sorumlusu-gizli dizi girin. Value Daha önce oluşturduğunuz hizmet sorumlusu parolasını girin. Not
Bu adım, hizmet sorumlusu parola anahtarını kullanarak anahtar kasasında adlı
service-principal-secret
bir gizli dizi oluşturur. Purview, veri kaynaklarına bağlanmak ve bu kaynakları taramak için gizli diziyi kullanır. Yanlış bir parola girerseniz, aşağıdaki bölümleri tamamlayamazsınız.Oluştur'u belirleyin.
Anahtar kasasında Purview izinlerini ayarlama
Purview örneğinin anahtar kasasında depolanan gizli dizileri okuması için Purview'a anahtar kasasında ilgili izinleri atamanız gerekir. İzinleri ayarlamak için Purview Yönetilen Kimliğini anahtar kasası Gizli Dizi Okuyucusu rolüne eklersiniz.
<DMLZ-prefix>-dev-vault001
Anahtar kasası kaynak menüsünde Erişim denetimi (IAM) öğesini seçin.Komut çubuğunda Ekle'yi ve ardından Rol ataması ekle'yi seçin.
Rol'de Key Vault Gizli Dizileri Kullanıcısı'nda arama yapın ve seçin. İleri'yi seçin.
Üyeler'de Üye seç'i seçin.
Purview örneğini
<DMLZ-prefix>-dev-purview001
arayın. İlgili hesabı eklemek için örneği seçin. Ardından Seç'i seçin.Rol atama işlemini tamamlamak için Gözden geçir ve ata'yı iki kez seçin.
Purview'da anahtar kasası bağlantısı ayarlama
Purview'a anahtar kasası bağlantısı kurmak için Azure Bastion ana bilgisayar sanal makinesi kullanarak Azure portalında oturum açmanız gerekir.
Azure portalında Purview hesabına gidin
<DMLZ-prefix>-dev-purview001
. Başlarken'in altında, Microsoft Purview İdare Portalı'nda Aç'ı seçin.Purview Studio'da Yönetim>Kimlik Bilgileri'ne tıklayın. Kimlik Bilgileri komut çubuğunda Key Vault bağlantılarını yönet'i ve ardından Yeni'yi seçin.
Yeni anahtar kasası bağlantısı bölümünde aşağıdaki bilgileri seçin veya girin:
Ayar Eylem Ad DMLZ-prefix-dev-vault001> girin<. Azure Aboneliği Anahtar kasasını barındıran aboneliği seçin. Anahtar Kasası Adı <DMLZ-prefix-dev-vault001> anahtar kasasını seçin. Oluştur'u belirleyin.
Erişim izni verme işlemini onayla bölümünde Onayla'yı seçin.
Purview'da kimlik bilgisi oluşturma
Anahtar kasasını ayarlamanın son adımı Purview'da hizmet sorumlusu için anahtar kasasında oluşturduğunuz gizli diziye işaret eden bir kimlik bilgisi oluşturmaktır.
Purview Studio'da Yönetim>Kimlik Bilgileri'ne tıklayın. Kimlik Bilgileri komut çubuğunda Yeni'yi seçin.
Yeni kimlik bilgileri'nde aşağıdaki bilgileri seçin veya girin:
Ayar Eylem Ad purviewServicePrincipal girin. Kimlik doğrulama yöntemi Hizmet sorumlusu'mu seçin. Kiracı Kimliği Değer otomatik olarak doldurulur. Hizmet sorumlusu kimliği Hizmet sorumlusunun uygulama kimliğini veya istemci kimliğini girin. Key Vault bağlantısı Önceki bölümde oluşturduğunuz anahtar kasası bağlantısını seçin. Gizli dizi adı Anahtar kasasına gizli dizinin adını girin (service-principal-secret). Oluştur'u belirleyin.
Veri kaynaklarını kaydetme
Bu noktada Purview hizmet sorumlusuna bağlanabilir. Artık veri kaynaklarını kaydedebilir ve ayarlayabilirsiniz.
Azure Data Lake Storage 2. Nesil hesaplarını kaydetme
Aşağıdaki adımlarda bir Azure Data Lake Storage 2. Nesil depolama hesabı kaydetme işlemi özetlenmiştir.
Purview Studio'da veri haritası simgesini seçin, Kaynaklar'ı ve ardından Kaydet'i seçin.
Kaynakları kaydet bölümünde Azure Data Lake Storage 2. Nesil'yi ve ardından Devam'ı seçin.
Kaynakları kaydet (Azure Data Lake Storage 2. Nesil) bölümünde aşağıdaki bilgileri seçin veya girin:
Ayar Eylem Ad DLZ-prefix dldevraw girin<.> Azure Aboneliği Depolama hesabını barındıran aboneliği seçin. Depolama hesabı adı İlgili depolama hesabını seçin. Uç nokta Değer, seçilen depolama hesabına göre otomatik olarak doldurulur. Koleksiyon seçin Kök koleksiyonu seçin. Veri kaynağını oluşturmak için Kaydet'i seçin.
Aşağıdaki depolama hesapları için bu adımları yineleyin:
<DMLZ-prefix>devencur
<DMLZ-prefix>devwork
SQL Veritabanı örneğini veri kaynağı olarak kaydetme
Purview Studio'da Veri haritası simgesini seçin, Kaynaklar'ı ve ardından Kaydet'i seçin.
Kaynakları kaydet bölümünde Azure SQL Veritabanı'yi ve ardından Devam'ı seçin.
Kaynakları kaydet (Azure SQL Veritabanı) bölümünde aşağıdaki bilgileri seçin veya girin:
Ayar Eylem Ad SQLDatabase (Azure SQL Veritabanı örnekleri oluşturma bölümünde oluşturulan veritabanının adı) girin. Abonelik Veritabanını barındıran aboneliği seçin. Sunucu adı DP-prefix-dev-sqlserver001> girin<. Kaydet'i seçin.
Taramaları ayarlama
Ardından, veri kaynakları için taramalar ayarlayın.
Data Lake Storage 2. Nesil veri kaynağını tarama
Purview Studio'da veri haritasına gidin. Veri kaynağında Yeni tarama simgesini seçin.
Yeni tarama bölmesinde aşağıdaki bilgileri seçin veya girin:
Ayar Eylem Ad Scan_<DLZ ön eki>devraw girin. Tümleştirme çalışma zamanı aracılığıyla Bağlan Veri giriş bölgesiyle dağıtılan şirket içinde barındırılan tümleştirme çalışma zamanını seçin. Kimlik bilgisi Purview için ayarladığınız hizmet sorumlusunu seçin. Bağlantıyı test et'i seçerek bağlantıyı ve izinlerin yerinde olduğunu doğrulayın. Devam'ı seçin.
Taramanızın kapsamını belirleyin bölümünde, taramanın kapsamı olarak depolama hesabının tamamını seçin ve ardından Devam'ı seçin.
Tarama kuralı kümesi seçin bölümünde AdlsGen2'yi ve ardından Devam'ı seçin.
Tarama tetikleyicisi ayarla bölümünde Bir kez'i ve ardından Devam'ı seçin.
Taramanızı gözden geçirin bölümünde tarama ayarlarını gözden geçirin. Taramayı başlatmak için Kaydet ve Çalıştır'ı seçin.
Aşağıdaki depolama hesapları için bu adımları yineleyin:
<DMLZ-prefix>devencur
<DMLZ-prefix>devwork
SQL Veritabanı veri kaynağını tarama
Azure SQL Veritabanı veri kaynağında Yeni Tarama'yı seçin.
Yeni tarama bölmesinde aşağıdaki bilgileri seçin veya girin:
Ayar Eylem Ad Scan_Database001 girin. Tümleştirme çalışma zamanı aracılığıyla Bağlan Purview-SHIR'yi seçin. Veritabanı adı Veritabanı adını seçin. Kimlik bilgisi Purview'da oluşturduğunuz anahtar kasası kimlik bilgilerini seçin. Köken ayıklama (önizleme) Kapalı’yı seçin. Bağlantıyı test et'i seçerek bağlantıyı ve izinlerin yerinde olduğunu doğrulayın. Devam'ı seçin.
Taramanın kapsamını seçin. Veritabanının tamamını taramak için varsayılan değeri kullanın.
Tarama kuralı kümesi seçin bölümünde AzureSqlDatabase'i ve ardından Devam'ı seçin.
Tarama tetikleyicisi ayarla bölümünde Bir kez'i ve ardından Devam'ı seçin.
Taramanızı gözden geçirin bölümünde tarama ayarlarını gözden geçirin. Taramayı başlatmak için Kaydet ve Çalıştır'ı seçin.
Veritabanı için AdatumERP
bu adımları yineleyin.
Purview artık kayıtlı veri kaynakları için veri idaresi için ayarlanmıştır.
SQL Veritabanı verileri Data Lake Storage 2. Nesil kopyalama
Aşağıdaki adımlarda Data Factory'de Veri Kopyalama aracını kullanarak tabloları SQL Veritabanı örneklerinden AdatumCRM
ve AdatumERP
Data Lake Storage 2. Nesil hesabındaki CSV dosyalarına <DLZ-prefix>devraw
kopyalamak üzere bir işlem hattı oluşturursunuz.
Ortam genel erişime kilitlendiğinden, önce özel uç noktaları ayarlamanız gerekir. Özel uç noktaları kullanmak için yerel tarayıcınızda Azure portalında oturum açar ve ardından Bastion ana bilgisayar sanal makinesine bağlanarak gerekli Azure hizmetlerine erişirsiniz.
Özel uç nokta oluşturma
Gerekli kaynaklar için özel uç noktaları ayarlamak için:
<DMLZ-prefix>-dev-bastion
Kaynak grubunda öğesini seçin<DMLZ-prefix>-dev-vm001
.Komut çubuğunda Bağlan'ı ve bastion'ı seçin.
Sanal makinenin kullanıcı adını ve parolasını girin ve Bağlan'ı seçin.
Sanal makinenin web tarayıcısında Azure portalına gidin. Kaynak grubuna
<DLZ-prefix>-dev-shared-integration
gidin ve veri fabrikasını<DLZ-prefix>-dev-integration-datafactory001
açın.Başlarken'in altındaki Open Azure Data Factory Studio bölümünde Aç'ı seçin.
Data Factory Studio menüsünde Yönet simgesini seçin (simge üzerinde anahtar damgalı kare bir araç kutusu gibi görünür). Data Factory'yi diğer güvenli Azure hizmetlerine bağlamak için gereken özel uç noktaları oluşturmak için kaynak menüsünde Yönetilen özel uç noktalar'ı seçin.
Özel uç noktalar için erişim isteklerinin onaylanması daha sonraki bir bölümde ele alınmalıdır. Özel uç nokta erişim isteklerini onayladıktan sonra, aşağıdaki depolama hesabı örneğinde
<DLZ-prefix>devencur
olduğu gibi onay durumları Onaylandı şeklindedir.Özel uç nokta bağlantılarını onaylamadan önce Yeni'yi seçin. Azure SQL sanal makinesi için yeni bir yönetilen özel uç nokta oluşturmak üzere kullandığınız Azure SQL Veritabanı bağlayıcısını
<DP-prefix>-dev-sqlserver001
bulmak için Azure SQL girin. Sanal makine, daha önce oluşturduğunuz veAdatumERP
veritabanlarını içerirAdatumCRM
.Yeni yönetilen özel uç nokta (Azure SQL Veritabanı) alanına Ad alanına data-product-dev-sqlserver001 girin. Kaynakları oluşturmak için kullandığınız Azure aboneliğini girin. Sunucu adı için, sonraki bölümlerde bu veri fabrikasından bağlanabilmek için öğesini seçin
<DP-prefix>-dev-sqlserver001
.
Özel uç nokta erişim isteklerini onaylama
Data Factory'ye gerekli hizmetlerin özel uç noktalarına erişim vermek için birkaç seçeneğiniz vardır:
1. Seçenek: Erişim istediğiniz her hizmette, Azure portalında hizmetin ağ veya özel uç nokta bağlantıları seçeneğine gidin ve özel uç noktaya erişim isteklerini onaylayın.
Seçenek 2: Gerekli özel uç noktalara yönelik tüm erişim isteklerini aynı anda onaylamak için Bash modunda Azure Cloud Shell'de aşağıdaki betikleri çalıştırın.
# Storage managed private endpoint approval # devencur resourceGroupName=$(az group list -o tsv --query "[?contains(@.name, '-dev-storage')==\`true\`].name") storageAcctName=$(az storage account list -g $resourceGroupName -o tsv --query "[?contains(@.name, 'devencur')==\`true\`].name") endPointConnectionName=$(az network private-endpoint-connection list -g $resourceGroupName -n $storageAcctName --type Microsoft.Storage/storageAccounts -o tsv --query "[?contains(@.properties.privateLinkServiceConnectionState.status, 'Pending')==\`true\`].name") az network private-endpoint-connection approve -g $resourceGroupName -n $endPointConnectionName --resource-name $storageAcctName --type Microsoft.Storage/storageAccounts --description "Approved" # devraw resourceGroupName=$(az group list -o tsv --query "[?contains(@.name, '-dev-storage')==\`true\`].name") storageAcctName=$(az storage account list -g $resourceGroupName -o tsv --query "[?contains(@.name, 'devraw')==\`true\`].name") endPointConnectionName=$(az network private-endpoint-connection list -g $resourceGroupName -n $storageAcctName --type Microsoft.Storage/storageAccounts -o tsv --query "[?contains(@.properties.privateLinkServiceConnectionState.status, 'Pending')==\`true\`].name") az network private-endpoint-connection approve -g $resourceGroupName -n $endPointConnectionName --resource-name $storageAcctName --type Microsoft.Storage/storageAccounts --description "Approved" # SQL Database managed private endpoint approval resourceGroupName=$(az group list -o tsv --query "[?contains(@.name, '-dev-dp001')==\`true\`].name") sqlServerName=$(az sql server list -g $resourceGroupName -o tsv --query "[?contains(@.name, 'sqlserver001')==\`true\`].name") endPointConnectionName=$(az network private-endpoint-connection list -g $resourceGroupName -n $sqlServerName --type Microsoft.Sql/servers -o tsv --query "[?contains(@.properties.privateLinkServiceConnectionState.status, 'Pending')==\`true\`].name") az network private-endpoint-connection approve -g $resourceGroupName -n $endPointConnectionName --resource-name $sqlServerName --type Microsoft.Sql/servers --description "Approved" # Key Vault private endpoint approval resourceGroupName=$(az group list -o tsv --query "[?contains(@.name, '-dev-metadata')==\`true\`].name") keyVaultName=$(az keyvault list -g $resourceGroupName -o tsv --query "[?contains(@.name, 'dev-vault001')==\`true\`].name") endPointConnectionID=$(az network private-endpoint-connection list -g $resourceGroupName -n $keyVaultName --type Microsoft.Keyvault/vaults -o tsv --query "[?contains(@.properties.privateLinkServiceConnectionState.status, 'Pending')==\`true\`].id") az network private-endpoint-connection approve -g $resourceGroupName --id $endPointConnectionID --resource-name $keyVaultName --type Microsoft.Keyvault/vaults --description "Approved" # Purview private endpoint approval resourceGroupName=$(az group list -o tsv --query "[?contains(@.name, 'dev-governance')==\`true\`].name") purviewAcctName=$(az purview account list -g $resourceGroupName -o tsv --query "[?contains(@.name, '-dev-purview001')==\`true\`].name") for epn in $(az network private-endpoint-connection list -g $resourceGroupName -n $purviewAcctName --type Microsoft.Purview/accounts -o tsv --query "[?contains(@.properties.privateLinkServiceConnectionState.status, 'Pending')==\`true\`].name") do az network private-endpoint-connection approve -g $resourceGroupName -n $epn --resource-name $purviewAcctName --type Microsoft.Purview/accounts --description "Approved" done
Aşağıdaki örnekte depolama hesabının özel uç nokta erişim isteklerini nasıl <DLZ-prefix>devraw
yönettiği gösterilmektedir. Depolama hesabının kaynak menüsünde Ağ'ı seçin. Komut çubuğunda Özel uç nokta bağlantıları'nı seçin.
Bazı Azure kaynakları için kaynak menüsünde Özel uç nokta bağlantıları'nı seçersiniz. Aşağıdaki ekran görüntüsünde Azure SQL sunucusu örneği gösterilmiştir.
Özel uç nokta erişim isteğini onaylamak için, Özel uç nokta bağlantılarında bekleyen erişim isteğini seçin ve ardından Onayla'yı seçin:
Gerekli her hizmette erişim isteğini onayladıktan sonra, isteğin Data Factory Studio'daki Yönetilen özel uç noktalarda Onaylandı olarak gösterilmesi birkaç dakika sürebilir. Komut çubuğunda Yenile'yi seçseniz bile, onay durumu birkaç dakika eski olabilir.
Gerekli hizmetler için tüm erişim isteklerini onaylamayı bitirdiğinizde Yönetilen özel uç noktalarda tüm hizmetler için Onay durumu değeri Onaylandı olur:
Rol atamaları
Özel uç nokta erişim isteklerini onaylamayı bitirdiğinizde Data Factory'nin şu kaynaklara erişmesi için uygun rol izinlerini ekleyin:
- SQL Veritabanı örnekleri
AdatumCRM
veAdatumERP
<DP-prefix>-dev-sqlserver001
Azure SQL sunucusunda - Depolama hesapları
<DLZ-prefix>devraw
,<DLZ-prefix>devencur
ve<DLZ-prefix>devwork
- Purview hesabı
<DMLZ-prefix>-dev-purview001
Azure SQL sanal makinesi
Rol atamaları eklemek için Azure SQL sanal makinesiyle başlayın.
<DMLZ-prefix>-dev-dp001
Kaynak grubunda adresine<DP-prefix>-dev-sqlserver001
gidin.Kaynak menüsünde Erişim denetimi (IAM) öğesini seçin. Komut çubuğunda Rol ataması ekle'yi>seçin.
Rol sekmesinde Katkıda Bulunan'ı ve ardından İleri'yi seçin.
Üyeler'de Erişim ata bölümünde Yönetilen kimlik'i seçin. Üyeler için Üyeleri Seç'i seçin.
Yönetilen kimlikleri seçin bölümünde Azure aboneliğinizi seçin. Yönetilen kimlik için Data Factory (V2) öğesini seçerek kullanılabilir veri fabrikalarını görün. Veri fabrikaları listesinde Azure Data Factory <DLZ-prefix-dev-integration-datafactory001> öğesini seçin. Seç'i seçin.
İşlemi tamamlamak için Gözden Geçir + Ata'yı iki kez seçin.
Depolama hesapları
Ardından, gerekli rolleri , <DLZ-prefix>devencur
ve <DLZ-prefix>devwork
depolama hesaplarına atayın<DLZ-prefix>devraw
.
Rolleri atamak için Azure SQL sunucusu rol atamasını oluşturmak için kullandığınız adımları tamamlayın. Ancak rol için Katkıda Bulunan yerine Depolama Blob Veri Katkıda Bulunanı'nıseçin.
Üç depolama hesabı için de rol atadıktan sonra Data Factory depolama hesaplarına bağlanabilir ve bu hesaplara erişebilir.
Microsoft Purview
Rol atamaları eklemenin son adımı, Microsoft Purview'daki Purview Veri Küratör rolünü veri fabrikasının yönetilen kimlik hesabına eklemektir <DLZ-prefix>-dev-integration-datafactory001
. Data Factory'nin birden çok veri kaynağındaki veri kataloğu varlık bilgilerini Purview hesabına gönderebilmesi için aşağıdaki adımları tamamlayın.
Kaynak grubunda
<DMLZ-prefix>-dev-governance
Purview hesabına gidin<DMLZ-prefix>-dev-purview001
.Purview Studio'da Veri haritası simgesini ve ardından Koleksiyonlar'ı seçin.
Koleksiyon için Rol atamaları sekmesini seçin. Veri küratörleri'nin altında için
<DLZ-prefix>-dev-integration-datafactory001
yönetilen kimliği ekleyin:
Data Factory'yi Purview'a Bağlan
İzinler ayarlanır ve Purview artık veri fabrikasını görebilir. Sonraki adım, <DMLZ-prefix>-dev-purview001
öğesine bağlanabilmektir <DLZ-prefix>-dev-integration-datafactory001
.
Purview Studio'da Yönetim simgesini ve ardından Data Factory'yi seçin. Data Factory bağlantısı oluşturmak için Yeni'yi seçin.
Yeni Data Factory bağlantıları bölmesinde Azure aboneliğinizi girin ve veri fabrikasını
<DLZ-prefix>-dev-integration-datafactory001
seçin. Tamam'ı seçin.Data Factory Studio örneğinde
<DLZ-prefix>-dev-integration-datafactory001
, Azure Purview'ı Yönet'in>altında Azure Purview hesabını yenileyin.Tümleştirme
Data Lineage - Pipeline
artık yeşil Bağlan simgesini gösterir.
ETL işlem hattı oluşturma
artık gerekli erişim izinlerine sahip olduğuna göre<DLZ-prefix>-dev-integration-datafactory001
, verileri SQL Veritabanı örneklerden ham depolama hesabına taşımak için <DLZ-prefix>devraw
Data Factory'de bir kopyalama etkinliği oluşturun.
AdatumCRM ile Veri Kopyalama aracını kullanma
Bu işlem, müşteri verilerini SQL Veritabanı örneğinden AdatumCRM
ayıklar ve Data Lake Storage 2. Nesil depolama alanına kopyalar.
Data Factory Studio'da Yazar simgesini ve ardından Fabrika Kaynakları'nı seçin. Artı işaretini (+) seçin ve Veri Kopyala aracını seçin.
Veri Kopyalama aracı sihirbazındaki her adımı tamamlayın:
İşlem hattını 24 saatte bir çalıştıracak bir tetikleyici oluşturmak için Zamanla'yı seçin.
Bu veri fabrikasını sunucudaki
<DP-prefix>-dev-sqlserver001
(kaynak) SQL Veritabanı örneğe bağlamak üzere bağlı bir hizmet oluşturmak içinAdatumCRM
Yeni Bağlan ion'ı seçin.Not
SQL Veritabanı örneklerindeki veya depolama hesaplarındaki verilere bağlanırken veya verilere erişirken hatalarla karşılaşırsanız Azure aboneliğindeki izinlerinizi gözden geçirin. Veri fabrikasının sorunlu kaynaklar için gerekli kimlik bilgilerine ve erişim izinlerine sahip olduğundan emin olun.
Şu üç tabloyu seçin:
SalesLT.Address
SalesLT.Customer
SalesLT.CustomerAddress
Azure Data Lake Storage 2. Nesil depolama alanına
<DLZ-prefix>devraw
(hedef) erişmek için yeni bir bağlı hizmet oluşturun.Depolamadaki klasörlere
<DLZ-prefix>devraw
göz atın ve hedef olarak Veri'yi seçin.Dosya adı sonekini .csv olarak değiştirin ve diğer varsayılan seçenekleri kullanın.
Sonraki bölmeye gidin ve Dosyaya üst bilgi ekle'yi seçin.
Sihirbazı tamamladığınızda Dağıtım tamamlandı bölmesi şu örneğe benzer şekilde görünür:
Yeni işlem hattı İşlem Hatları'nda listelenir.
İşlem hattını çalıştırma
Bu işlem Data\CRM klasöründe veritabanındaki seçili tabloların AdatumCRM
her biri için bir tane olacak şekilde üç .csv dosyası oluşturur.
İşlem hattını
CopyPipeline_CRM_to_Raw
yeniden adlandırın.ve veri kümelerini
CRM_Raw_Storage
CRM_DB
yeniden adlandırın.Fabrika Kaynakları komut çubuğunda Tümünü yayımla'yı seçin.
CopyPipeline_CRM_to_Raw
İşlem hattını seçin ve işlem hattı komut çubuğunda Tetikleyici'yi seçerek üç tabloyu SQL Veritabanı Data Lake Storage 2. Nesil kopyalayın.
AdatumERP ile Veri Kopyalama aracını kullanma
Ardından, veritabanındaki verileri ayıklayın AdatumERP
. Veriler ERP sisteminden gelen satış verilerini temsil eder.
Yine Data Factory Studio'da Veri Kopyalama aracını kullanarak yeni bir işlem hattı oluşturun. Bu kez satış verilerini, CRM verileriyle
AdatumERP
<DLZ-prefix>devraw
yaptığınız gibi depolama hesabı veri klasörüne gönderiyorsunuz. Aynı adımları tamamlayın, ancak veritabanını kaynak olarak kullanınAdatumERP
.Saatte bir tetikleme zamanlamasını oluşturun.
SQL Veritabanı örneğine
AdatumERP
bağlı bir hizmet oluşturun.Şu yedi tabloyu seçin:
SalesLT.Product
SalesLT.ProductCategory
SalesLT.ProductDescription
SalesLT.ProductModel
SalesLT.ProductModelProductDescription
SalesLT.SalesOrderDetail
SalesLT.SalesOrderHeader
Depolama hesabına bağlı mevcut hizmeti
<DLZ-prefix>devraw
kullanın ve dosya uzantısını .csv olarak ayarlayın.Dosyaya üst bilgi ekle'yi seçin.
Sihirbazı yeniden tamamlayın ve işlem hattını
CopyPipeline_ERP_to_DevRaw
yeniden adlandırın. Ardından komut çubuğunda Tümünü yayımla'yı seçin. Son olarak, yeni oluşturulan bu işlem hattında tetikleyiciyi çalıştırarak seçilen yedi tabloyu SQL Veritabanı Data Lake Storage 2. Nesil kopyalayın.
Bu adımları tamamladığınızda, Data Lake Storage 2. Nesil depolama alanında <DLZ-prefix>devraw
10 CSV dosyası bulunur. Sonraki bölümde, dosyaları Data Lake Storage 2. Nesil depolama alanında <DLZ-prefix>devencur
sıralaacaksınız.
Data Lake Storage 2. Nesil verileri seçme
Ham <DLZ-prefix>devraw
Data Lake Storage 2. Nesil depolama alanında 10 CSV dosyası oluşturmayı bitirdiğinizde, bu dosyaları seçilen <DLZ-prefix>devencur
Data Lake Storage 2. Nesil depolama alanına kopyalarken gerektiği gibi dönüştürün.
Veri taşımayı düzenlemeye yönelik bu yeni işlem hatlarını oluşturmak için Azure Data Factory'yi kullanmaya devam edin.
CRM'yi müşteri verilerine göre seçme
içindeki Data\CRM klasöründeki <DLZ-prefix>devraw
CSV dosyalarını alan bir veri akışı oluşturun. Dosyaları dönüştürün ve dönüştürülen dosyaları .parquet dosya biçiminde içindeki <DLZ-prefix>devencur
Data\Customer klasörüne kopyalayın.
Azure Data Factory'de veri fabrikasına gidin ve Orchestrate'ı seçin.
Genel'de işlem hattını
Pipeline_transform_CRM
olarak adlandırın.Etkinlikler bölmesinde Taşı ve Dönüştür'ü genişletin. Veri akışı etkinliğini sürükleyin ve işlem hattı tuvalinde bırakın.
Veri Akışı ekleme bölümünde Yeni veri akışı oluştur'u seçin ve veri akışını
CRM_to_Customer
adlandırın. Bitir'iseçin.Not
İşlem hattı tuvalinin komut çubuğunda Veri akışı hata ayıklamasını açın. Hata ayıklama modunda, dinamik bir Apache Spark kümesinde dönüştürme mantığını etkileşimli olarak test edebilirsiniz. Veri akışı kümelerinin ısınması 5-7 dakika sürer. Veri akışı geliştirmeye başlamadan önce hata ayıklamayı açmanızı öneririz.
Veri akışındaki
CRM_to_Customer
seçenekleri belirtmeyi bitirdiğinizde işlemPipeline_transform_CRM
hattı şu örneğe benzer şekilde görünür:Veri akışı şu örneğe benzer:
Ardından, kaynak için
CRMAddress
veri akışında şu ayarları değiştirin:Data Lake Storage 2. Nesil'dan yeni bir veri kümesi oluşturun. DelimitedText biçimini kullanın. Veri kümesini
DevRaw_CRM_Address
adlandırın.Bağlı hizmeti olarak
<DLZ-prefix>devraw
Bağlan.Data\CRM\SalesLTAddress.csv
Kaynak olarak dosyayı seçin.
Eşleştirilmiş
CustAddress
havuz için veri akışındaki şu ayarları değiştirin:adlı
DevEncur_Cust_Address
yeni bir veri kümesi oluşturun.Havuz olarak içindeki
<DLZ-prefix>devencur
Data\Customer klasörünü seçin.Ayarlar\Çıktı'nın altında, dosyayı Address.parquet dosyasına dönüştürün.
Veri akışı yapılandırmasının geri kalanı için her bileşen için aşağıdaki tablolardaki bilgileri kullanın. ve CustAddress
değerlerinin ilk iki satır olduğunu CRMAddress
unutmayın. Bunları diğer nesneler için örnek olarak kullanın.
Aşağıdaki tablolardan birinde olmayan bir öğe şema değiştiricidir RemovePasswords
. Yukarıdaki ekran görüntüsü, bu öğenin ile CustCustomer
arasında CRMCustomer
gittiğini gösterir. Bu şema değiştiriciyi eklemek için Ayarları seçin'e gidin ve PasswordHash ve PasswordSalt'i kaldırın.
CRMCustomer
.crv dosyasından 15 sütunlu bir şema döndürür. CustCustomer
şema değiştiricisi iki parola sütununu kaldırdıktan sonra yalnızca 13 sütun yazar.
Tam tablo
Veri Akışı Adı | Object type | Veri kümesi adı | Veri deposu | Biçim türü | Bağlı hizmet | Dosya veya klasör |
---|---|---|---|---|---|---|
CRMAddress |
kaynak | DevRaw_CRM_Address |
Azure Data Lake Storage 2. Nesil | Sınırlandırılmış Metin | devraw |
Data\CRM\SalesLTAddress.csv |
CustAddress |
Lavabo | DevEncur_Cust_Address |
Azure Data Lake Storage 2. Nesil | Parquet | devencur |
Data\Customer\Address.parquet |
CRMCustomer |
kaynak | DevRaw_CRM_Customer |
Azure Data Lake Storage 2. Nesil | Sınırlandırılmış Metin | devraw |
Data\CRM\SalesLTCustomer.csv |
CustCustomer |
Lavabo | DevEncur_Cust_Customer |
Azure Data Lake Storage 2. Nesil | Parquet | devencur |
Data\Customer\Customer.parquet |
CRMCustomerAddress |
kaynak | DevRaw_CRM_CustomerAddress |
Azure Data Lake Storage 2. Nesil | Sınırlandırılmış Metin | devraw |
Data\CRM\SalesLTCustomerAddress.csv |
CustCustomerAddress |
Lavabo | DevEncur_Cust_CustomerAddress |
Azure Data Lake Storage 2. Nesil | Parquet | devencur |
Data\Customer\CustomerAddress.parquet |
ERP to Sales tablosu
Şimdi işlem hattı oluşturmakPipeline_transform_ERP
, içindeki Data\ERP klasöründeki <DLZ-prefix>devraw
.csv dosyalarını dönüştürmek için bir ERP_to_Sales
veri akışı oluşturmak ve dönüştürülen dosyaları içindeki <DLZ-prefix>devencur
Data\Sales klasörüne kopyalamak için benzer adımları yineleyin.
Aşağıdaki tabloda, veri akışında ERP_to_Sales
oluşturulacak nesneleri ve her nesne için değiştirmeniz gereken ayarları bulacaksınız. Her .csv dosyası bir .parquet havuzuna eşlenir.
Veri Akışı Adı | Object type | Veri kümesi adı | Veri deposu | Biçim türü | Bağlı hizmet | Dosya veya klasör |
---|---|---|---|---|---|---|
ERPProduct |
kaynak | DevRaw_ERP_Product |
Azure Data Lake Storage 2. Nesil | Sınırlandırılmış Metin | devraw |
Data\ERP\SalesLTProduct.csv |
SalesProduct |
Lavabo | DevEncur_Sales_Product |
Azure Data Lake Storage 2. Nesil | Parquet | devencur |
Data\Sales\Product.parquet |
ERPProductCategory |
kaynak | DevRaw_ERP_ProductCategory |
Azure Data Lake Storage 2. Nesil | Sınırlandırılmış Metin | devraw |
Data\ERP\SalesLTProductCategory.csv |
SalesProductCategory |
Lavabo | DevEncur_Sales_ProductCategory |
Azure Data Lake Storage 2. Nesil | Parquet | devencur |
Data\Sales\ProductCategory.parquet |
ERPProductDescription |
kaynak | DevRaw_ERP_ProductDescription |
Azure Data Lake Storage 2. Nesil | Sınırlandırılmış Metin | devraw |
Data\ERP\SalesLTProductDescription.csv |
SalesProductDescription |
Lavabo | DevEncur_Sales_ProductDescription |
Azure Data Lake Storage 2. Nesil | Parquet | devencur |
Data\Sales\ProductDescription.parquet |
ERPProductModel |
kaynak | DevRaw_ERP_ProductModel |
Azure Data Lake Storage 2. Nesil | Sınırlandırılmış Metin | devraw |
Data\ERP\SalesLTProductModel.csv |
SalesProductModel |
Lavabo | DevEncur_Sales_ProductModel |
Azure Data Lake Storage 2. Nesil | Parquet | devencur |
Data\Sales\ProductModel.parquet |
ERPProductModelProductDescription |
kaynak | DevRaw_ERP_ProductModelProductDescription |
Azure Data Lake Storage 2. Nesil | Sınırlandırılmış Metin | devraw |
Data\ERP\SalesLTProductModelProductDescription.csv |
SalesProductModelProductDescription |
Lavabo | DevEncur_Sales_ProductModelProductDescription |
Azure Data Lake Storage 2. Nesil | Parquet | devencur |
Data\Sales\ProductModelProductDescription.parquet |
ERPProductSalesOrderDetail |
kaynak | DevRaw_ERP_ProductSalesOrderDetail |
Azure Data Lake Storage 2. Nesil | Sınırlandırılmış Metin | devraw |
Data\ERP\SalesLTProductSalesOrderDetail.csv |
SalesProductSalesOrderDetail |
Lavabo | DevEncur_Sales_ProductSalesOrderDetail |
Azure Data Lake Storage 2. Nesil | Parquet | devencur |
Data\Sales\ProductSalesOrderDetail.parquet |
ERPProductSalesOrderHeader |
kaynak | DevRaw_ERP_ProductSalesOrderHeader |
Azure Data Lake Storage 2. Nesil | Sınırlandırılmış Metin | devraw |
Data\ERP\SalesLTProductSalesOrderHeader.csv |
SalesProductSalesOrderHeader |
Lavabo | DevEncur_Sales_ProductSalesOrderHeader |
Azure Data Lake Storage 2. Nesil | Parquet | devencur |
Data\Sales\ProductSalesOrderHeader.parquet |
Sonraki adımlar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin