Değişiklik verisi yakalama kaynağı kullanarak Azure SQL Veritabanı delta havuzuna şema evrimi ile değiştirilmiş verileri yakalama
UYGULANANLAR: Azure Data Factory
Azure Synapse Analytics
İpucu
Kuruluşlar için hepsi bir arada analiz çözümü olan Microsoft Fabric'te Data Factory'yi deneyin. Microsoft Fabric , veri taşımadan veri bilimine, gerçek zamanlı analize, iş zekasına ve raporlamaya kadar her şeyi kapsar. Yeni bir deneme sürümünü ücretsiz olarak başlatmayı öğrenin!
Bu makalede, değişiklik veri yakalama (CDC) kaynağı oluşturmak için Azure Data Factory kullanıcı arabirimini kullanacaksınız. Kaynak, değiştirilen verileri Azure SQL Veritabanı bir kaynaktan alır ve Azure Data Lake Storage 2. Nesil'da depolanan Delta Lake'e gerçek zamanlı olarak ekler. Bu etkinlik, kaynak ve havuz arasında bir CDC kaynağı kullanarak şema evrimi desteğini gösterir.
Bu makalede şunları öğreneceksiniz:
- CDC kaynağı oluşturun.
- Kaynak tabloda dinamik şema değişiklikleri yapın.
- Hedef Delta havuzundaki şema değişikliklerini doğrulayın.
Bu makalede yapılandırma düzenini değiştirebilir ve genişletebilirsiniz.
Önkoşullar
Bu makaledeki yordamlara başlamadan önce şu kaynaklara sahip olduğunuzdan emin olun:
- Azure aboneliği. Azure aboneliğiniz yoksa ücretsiz bir Azure hesabı oluşturun.
- SQL veritabanı. kaynak veri deposu olarak Azure SQL Veritabanı kullanırsınız. SQL veritabanınız yoksa Azure portalında bir veritabanı oluşturun.
- Depolama hesabı. Azure Data Lake Storage 2. Nesil'de depolanan Delta Lake'i hedef veri deposu olarak kullanırsınız. Depolama hesabınız yoksa, oluşturma adımları için bkz . Depolama hesabı oluşturma.
CDC yapıtı oluşturma
Veri fabrikanızda Yazar bölmesine gidin. İşlem Hatlarının altında Veri Yakalamayı Değiştir (önizleme) adlı yeni bir üst düzey yapıt görüntülenir.
Üç nokta görünene kadar Veri Yakalamayı Değiştir (önizleme) öğesinin üzerine gelin. Ardından Veri Yakalama (önizleme) Eylemlerini Değiştir'i seçin.
Yeni CDC (önizleme) öğesini seçin. Bu adım, kılavuzlu işlemi başlatmak için bir açılır menü açar.
CDC kaynağınızı adlandırmanız istenir. Varsayılan olarak, ad 1 artan bir sayıyla "adfcdc" şeklindedir. Bu varsayılan adı seçtiğiniz bir adla değiştirebilirsiniz.
Veri kaynağınızı seçmek için açılan listeyi kullanın. Bu makale için Azure SQL Veritabanı'i seçin.
Bağlı bir hizmet seçmeniz istenir. Yeni bir bağlı hizmet oluşturun veya var olan bir hizmeti seçin.
Bağlı bir hizmeti seçtikten sonra kaynak tabloları seçmeniz istenir. Kaynak tabloları seçmek için onay kutularını kullanın ve ardından açılan listeyi kullanarak Artımlı sütun değerini seçin.
Bölmede yalnızca artımlı sütun veri türlerini destekleyen tablolar listelenir.
Not
Azure SQL Veritabanı kaynağında şema evrimi ile CDC'yi etkinleştirmek için yerel SQL CDC'nin etkinleştirildiği tablolar yerine filigran sütunlarına göre tabloları seçin.
Kaynak tabloları seçtikten sonra, veri hedefinizi ayarlamak için Devam'ı seçin.
Açılan listeyi kullanarak bir Hedef türü değeri seçin. Bu makale için Delta'yı seçin.
Bağlı bir hizmet seçmeniz istenir. Yeni bir bağlı hizmet oluşturun veya var olan bir hizmeti seçin.
Hedef veri klasörünüzü seçin. Aşağıdakilerden birini kullanabilirsiniz:
- Hedef temel yol altındaki Gözat düğmesi, kaynak için seçilen tüm yeni tablolar için gözatma yolunu otomatik olarak doldurmanıza yardımcı olur.
- Klasör yolunu tek tek seçmek için Dışarıda Gözat düğmesi.
Bir klasör yolu seçtikten sonra Devam düğmesini seçin.
Değişiklik verilerini yakalamak için yeni bir sekme görüntülenir. Bu sekme, yeni kaynağınızı yapılandırabileceğiniz CDC studio'dur.
Sizin için otomatik olarak yeni bir eşleme oluşturulur. Açılan listeleri kullanarak eşlemeniz için Kaynak Tablo ve Hedef Tablo seçimlerini güncelleştirebilirsiniz.
Tablolarınızı seçtikten sonra, sütunları varsayılan olarak Otomatik eşleme iki durumlu düğmesi açık olarak eşlenir. Otomatik eşleme , havuzdaki sütunları ada göre otomatik olarak eşler, kaynak şema geliştikçe yeni sütun değişikliklerini alır ve bu bilgileri desteklenen havuz türlerine akışla aktarır.
Not
Şema evrimi yalnızca Otomatik eşleme iki durumlu düğmesi açık olduğunda çalışır. Sütun eşlemelerini düzenlemeyi veya dönüştürmeleri eklemeyi öğrenmek için bkz . Değişiklik verileri yakalama kaynağıyla değiştirilen verileri yakalama.
Anahtarlar bağlantısını seçin ve ardından silme işlemlerini izlemek için kullanılacak Anahtarlar sütununu seçin.
Eşlemeleriniz tamamlandıktan sonra, Gecikme Süresini Ayarla düğmesini kullanarak CDC gecikme sürenizi ayarlayın.
Değişiklikleri yapmak için CDC'nizin gecikme süresini ve ardından Uygula'yı seçin.
Varsayılan olarak gecikme süresi 15 dakika olarak ayarlanır. Bu makaledeki örnek, gecikme süresi için Gerçek zamanlı seçeneğini kullanır. Gerçek zamanlı gecikme süresi, kaynak verilerinizdeki değişiklikleri 1 dakikadan kısa aralıklarla sürekli olarak alır.
Diğer gecikme süreleri için (örneğin, 15 dakika seçerseniz), değişiklik verileri yakalama işlemi kaynak verilerinizi işler ve son işlenen zamandan bu yana değiştirilen verileri alır.
CDC'nizi yapılandırmayı tamamladıktan sonra değişikliklerinizi yayımlamak için Tümünü yayımla'yı seçin.
Not
Değişikliklerinizi yayımlamazsanız CDC kaynağınızı başlatamazsınız. Sonraki adımdaki Başlat düğmesi kullanılamaz.
Değişiklik verileri yakalamanızı çalıştırmaya başlamak için Başlat'ı seçin.
Değişiklik verileri yakalama işleminiz çalışmaya devam ettikçe şunları yapabilirsiniz:
Diğer tanılama bilgileriyle birlikte kaç değişikliğin (ekleme, güncelleştirme veya silme) okunup yazıldığını görmek için izleme sayfasını kullanın.
Değişiklik verilerinin Delta Lake'e ulaştığını ve Delta biçiminde Azure Data Lake Storage 2. Nesil depolandığını doğrulayın.
Gelen değişiklik verilerinin şemasını doğrulayın.
Kaynak tablolarda dinamik şema düzeyinde değişiklikler yapma
Aşağıdaki örnekte gösterildiği gibi bir T-SQL deyimi kullanarak kaynak tabloya yeni bir
ALTER TABLE
PersonalEmail sütunu ekleyin.Yeni PersonalEmail sütununun mevcut tabloda göründüğünü doğrulayın.
Delta havuzundaki şema değişikliklerini doğrulama
Yeni PersonalEmail sütununun Delta havuzunda göründüğünü onaylayın. Artık şema değişiklikleriyle değişiklik verilerinin hedefe ulaştığını biliyorsunuz.
İlgili içerik
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin