Aracılığıyla paylaş


Veri eşleştirme

Data Quality Services(dqs) veri işlem eşleştirmeyi sağlayan veri tekrarını azaltmak ve veri kaynağındaki veri doğruluğunu iyileştirmek için. Eşleşen kayıtlara göre her bir kümesi maç ağırlıklı ihtimal dönen tek bir veri kaynağı, tüm kayıtların çoğaltılması derecesini analiz eder. Ardından, hangi kayıtların maçlar ve kaynak verilerine uygun eylemi karar verebilirsiniz.

dqs eşleştirme işlemi aşağıdaki faydaları vardır:

  • Eşleşen doğru değeri belirleme ve hataları azaltır eşit olması gereken veri değerleri arasındaki farklılıkları ortadan kaldırmak için neden olabilir veri sağlar. Örneğin, adları ve adresleri genellikle tanımlayıcı verileri bir veri kaynağı, özellikle müşteri verilerini, ama veri kirli olmak ve zaman içinde bozulabilir. Tanımlamak ve bu hataları düzeltmek için eşleşen gerçekleştirme, veri kullanımı ve bakımı çok daha kolay yapabilirsiniz.

  • Eşleşen eşdeğer olan, ancak bir başka biçimde veya stil, girilen değerlerin Tekdüzen işlenen olmanızı sağlar.

  • Eşleşen bunu tanımlarken, yinelenen verileri çıkarmaya olanak sağlayarak tam ve yaklaşık eşleşme tanımlar. Yaklaşık eşleşme aslında bir eşleşme olduğu noktayı tanımlar. Sen hangi alanların eşleşen değerlendirilir ve olmayan tanımlayın.

  • dqs, bilgisayar destekli bir işlemle eşleşen ilke oluşturmak, etkileşimli sonuçlar eşleştirme üzerine dayalı değiştirmek ve eklemek o-e doğru yeniden kullanılabilir Bilgi Bankası olanak sağlar.

  • Veri hazırlama bir tablo veya eşleşen ilke ve kaynak veriler devlet bağlı değil re-index kaynaktan kopyalanan yeniden dizin oluşturur. Değil re-indexing performansını artırabilirsiniz.

Genel veri kalitesini artırmak için diğer veri temizlik işlemleri ile birlikte eşleştirme işlemi gerçekleştirebilirsiniz. Ayrıca veri gerçekleştirebilirsiniz ana veri hizmetleri içine inşa dqs işlevini kullanarak de-duplication. Daha fazla bilgi için, bkz. Ana veri hizmetlerine genel bakış.

Aşağıdaki resimde veri eşleştirme dqs nasıl yapıldığını gösterir:

DQS'de Eşleştirme İşlemi

Bu Konuda

  • Veri eşleştirme gerçekleştirme

  • Eşleştirme ilkesi oluşturma

  • Çalışan bir eşleştirme Projesi

Veri eşleştirme gerçekleştirme

Diğer veri kalite süreçleri gibi dqs ile eşleşen bir Bilgi Bankası oluşturmak ve veri kalite proje aşağıdaki adımlarda bir eşleştirme etkinliği yürütmeden gerçekleştirin:

  1. Bilgi Bankası'ndaki bir eşleştirme ilkesi oluşturma

  2. De-duplication işlemi, veri kalitesi projenin parçası olan bir eşleştirme etkinliği gerçekleştirir.

Eşleştirme ilkesi oluşturma

Bilgi Bankası, dqs eşleşen olasılık nasıl atar tanımlamak için knowledge Base'deki bir eşleştirme ilkesi oluşturarak eşleştirme yapmak için hazırlayın. Eşleştirme ilkesi aşağıdakilerden oluşur veya hangi etki alanları tanımlamak daha fazla eşleştirme kuralları ne kadar iyi bir kayıttan diğerine eşleşen dqs değerlendiriyor için kullanılır ve her bir etki alanı değeri taşıyan ağırlığı eşleşen değerlendirmesi belirtin. Etki alanı değerleri tam eşleşme olması ya da sadece benzer olabilir ve ne derece benzerlik kuralı belirtin. Ayrıca etki eşleşen bir önkoşul olup olmadığını belirtirsiniz.

Eşleştirme ilkesi etkinlik Bilgi Bankası Yönetimi Sihirbazı'nda kayıt aralığı boyunca aynı anda iki kayıt karşılaştırmak için her eşleştirme kuralını uygulayarak örnek verileri analiz eder. Eşleşen olan puanları belirtilen minimum büyük olan kayıtları, eşleşen sonuç kümeleri içinde gruplandırılır. Bu eşleşen sonuç için Bilgi Bankası eklenmez; eşleştirme kuralları ayarlamak için bunları kullanın. Eşleşen ilke oluşturma bir yinelemeli süreci içinde eşleşen sonuç veya profil istatistikleri temel alan eşleştirme kuralları değiştirmek olabilir.

Bir etki alanı için etki alanına veri kaynağından verileri yüklediğinizde dizeleri normalleştirilmiş verileri belirtebilirsiniz. Bu işlemi, boş veya iki dizge arasındaki farkı genellikle kaldıran bir boşluk ve özel karakterler yerine oluşur. Bu, eşleşen doğruluğunu artırabilir ve normalleştirme değil geçerdi zaman minimum eşleştirme eşiği aşmak eşleşen bir sonuç genellikle etkinleştirebilirsiniz.

[!NOT]

İki kayıtlarının ilgili alanlardaki boş değerleri, bir eşleşme olarak kabul.

Eşleştirme ilkesi için örnek verileri eşlenmiş etki alanlarında çalışır. Veri hazırlama bir tablo veri kaynağından kopyalanmasını ve eşleştirme İlkesi veya çalıştırdığınızda re-indexed olup olmadığını belirtebilirsiniz. Bilgi Bankası oluştururken ve eşleştirme Projesi çalışırken bunu yapabilirsiniz. Değil re-indexing, geliştirilmiş performans neden olabilir. Re-indexing aşağıdaki doğru olduğunda gerekli değildir: eşleşen ilke değişmedi ve eğer değil veri kaynağı, politika remapped, yeni bir veri kaynağı seçili veya eşlenmiş bir ya da daha yeni etki alanları.

Her bir eşleştirme kuralı oluşturulduğunda Bilgi Bankası'ndaki kaydedilir. Yalnızca yayınlandığında ancak bir Bilgi Bankası veri kalitesi projede kullanılabilir. Ayrıca, Bilgi Bankası yayımlanıncaya kadar eşleştirme kurallarında oluşturan kişinin dışındaki bir kullanıcı tarafından değiştirilemez.

Başa Dön bağlantısıyla kullanılan ok simgesi[Top]

Çalışan bir eşleştirme Projesi

dqs veri de-duplication her satır her iki satırdan, kaynak verileri karşılaştırarak Bilgi Bankası'ndaki tanımlanmış ilke eşleme satırları bir maç olan olasılık üreten kullanma ve gerçekleştirir. Bu eşleme türü ile bir veri kalite Projesi yapılır. Eşleşen veri kalitesi Projedeki temel adımlardan biridir. Böylece eşleşmesi gereken veriler hatadan ücretsiz en iyi veri temizlik sonra gerçekleştirilir. Eşleştirme işlemi çalıştırmadan önce temizlik projenin sonuçlarını bir veri tablosu veya .csv dosyasına vermek ve etki alanlarında eşleşen proje için temizlik sonuçları göster bir eşleştirme projesi oluşturun.

Proje eşleşen veri bilgisayar destekli bir süreç ve interaktif bir süreç oluşur. Eşleştirme Projesi, değerlendirilmesi için veri kaynağı için eşleşen ilke eşleme kuralları geçerlidir. Bu işlem, her iki satır eşleşen bir Puan maçı olduğu ihtimalini değerlendiriyor. Yalnızca bir eşleştirme Eşleştirme ilkesi veri steward tarafından belirlenen bir değerden daha büyük bir olasılık ile kayıtları, bir eşleşme olarak kabul.

dqs eşleştirme analizi yaparken, dqs maçları düşünüyor kayıt kümeleri oluşturur. dqs rastgele her küme kayıtları biri Özet ya da lider, kaydı tanımlar. Veri steward eşleşen sonuç ve herhangi bir kayıt kümesi için uygun bir eşleşme reddeder doğrular. Veri steward sonra dqs eşleştirme işlemi hayatta ve eşleşen kayıtları değiştirmek kaydı belirlemek için kullanacağı survivorship kural seçer. Survivorship kuralı "Özet kayıt" olabilir (varsayılan), "en eksiksiz ve uzun kayıt", "en eksiksiz kayıt" veya "en uzun kayıt". Hangi en yakın ölçüt veya survivorship kuralın ölçütüyle eşleşen kaydı üzerine dayalı her kümede kalanlar (lider) kaydı dqs belirler. Belirli bir küme içinde birden çok kayıt survivorship kural uymak, dqs kayıtları rasgele seçer. dqs, kayıtları ortak olan tek bir küme "örtüşmeyen kümeleri göster" seçerek kümelerini görüntüleme seçeneği sunar. Sonuçlara göre bu ayarı görüntülemek için eşleştirme işlemi yürütme gerekir.

Bir SQL Server tablosu veya .csv dosyası eşleştirme işlemi sonucunu verebilir. Eşleşen iki form sonuçlarında verebilirsiniz: yalnızca kurtulan kaydı için bir küme ve eşsiz sonuçlarını içeren ilk, eşleşen kayıtları ve eşleşmeyen kayıtları veya ikinci, survivorship kayıtları. Aynı kaydı birden çok küme için kurtulan tanımlanır survivorship kayıtları, kaydı yalnızca bir kez verilir.

Başa Dön bağlantısıyla kullanılan ok simgesi[Top]

Bu Bölümde

dqs eşleşen ilgili aşağıdaki görevleri gerçekleştirebilirsiniz:

Oluşturma ve eşleşen ilke eşleme kuralı sınama

Eşleştirme ilkesi oluşturma

Eşleşen veri kalitesi projede çalıştırmak

Eşleşen bir proje çalışması