Eşleşen bir proje çalışması

Nasıl veri eşleme yapılacağı açıklanmıştır Data Quality Services(dqs). Eşleştirme işlemi eşleştirme Eşleştirme ilkesi kuralları eşleşen üzerinde temel kayıt kümeleri tanımlar, her kümesinden tek bir kayıt survivorship kural tabanlı kurtulan atar ve sonuçları verir. Eşleştirme işlemi bilgisayar destekli bir süreç içinde de-duplication, olarak da bilinir, dqs yapar ama etkileşimli eşleştirme kuralları oluşturun ve eşleştirme işlemi kontrol kadar çeşitli seçeneklerden survivorship kuralı seçin.

Eşleşen üç aşamada gerçekleştirilir: bir eşleştirme işlemi hangi eşleşen çözümlemesini çalıştırmanız ve survivorship ve survivorship belirleyeceğiniz verme işlemi kural ve eşleşen ihracat içinde veri kaynağına veri kaynağı ve harita etki alanlarını tanımlamak bir eşleme işlemi, sonuç. Bu süreçlerin tümünde Matching etkinlik sihirbazın işlemini yeniden çalıştırın ve dışında özel bir eşleştirme işlemi kapatmak ve sonra işlemi aynı aşamaya dönmek için farklı sayfalara, ileri geri hareket sağlayan ayrı bir sayfaya gerçekleştirilir. dqs kaynak verileri, eşleştirme kuralları ve eşleştirme hakkında kararlar vermenize olanak ve eşleştirme işlemi rafine eşleşen sonuçları ile ilgili istatistikleri sağlar.

Bir veya daha fazla eşleştirme kurallarını ve politika örnek veriler üzerinde çalışan bir eşleştirme ilkesi oluşturarak eşleştirmek için hazırlamalısınız. Eşleştirme Projesi işlemi eşleştirme İlkesi işleminden ayrı ve eşleştirme bilgisi, eşleştirme projesinden elde bir Bilgi Bankası boştur. Eşleştirme ilkesi oluşturma hakkında daha fazla bilgi için bkz: Eşleştirme ilkesi oluşturma.

Bu Konuda

  • Başlamadan Önce

    Ön Koşullar

    Güvenlik

  • Bir eşleştirme projesi başlatmak

  • Sahne eşleme

  • Sahne Alanı eşleştirme

  • Survivorship ve sahne verme

  • Takip: bir eşleştirme Projesi çalıştırdıktan sonra

  • Profiler ve sonuçları sekmeleri

Başlamadan Önce

Ön Koşullar

  • Bilgi tabanı olan bir eşleştirme İlkesi bir veya daha fazla eşleme kuralı oluşan oluşturmuş olmanız gerekir.

  • Microsoft Excel yüklü, Tarih Data Quality İstemcisieşleşmesi gereken kaynak verileri Excel dosyasında ise bilgisayar. Aksi takdirde, eşleme Sahne Alanı'ndaki Excel dosyasını seçmek mümkün olmayacaktır. Microsoft Excel tarafından oluşturulan dosyaları .xlsx, .xls veya .csv uzantısı olabilir. Excel 64 bit sürümünü kullanıyorsanız, yalnızca Excel 2003 dosyalarını (.xls) desteklenir; Excel 2007 ya da 2010 dosyaları (.xlsx) desteklenmez. 64-Bit sürümü Excel 2007 ya da 2010 kullanıyorsanız, dosyayı bir .xls dosyası veya .csv dosyası olarak kaydetmek veya yerine Excel bir 32-bit sürümünü yükleyin.

Güvenlik

İzinler

Eşleşen bir proje çalışması için DQS_MAIN veritabanı dqs_kb_editor veya dqs_administrator rolü olmalıdır.

Başa Dön bağlantısıyla kullanılan ok simgesi[Top]

İlk adım: bir eşleştirme projesi başlatmak

Projedeki dqs istemci uygulamasında oluşturduğunuz veri kalitesi eşleştirme etkinliği gerçekleştirmek.

  1. Data Quality İstemcisi'ni başlatın. Bunu yapma hakkında bilgi için bkz. Veri kalitesi istemci uygulamasını çalıştırmak.

  2. İçinde Data Quality İstemcisiekran Ana sayfa'yı Yeni veri kalite proje eşleşen yeni bir veri kalite proje gerçekleştirilecek. Veri kalite projesi için bir ad girin, bir açıklama girin ve eşleme için kullanmak istediğiniz Bilgi Bankası seçin Bilgi Bankası kullanmak. Tıklayın Matching etkinliği. Tıklayın Next eşleme Sahne Alanı'na devam etmek.

  3. Tıklayın açık veri kalite proje varolan veri kalitesi projesinde eşleştirme yapmak için. Projeyi seçin ve sonra tıklatın Next. (Ya da sen-ebilmek tıkırtı altında bir proje Son veri kalite Projesi.) Kapatılan bir eşleştirme Projesi açarsanız, eşleştirme Projesi Faaliyetin kapatıldığı Sahne Alanı'na devam eder (tarafından belirtildiği gibi devlet projesi adı altında Proje tablosundaki sütunu Son veri kalite Projesi). Bitmiş bir eşleştirme Projesi açarsanız, gidecek Ver sayfa (ve önceki ekranlara geri dönemezsiniz).

Başa Dön bağlantısıyla kullanılan ok simgesi[Top]

Sahne eşleme

Eşleme Sahne Alanı'ndaki eşleşen çözümlemeyi çalıştıracak veri kaynağını tanımlamak ve etki alanlarına etki alanları eşleştirme etkinliği kullanılabilmesi için kaynak sütunlar eşleyin.

  1. Tarih harita sayfasında eşleşen bir veritabanı üzerinde çalıştırmak için bırakın Veri kaynağı olarak SQL Server, eşleşen üzerinde çalıştırmak istediğiniz veritabanını seçin ve sonra tabloyu seçin. Kaynak veritabanı dqs sunucusuyla aynı SQL Server örneği bulunmalıdır. Aksi halde, açılır listede görünmez.

  2. Excel elektronik tablosunda veri eşleştirme çalıştırmak için seçin Excel dosyasını için Veri kaynağı, tıklayın göz Excel dosyasını seçin ve bırakın başlık olarak ilk satırı kullan uygunsa, seçili. İçinde çalışma, çalışma sayfasında veri kaynağı olacak Excel dosyasında seçin. Excel yüklü, Tarih Data Quality İstemcisibir Excel dosyası seçmek için bilgisayar. Excel tarih yüklü değilse Data Quality İstemcisibilgisayar göz düğmesi kullanılabilir olmayacak ve Excel yüklü olmadığını bu metin kutusunun altında bildirilecektir.

  3. Altında eşlemeleri, bir alan için veri kaynağını seçin Kaynak sütun, ilgili etki alanını seçin. Eşleştirme işleminde kullandığınız tüm etki alanları için yineleyin. Eşleşen ilkesinde tanımlanan her etki alanı için uygun kaynak sütun eşlenmelidir. Harita sayfası eşleşen ilke ve sağ taraftaki bölmesinde eşleşen ilke kuralları içinde tanımlanan etki alanlarını görüntüler.

  4. Tıklayın artı (+) eşlemeleri tabloya satır eklemek için denetim veya eksi (-) bir satır kaldırmak için denetim.

  5. Tıklayın Önizleme veri kaynağı verilerini bir SQL Server tablosu, seçtiğiniz görünüm veya seçilen Excel çalışma sayfasını görmek için.

  6. Tıklayın View/Select bileşik etki Bilgi Bankası'ndaki kullanılabilen kompozit etki alanlarının bir listesini görüntülemek ve uygun eşleme.

  7. Tıklayın Next eşleşen Sahne Alanı'na devam etmek.

    [!NOT]

    Tıklayın yakın eşleşen proje aşamasında kaydedip dqs ana sayfaya dönmek için. Bu proje, bir sonraki açışınızda aynı Sahne Alanı'ndan başlayacak. Tıklayın İptal çalışmalarınızı kaybetme eşleştirme etkinliği sonlandırmak ve dqs ana sayfaya dönmek için.

Başa Dön bağlantısıyla kullanılan ok simgesi[Top]

Sahne Alanı eşleştirme

Bu aşamada, kaç maç, orada eşleştirme kuralları temel kaynak veri gösterir, bilgisayar destekli bir eşleştirme işlemi gerçekleştirin. Bu işlem dqs tespit olduğunu, kümedeki her kayıt, kayıt kümeleri gösterir eşleşen bir sonuç tablo oluşturacak kimliği ve eşleşen puanını ve ilk lider kayıt kümesi. Lider kayıt kümesindeki rasgele seçilir. Hayatta kalan kayıt tarihinde survivorship kuralı seçerek belirlemek Ver sayfa eşleşen proje çalıştırdığınızda. Her ek bir satır kümesinde bir eşleşme olarak kabul edilir; (lider kayda göre) puanını eşleşen sonuçlar tabloda verilmiştir. Küme kayıt aynı küme içinde lider kayıt ID numarasıdır.

Eşleme sonuçlarında istediğiniz ve reddetmek değil istediğiniz eşleşen verilere filtre uygulayabilirsiniz. Eşleştirme işlemi için profil oluşturma verileri, Bütün, özelliklerini uygulanan eşleştirme kuralları hakkında ve bir bütün olarak eşleşen sonuç ile ilgili istatistikleri görüntüleyebilirsiniz. Eşleştirme işlemi örtüşen veya örtüşmeyen kümeleri belirleyebilir ve birden çok kez çalıştırılmasını Eğer yeni kaynaktan kopyalanan ve re-indexed veri veya önceki veriler üzerinde yapılabilecek.

  1. Tarih eşleme sayfaseçin Overlapping kümeleri eşleşen yürütüldüğünde, Özet ve tüm kümeleri için aşağıdaki kayıtlarını gruplar kümelerinin kayıtları ortak bile görüntülemek için aşağı açılan listeden. Seçin sigara örtüşen kümeleri eşleşen yürütüldüğünde kayıtları tek bir küme olarak ortak noktası kümelerini görüntülemek için.

  2. Tıklayın yeniden veri kaynağından hazırlama tablosuna veri kaynağından veri kopyalama ve eşleştirme proje çalıştırdığınızda yeniden dizin oluştur (varsayılan). Tıklayın önceki veri yürütme eşleşen bir proje hazırlama tablosuna veri kopyalama ve veri re-indexing olmadan çalıştırmak için. Önceki veri yürütme eşleştirme Projesi, ilk çalıştırma için devre dışı bırakılır veya eşlemeye değiştirirseniz harita sayfa ve basın Evet içinde aşağıdaki açılır. Her bu gibi durumlarda da yeniden indeksle gerekir. Eşleştirme Projesi değişmemişse yeniden dizin oluşturmak için gerekli değildir. Önceki veri yürütme, performans yardımcı olabilir.

  3. Tıklayın Start eşleşen seçili veri kaynağı üzerinde çalıştırmak için.

  4. Tıklayın Dur eşleşen projeyi durdurmak ve sonuçları atmak istiyorum.

  5. Eşleştirme işlemi tamamlandıktan sonra doğrulayın kümeleri Eşleşen sonuç tablo uygun ve istatistikleri görüntülemek Profiler ve Eşleşen sonuç olun ihtiyacınız olan sonuçları elde etmek için sekmeleri. Eşleşen kayıtları seçerek görüntülemek Matched için filtre veya eşleşmeyen kayıtları seçerek eşleşmeyen.

  6. Eşleşen ilke birden fazla eşleştirme kuralları varsa tıklayın Eşleştirme kuralları her kural için simgeyi tanımlamak için sekme ve kural tanımlayarak hangi kuralın kayıt bir eşleşme olarak tanımlanan doğrulayın kural sütununda Eşleşen sonuç tablo.

  7. Eğer bir Özet olmayan kayıt tablosundan seçin ve tıklatın Ayrıntılara simgesi (ya da çift kayıt), dqs görüntüler bir Eşleşen Puanı ayrıntıları görüntüler çift kayıt ve kendi özet kayıt (ve tüm kendi alanlarındaki değerleri), halk onları ve eşleşen bir ayrıntıya inme Puan Puan edinildi her alanın katkıları. Özet kayıt çift açılır menüsü görüntülenmez.

  8. Tıklayın Çöküşü tüm simgesi görüntülenen kayıtları daraltmak için Eşleşen sonuçların yalnızca Özet kaydı, yinelenen kayıtları eklemek için tablo. Tıklayın Tümünü Genişlet tüm yinelenen kayıtları dahil etmek için eşleşen sonuçların tabloda görüntülenen kayıtların genişletin.

  9. Bir kaydın eşleşen sonuçları reddetmek için tıklayın reddedildi kayıt için onay kutusu.

  10. Görüntülenecek kayıt olmalıdır eşleşen düzeyini belirleyen puanı eşleşen en azından değiştirmek için seçin dak. Puanı eşleşen yukarıdaki tabloyu sağ tarafındaki simge ve daha büyük bir sayı girin. En düşük eşleşen puanın % 80 varsayılan olarak ayarlanır. Tıklayın yenilemek tablosunun içeriğini değiştirmek için.

  11. Çözümleme tamamlandıktan sonra Start düğmesini kapatır içine bir yeniden düğme. Tıklayın yeniden analizi projenin yeniden çalıştırmak için. Ancak, önceki analiz sonuçları henüz, bu yüzden tıklayarak kaydedilmedi yeniden o önceki verilerin kaybolmasına neden olur. Devam etmek için tıklayın Evet içinde açılır. Analiz çalıştığı gibi sayfa bırakmayın veya çözümleme işleminin sona erdirilecek.

  12. Tıklayın Next survivorship için devam ve sahne vermek için.

Başa Dön bağlantısıyla kullanılan ok simgesi[Top]

Survivorship ve sahne verme

Survivorship, kümede eşleşen başka kayıtlar yerine her küme için kurtulan kayıt işlemi Data Quality Services belirler. Ardından, SQL Server veritabanında, bir .csv dosyası veya Excel dosyası tabloya eşleşen ve/veya survivorship sonuçlarını verir.

Survivorship opsiyoneldir. Survivorship, hangi-cekti kullanma durumunda dqs belirlenmiş eşleşen analizinde Özet kayıt çalıştırmadan sonuçlar verebilir. İki veya daha fazla kayıt kümesinde survivorship kural uymak, survivorship işlemi düşük kayıt seçin kalanlar için kimliği arasında çakışan kayıtları. Dul farklı dosyaları veya farklı survivorship kuralları kullanarak tabloları verebilirsiniz.

  1. Tarih Ver sayfasında, eşleşen verileri için vermek istediğiniz hedefi seçin Hedef türü: SQL Server, csv dosyasını, veya Excel dosyasını.

  2. Seçtiyseniz SQL Server için Hedef türü, sonuçlar vermek için veritabanını seçin Veritabanı adı.

    Önemli notÖnemli

    Hedef veritabanı dqs sunucusuyla aynı SQL Server örneği bulunmalıdır. Aksi halde, açılır listede görünmez.

  3. Onay kutusunu seçmek Eşleşen sonuç eşleşen sonuç (açıklama için bakınız yukarıda) bir SQL Server veritabanında belirtilen tablo veya belirlenmiş .csv veya Excel dosyası vermek için. Onay kutusunu seçmek Survivorship sonuçları survivorship sonuçları (açıklama için bakınız yukarıda) bir SQL Server veritabanında belirtilen tablo veya belirlenmiş .csv veya Excel dosyası vermek için.

    Aşağıdaki sonuçları eşleştirmek için verilecek:

    • Kümeleri ve kural adı ve puanı dahil her küme eşleşen kayıtların listesi. Özet kayıt "Özet" işaretlenir. Kümeleri ihracat listenin başında görüntülenir.

    • Kural adı ve puanı "null" ile eşleşmeyen kayıtları listesi sütun. Bu kayıtları kümeler sonra ihraç listesine eklenir.

    Aşağıdaki survivorship sonuç için verilecek:

    • Survivorship süreci survivorship kurala göre belirlenen kurtulan kayıtları listesi. Bu kayıtları verme listenin başında görüntülenir.

    • Eşleşen kayıt kümeleri bulunmayan eşleşmeyen kayıtları listesi. Bu kayıtlar, sonra kurtulan sonuçları eklenir.

  4. Eğer seçtiğiniz SQL Server için Hedef türü, sonuçları için vermek istediğiniz tablonun adını girin Tablo adı. Eşleşen sonuç ve survivorship sonuçları veriyorsanız, hedef tabloları veritabanına özgü farklı adlara sahip olmalıdır.

  5. Seçtiyseniz csv dosyasını için Hedef türü, csv dosyası için vermek istediğiniz dosya ve yolu girin csv dosya adı.

  6. Seçtiyseniz Excel dosyasını için Hedef türü, csv dosyası için vermek istediğiniz dosya ve yolu girin Excel dosya adı.

  7. Survivorship kuralı aşağıdaki gibi seçin:

    • Seçin Özet kayıt kurtulan keyfi dqs tarafından seçilen ilk Özet kayıt olarak tanımlamak için (varsayılan).

    • Seçin en eksiksiz ve uzun kayıt kalan kaydı ile doldurulan alanlar, en çok sayıda tanımlamak için ve her alanda en yaygın olarak kullanılan terimler vardır. Tüm kaynak alanlar kontrol edilir, hatta bir etki alanına Tarih eşleştirilmiş değil bu alanları harita sayfa.

    • Seçin en eksiksiz kayıt kalan kaydı ile doldurulan alanlar en çok sayıda tanımlamak için. Doldurulmuş bir alan en az bir değer (dize, sayısal veya her ikisi) içerir. Tüm kaynak alanlar kontrol edilir, hatta bir etki alanına Tarih eşleştirilmiş değil bu alanları harita sayfa. Doldurulmuş bir alan en az bir değer (dize, sayısal veya her ikisi) içerir.

    • Seçin en uzun kayıt kalan kaydı ile onun kaynak alanlarındaki koşulları en çok sayıda tanımlamak için. Her kaydın uzunluğunu belirlemek için şartlar uzunluğu tüm kaynak alanları, bir etki alanına Tarih eşleştirilmiş değil bile bu alanları dqs doğrular harita sayfa.

  8. İstatistikleri görüntülemek Profiler sekmesini gerekli sonuçları elde doğrulayın.

  9. Tıklayın Ver sonuç vermek. Bu ilerleme ve ihracat sonuçlarını gösterir bir eşleştirme verme iletişim kutusu görüntüler.

    • Eğer seçtiğiniz SQL Server seçili veritabanındaki verileri hedef olarak, belirtilen ada sahip yeni bir tablo oluşturulur.

    • Seçtiyseniz csv dosyasını üzerinde yerinde bir .csv dosyası oluşturulacak veri hedef Data Quality Sunucusubilgisayar ile daha önce de belirttiğiniz dosya adı Csv dosya adı kutusu.

    • Seçtiyseniz Excel dosyasını üzerinde yerinde bir .xlsx dosyası oluşturulacak veri hedef Data Quality Sunucusubilgisayar ile daha önce de belirttiğiniz dosya adı Excel dosya adı kutusu.

  10. Verme işlemini başarıyla tamamlandığını doğrulayın ve ardından yakın.

  11. Tıklayın son eşleşen projeyi tamamlamak için.

    [!NOT]

    Bir eşleştirme Projesi bitmiş ve daha sonra yeniden kullanmak, o yayımlandığında bu Bilgi Bankası yerinde kullanır. Proje tamamlandı sonra Bilgi Bankası için yaptığınız değişiklikleri kullanmaz. Bu değişiklikleri'ni kullanın veya yeni bir Bilgi Bankası kullanmak için eşleşen yeni bir proje oluşturmak gerekecektir. Eğer oluşturdu ama, bir eşleştirme Projesi, bitmedi projesinde eşleştirme çalıştırırsanız Öte yandan, eşleşen ilkeyi yayınladığınız değişiklikleri kullanılacaktır.

Başa Dön bağlantısıyla kullanılan ok simgesi[Top]

Takip: bir eşleştirme Projesi çalıştırdıktan sonra

Çalıştırmanızdan sonra bir eşleştirme Projesi, Bilgi Bankası, eşleşen ilke değiştirme ve oluşturabilir ve Güncellenme Eşleştirme ilkesi alan başka bir eşleştirme Projesi çalıştırın. Daha fazla bilgi için, bkz. Eşleştirme ilkesi oluşturma.

Başa Dön bağlantısıyla kullanılan ok simgesi[Top]

Profiler ve sonuçları sekmeleri

Profiler ve sonuçları sekmeler eşleştirme işlemi için istatistikleri içerir.

Profiler sekmesi

Tıklayın Profiler sekmesini ve ilke kurala dahil her alan için kaynak veritabanı istatistiklerini görüntülemek için. İlke kuralı çalıştırmak gibi istatistikler güncelleştirilir. Profil oluşturma işlemi veri kalitesini mümkün olduğu ölçüde belirlemek yardımcı de-duplication sürecinin etkinliğini değerlendirmenize yardımcı olur. Profil oluşturma doğruluk bir eşleştirme projesi için önemli değildir.

Kaynak veritabanı istatistikler şunları içerir:

  • Kayıtlar: veritabanındaki kayıtları toplam sayısı

  • Toplam değerleri: alanlarındaki değerleri sayısı

  • Yeni değerler: önceki çalışma ve bütün bunların yüzdesini beri yeni eklenen değerleri sayısı

  • Benzersiz değerler: alanların ve bütün bunların yüzdesini benzersiz değerler sayısı

  • Yeni benzersiz değerler: alanların ve bütün bunların yüzdesini yeni benzersiz değerler sayısı

Alan istatistikler şunları içerir:

  • Alan: eşlemelerini dahil alanın adı.

  • Etki alanı: alanına eşlenen etki alanının adı.

  • Yeni: yeni eşleşme bulundu sayısını ve bunların toplam yüzdesini

  • Benzersiz: benzersiz kayıtlar alanında, kendi percentaqe toplam sayısı

  • Tam: kuralı çalıştırmak tam yüzdesidir.

Eşleşen ilke bildirimleri

Eşleştirme ilkesi etkinlik için aşağıdaki koşullar bildirimler sonucu:

  • Tüm kayıtları boş bir alandır; eşleme ortadan önerilir.

  • Alanı bütünlüğü skor çok düşüktür; eşleme ortadan kaldırmak isteyebilirsiniz.

  • Bir alandaki tüm değerleri geçersiz; eşleme ve alan içeriği alan kurallarına uygunluğunu doğrulamalısınız.

  • Geçerli değerler alanındaki düşük düzeyde olduğunu; eşleme ve alan içeriği alan kurallarına uygunluğunu doğrulamalısınız.

  • Bu alanı benzersizlik yüksek düzeyde olduğunu. İlke eşleme bu alanı kullanarak, eşleşen sonuç azaltabilirsiniz.

Eşleştirme kuralları sekmesi

Eşleşen ilke ve kural koşulları kurallar listesini görüntülemek üzere bu sekmeyi tıklatın.

  • Kurallar listesi
    Eşleştirme ilkesi tüm eşleşen kurallar listesini görüntüler. Bir kural koşulları Kuralı eşleştirme kuralı tabloda görüntülemek için seçin.

  • Eşleşen kural tablosu
    Her etki alanı, benzerlik değeri, ağırlık ve önkoşul seçimi dahil olmak üzere seçili kural, görüntüler.

Eşleşen sonuçları sekmesi

Tıklayın Eşleşen sonuç analizi, proje ve eşleştirme kuralı ya da bu Bilgi Bankası kuralları için seçilen bilgiyi kullanarak veri kaynağını istatistiklerini görüntülemek için sekme. İstatistikler şunları içerir:

  • Veritabanındaki kayıtları toplam sayısı

  • Veritabanındaki eşleşen kayıtları toplam sayısı

  • Veritabanında yineleme olarak kabul edilmez kayıt sayısı

  • Keşfedilen küme sayısı

  • Ortalama küme boyutu (yinelenen kayıt kümeleri sayısına bölünmesiyle sayısı)

  • En az sayıda yineleme kümesinde hamleyle

  • Yineleme kümesindeki en yüksek sayıda