Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Önemli
Sql Server 2025'te (17.x) Veri Kalitesi Hizmetleri (DQS) kaldırılmıştır . SQL Server 2022 (16.x) ve önceki sürümlerde DQS'yi desteklemeye devam ediyoruz.
Bu konu başlığı altında, Veri Kalitesi Hizmetleri'nde (DQS) bir veri kalitesi projesi kullanarak verilerinizi temizleme adımları açıklanmaktadır. Veri temizleme, yüksek kaliteli bir veri kümesine karşı DQS'de oluşturulmuş bir bilgi bankası kullanılarak kaynak verilerinizde gerçekleştirilir. Daha fazla bilgi için bkz. Bilgi Bankası Oluşturma.
Veri temizleme dört aşamada gerçekleştirilir: temizlenecek veri kaynağını tanımladığınız ve bunu bilgi bankasındaki gerekli etki alanlarıyla eşlediğiniz bir eşleme aşaması, DQS'nin temizlenecek verilere bilgi bankasını uyguladığı ve kaynak verilerde değişiklik önerdiği/yaptığı bilgisayar destekli temizleme aşaması, veri görevlilerinin veri değişikliklerini analiz edebildiği etkileşimli bir temizleme aşaması, ve veri değişikliklerini kabul edin/reddedin ve son olarak temizlenen verileri dışarı aktarmanızı sağlayan dışarı aktarma aşaması. Bu işlemlerin her biri temizleme etkinliği sihirbazının ayrı bir sayfasında gerçekleştirilir; böylece farklı sayfalara gidip gelmeniz, işlemi yeniden çalıştırmanız ve belirli bir temizleme işlemini kapatıp işlemin aynı aşamasına dönmeniz sağlanır. DQS, veri temizleme hakkında bilinçli kararlar vermenize olanak tanıyan kaynak veriler ve temizleme sonuçları hakkında istatistikler sağlar.
Başlamadan Önce
Önkoşullar
Temizleme etkinliği için uygun eşik değerlerini belirtmiş olmanız gerekir. Bunu yapma hakkında bilgi için bkz. Temizleme ve Eşleştirme için Eşik Değerlerini Yapılandırma.
Veri Kalitesi Sunucusu'nda karşılaştırmak ve kaynak verilerinizi temizlemek istediğiniz bir DQS bilgi bankası bulunmalıdır. Ayrıca, bilgi bankası temizlemek istediğiniz veri türü hakkında bilgi içermelidir. Örneğin, ABD adreslerini içeren kaynak verilerinizi temizlemek istiyorsanız, ABD adresleri için "yüksek kaliteli" örnek verilerle oluşturulmuş bir bilgi bankanız olmalıdır.
Temizlenecek kaynak veriler bir Excel dosyasındaysa, Veri Kalitesi İstemci bilgisayarına Microsoft Excel yüklenmelidir. Aksi takdirde, eşleme aşamasında Excel dosyasını seçemezsiniz. Microsoft Excel tarafından oluşturulan dosyaların uzantısı .xlsx, .xlsveya .csvolabilir. Excel'in 64 bit sürümü kullanılıyorsa, yalnızca Excel 2003 dosyaları (.xls) desteklenir; Excel 2007 veya 2010 dosyaları (.xlsx) desteklenmez. Excel 2007 veya 2010'un 64 bit sürümünü kullanıyorsanız, dosyayı .xls dosyası veya .csv dosyası olarak kaydedin veya bunun yerine Excel'in 32 bit sürümünü yükleyin.
Güvenlik
İzinler
Veri temizleme gerçekleştirmek için DQS_MAIN veritabanında dqs_kb_editor veya dqs_kb_operator rolüne sahip olmanız gerekir.
Veri Kalitesini Temizleme Projesi Oluşturma
Veri temizleme işlemini gerçekleştirmek için bir veri kalitesi projesi kullanmanız gerekir. Veri temizleme kalite projesi oluşturmak için:
Veri Kalitesi Projesi Oluşturma başlığındaki 1-3 arası adımları izleyin.
3.d. adımda Temizleme etkinliğini seçin.
Temizleme veri kalitesi projesi oluşturmak için Oluştur'a tıklayın.
Bu, bir temizleme veri kalitesi projesi oluşturur ve temizleme veri kalitesi sihirbazının Harita sayfasını açar.
Eşleme Aşaması
Eşleme aşamasında, temizlenecek kaynak verilere bağlantıyı belirtir ve kaynak verilerdeki sütunları seçilen bilgi bankasındaki uygun etki alanlarıyla eşlersiniz.
Temizleme veri kalitesi sihirbazının Harita sayfasında temizlenecek kaynak verilerinizi seçin: SQL Server veya Excel Dosyası:
SQL Server: Kaynak verilerinizi bu veritabanına kopyaladıysanız kaynak veritabanı olarak DQS_STAGING_DATA seçin ve ardından kaynak verilerinizi içeren uygun tabloyu/görünümü seçin. Aksi takdirde, kaynak veritabanınızı ve uygun tabloyu/görünümü seçin. Veritabanı açılan listesinde kullanılabilir olması için kaynak veritabanınızın Veri Kalitesi Sunucusu ile aynı SQL Server örneğinde bulunması gerekir.
Excel Dosyası: Gözat tıklayın ve temizlenecek verileri içeren Excel dosyasını seçin. Bir Excel dosyası seçmek için Veri Kalitesi İstemcisi bilgisayarına Microsoft Excel yüklenmelidir. Aksi takdirde Gözat düğmesi kullanılamaz ve bu metin kutusunun altında Microsoft Excel'in yüklü olmadığı size bildirilir. Ayrıca, Excel dosyasının ilk satırında üst bilgi verileri varsa, İlk satırı üst bilgi olarak kullan onay kutusunu seçili bırakın.
Eşlemeler'in altında, Kaynak Sütun sütunundaki açılan listeden bir kaynak sütun seçip aynı satırdaki Etki Alanı sütunundaki açılan listeden bir etki alanı seçerek kaynak verilerinizdeki veri sütunlarını bilgi bankasındaki uygun etki alanlarıyla eşleyin. Kaynak verilerinizdeki tüm sütunları bilgi bankasındaki uygun etki alanlarıyla eşlemek için bu adımı yineleyin. Gerekirse, eşleme tablosuna satır eklemek için Sütun eşlemesi ekle simgesine tıklayabilirsiniz.
Uyarı
Yalnızca kaynak veri türü DQS'de destekleniyorsa ve DQS etki alanı veri türüyle eşleşiyorsa veri temizleme gerçekleştirmek için kaynak verilerinizi bir DQS etki alanına eşleyebilirsiniz. Desteklenen kaynak veri türleri hakkında bilgi için bkz. DQS Etki Alanları için Desteklenen SQL Server ve SSIS Veri Türleri.
Sql Server tablosundaki veya seçtiğiniz görünümdeki verileri ya da seçtiğiniz Excel çalışma sayfasındaki verileri görmek için Önizleme veri kaynağı simgesine tıklayın.
Kaynak sütuna eşlenen bileşik etki alanlarının listesini görüntülemek için Bileşik Etki Alanlarını Görüntüle/Seç'e tıklayın. Bu düğme yalnızca kaynak sütuna eşlenmiş en az bir bileşik etki alanınız varsa kullanılabilir.
Bilgisayar destekli temizleme aşamasına (Temizleme sayfası) devam etmek için İleri'ye tıklayın.
Computer-Assisted Temizleme Aşaması
Bilgisayar destekli temizleme aşamasında, kaynak verileri bilgi bankasındaki eşlenmiş etki alanlarına göre analiz eden ve veri değişiklikleri yapan/öneren otomatik bir veri temizleme işlemi çalıştırırsınız.
Veri kalitesi sihirbazının Temizle sayfasında, bilgisayar destekli temizleme işlemini çalıştırmak için Başlat'a tıklayın. DQS, verilerinizi seçilen bilgi bankasına göre analiz etmek ve ardından temizlemek için belirtilen eşik düzeylerine göre gelişmiş algoritmalar ve güvenilirlik düzeyleri kullanır. DQS'de bilgisayar destekli temizlemenin nasıl gerçekleştiği hakkında ayrıntılı bilgi için bkz. Veri TemizlemedeBilgisayar Destekli Temizleme.
Önemli
Veri analizi tamamlandıktan sonra Başlangıç düğmesi Yeniden Başlat düğmesine dönüşür. Önceki çözümlemenin sonuçları henüz kaydedilmediyse, Yeniden Başlat'a tıklanması önceki verilerin kaybolmasına neden olur. Analiz çalışırken sayfadan ayrılmayın, aksi takdirde analiz işlemi sonlandırılır.
Temizleme projesi için kullanılan bilgi bankası, temizleme projesi oluşturulduktan sonra güncelleştirilmiş ve yayımlanmışsa, Başlat'a tıklandığında temizleme için en son bilgi bankasını kullanıp kullanmayacağınız sorulur. Bu durum genellikle bilgi bankasını kullanarak bir veri kalitesi projesi oluşturduysanız, Temizleme projesini orta yoldan Kapat'a tıklayarak kapattıysanız ve daha sonra temizleme gerçekleştirmek için veri kalitesi projesini yeniden açtığınızda oluşabilir. Bu arada, temizleme projesinde kullanılan bilgi bankası güncelleştirildi ve yayımlandı.
Benzer şekilde, temizleme projesi için kullanılan bilgi bankası bilgisayar destekli temizlemeyi en son çalıştırdığınızdan sonra güncelleştirilmiş ve yayımlanmışsa, Yeniden Başlat'a tıklandığında temizleme için en son bilgi bankasını kullanıp kullanmayacağınız sorulur.
Her iki durumda da, bilgisayar destekli temizleme için güncelleştirilmiş bilgi bankasını kullanmak için Evet'e tıklayın. Ayrıca, geçerli eşlemeler ile güncelleştirilmiş bilgi bankası (etki alanları silinmiş veya etki alanı veri türü değiştirilmiş gibi) arasında çakışma varsa, ileti güncelleştirilmiş bilgi bankasını kullanmak için geçerli eşlemeleri düzeltmenizi de ister. Evet'e tıklanması, bilgisayar destekli temizleme işlemine devam etmeden önce eşlemeleri düzeltebileceğiniz Harita sayfasına götürür.
Bilgisayar destekli temizleme aşamasında, gerçek zamanlı veri profili oluşturma ve bildirimleri görüntülemek için Profil Oluşturucu sekmesine tıklayarak profil oluşturucuyu açabilirsiniz. Daha fazla bilgi için Profil Oluşturucu İstatistikleri'ne bakın.
Sonuçlardan memnun değilseniz Geri'ye tıklayarak Harita sayfasına dönün, bir veya daha fazla eşlemeyi gerektiği gibi değiştirin, Temizle sayfasına dönün ve yeniden başlat'a tıklayın.
Bilgisayar destekli temizleme işlemi tamamlandıktan sonra, etkileşimli temizleme aşamasına geçmek için İleri'ye tıklayın (Sonuçları Yönet ve Görüntüle sayfası).
Etkileşimli Temizleme Aşaması
Etkileşimli temizleme aşamasında, DQS'nin önerdiği değişiklikleri görebilir ve değişiklikleri onaylayarak veya reddederek bunların uygulanıp uygulanmayacağına karar verilmektedir. Sonuçları yönet ve görüntüle sayfasının sol bölmesinde DQS, eşleme aşamasında daha önce eşlediğiniz tüm etki alanlarının listesini ve bilgisayar destekli temizleme aşamasında her etki alanına karşı analiz edilen kaynak verilerdeki değerlerin sayısını görüntüler. Sonuçları yönet ve görüntüle sayfasının sağ bölmesinde, etki alanı kurallarına, söz dizimi hata kurallarına ve gelişmiş algoritmalara bağlı kalarak DQS, güvenilirlik düzeyini kullanarak verileri beş sekme altında kategorilere ayırır. Güvenilirlik düzeyi, düzeltme veya öneri için DQS'nin kesinlik düzeyini gösterir ve aşağıdaki eşik değerlerini temel alır:
Otomatik Düzeltme eşiği: Bu eşiğin üzerinde güvenilirlik düzeyine sahip olan tüm değerler DQS tarafından otomatik olarak düzeltilir. Ancak veri temsilcisi, etkileşimli temizleme sırasında değişikliği geçersiz kılabilir. Otomatik düzeltme eşiği değerini, Yapılandırma ekranındaki Genel Ayarlar sekmesinde belirtebilirsiniz. Daha fazla bilgi için bkz. Temizleme ve Eşleştirmeiçin Eşik Değerlerini Yapılandırma .
Otomatik Öneri eşiği: Bu eşiğin üzerinde, ancak otomatik düzeltme eşiğinin altında güvenilirlik düzeyine sahip olan tüm değerler, değiştirme değeri olarak önerilir. DQS değişikliği yalnızca veri temsilcisi onaylarsa yapar. Otomatik öneri eşiği değerini, Yapılandırma ekranındaki Genel Ayarlar sekmesinde belirtebilirsiniz. Daha fazla bilgi için bkz. Temizleme ve Eşleştirmeiçin Eşik Değerlerini Yapılandırma .
Diğer: Otomatik öneri eşik değerinin altındaki tüm değerler DQS tarafından değiştirilmeden bırakılır.
Güvenilirlik düzeyine bağlı olarak, değerler aşağıdaki beş sekme altında görüntülenir:
| Sekme | Açıklama |
|---|---|
| Önerilen | DQS'nin otomatik öneri eşik değerinden daha yüksek ancak otomatik düzeltme eşik değerinden düşük güvenilirlik düzeyine sahip önerilen değerleri bulduğu etki alanı değerlerini görüntüler. Önerilen değerler, özgün değerle karşılaştırmalı olarak Doğru Değer sütununda görüntülenir. Değerin tüm örnekleri için öneriyi kabul etmek veya reddetmek için, üst kılavuzdaki bir değere göre Onayla veya Reddet sütunundaki radyo düğmesine tıklayabilirsiniz. Bu durumda, kabul edilen değer Düzeltildi sekmesine, reddedilen değer ise Geçersiz sekmesine taşınır. |
| Yeni | DQS'nin yeterli bilgiye sahip olmadığı ve bu nedenle başka bir sekmeye eşlenemediği geçerli etki alanını görüntüler. Ayrıca, bu sekme otomatik öneri eşik değerinden daha düşük güvenilirlik düzeyine sahip ancak geçerli olarak işaretlenecek kadar yüksek değerler de içerir. Değerin doğru olduğunu düşünüyorsanız Onayla sütunundaki radyo düğmesine tıklayın. Aksi halde Reddet sütunundaki radyo düğmesine tıklayın. Kabul edilen değer Doğru sekmesine, reddedilen değer ise Geçersiz sekmesine taşınır. Ayrıca, Doğruya sütunundaki özgün değer yerine doğru değeri manuel olarak yazabilirsiniz ve sonra değişikliği kabul etmek için Onayla sütunundaki radyo düğmesine tıklayabilirsiniz. Bu durumda, değer Düzeltildi sekmesine taşınır. |
| geçersiz | Bilgi bankasındaki etki alanında geçersiz olarak işaretlenmiş etki alanı değerlerini veya etki alanı kuralında başarısız olan değerleri görüntüler. Bu sekme, diğer dört sekmeden herhangi birinde kullanıcı tarafından reddedilen değerleri de içerir. Ancak değerin doğru olduğunu düşünüyorsanız Onayla sütunundaki radyo düğmesine tıklayın. Kabul edilen değer Doğru sekmesine taşınır. Ayrıca, özgün değerin yerine doğru değeri Doğruya Çevir sütununda el ile yazabilir, ve onaylamak için Onayla sütunundaki radyo düğmesine tıklayabilirsiniz. Bu durumda, değer Düzeltildi sekmesine taşınır. |
| Düzeltilmiş | Otomatik temizleme işlemi sırasında DQS tarafından düzeltilen etki alanı değerlerini görüntüler. DQS, otomatik düzeltme eşik değerinin üzerinde güvenilirlik düzeyine sahip değer için bir düzeltme buldu. Düzeltilen değerler, özgün değerin karşısında, Doğruya Düzelt sütununda görüntülenir. Varsayılan olarak, Onayla sütunundaki değere göre radyo düğmesi seçilidir. Gerekirse, Reddetme sütunundaki radyo düğmesine tıklayarak önerilen düzeltmeyi reddederek Geçersizsekmesine taşıyabilir veya Doğru Değer sütununa doğru değeri el ile yazabilir ve sonra değişikliği kabul etmek için Onayla sütunundaki radyo düğmesine tıklayıp Düzeltildi sekmesine taşıyabilirsiniz. |
| Doğru | Doğru bulunan etki alanı değerlerini görüntüler. Örneğin, değer bir etki alanı değeriyle eşleşmiş. Bu sekme, Yeni ve Geçersiz sekmelerindeki Onayla sütunundaki radyo düğmesine tıklayarak kullanıcı tarafından onaylanan değerleri de içerir. Varsayılan olarak, Onayla sütunundaki radyo düğmesi her değer için seçilir. Ancak, bu sekmedeki bir değerin yanlış olduğunu düşünüyorsanız, Reddetme sütunundaki radyo düğmesine tıklayarak değeri Geçersiz sekmesine taşıyabilir veya Doğru Kime sütunundaki değerin yerine el ile doğru değeri yazabilir ve sonra değişikliği kabul etmek için Onayla sütunundaki radyo düğmesine tıklayabilirsiniz. ve Düzeltildi sekmesine taşıyın. |
Verileri etkileşimli olarak temizlemek için:
Temizleme veri kalitesi sihirbazının Sonuçları yönet ve görüntüle sayfasında, sol bölmede bir alan adına tıklayın.
Beş sekmenin altındaki etki alanı değerlerini gözden geçirin ve daha önce açıklandığı gibi uygun eylemi gerçekleştirin.
Sağ üst bölme, seçili etki alanındaki her değer için aşağıdaki bilgileri görüntüler: özgün değer, örnek sayısı (kayıt), başka bir (doğru) değer belirtmek için bir kutu, güvenilirlik düzeyi ( Doğru sekmesi altındaki değerler için kullanılamaz), değerdeki DQS eyleminin nedeni ve değerle ilgili düzeltmeleri ve önerileri onaylama ve reddetme seçeneği.
Tavsiye
Sağ üst bölmede, Tüm koşulları onayla veya Tüm terimleri reddet simgesine tıklayarak seçili etki alanındaki tüm değerleri onaylayabilir veya reddedebilirsiniz. Alternatif olarak, seçili etki alanındaki bir değere sağ tıklayabilir ve kısayol menüsünde Tümünü kabul et veya Tümünü reddet'e tıklayabilirsiniz.
Alt bölme, sağ üst bölmede seçilen etki alanı değerinin tek tek oluşumlarını görüntüler. Aşağıdaki bilgiler görüntülenir: başka bir (doğru) değer belirtmek için bir kutu, güvenilirlik düzeyi ( Doğru sekmesinin altındaki değerler için kullanılamaz), değerdeki DQS eyleminin nedeni, değerle ilgili düzeltmeleri ve önerileri onaylama ve reddetme seçeneği ve özgün değer.
Bir etki alanı oluştururken Yazım Denetleyicisi özelliğini etkinleştirdiyseniz, olası bir hata olarak belirlenen etki alanı değerlerinin altında dalgalı kırmızı çizgiler görüntülenir. Alt çizgi değerin tamamı için görüntülenir. Örneğin, "New York" yanlış bir şekilde "Neu York" olarak yazılıyorsa, yazım denetleyicisi yalnızca "Neu" değil, "Neu York" altında kırmızı alt çizgi görüntüler. Değere sağ tıklarsanız önerilen düzeltmeleri görürsünüz. 5'ten fazla öneri varsa, geri kalanını görüntülemek için bağlam menüsünde Diğer öneriler'e tıklayabilirsiniz. Hata görüntüsünde olduğu gibi, öneriler değerin tamamının yerini alır. Önceki örnekte "New York" yalnızca "New" değil, bir öneri olarak görüntülenecek. Önerilerden birini seçebilir veya sözlüğe bu değer için görüntülenecek bir değer ekleyebilirsiniz. Değerler, kullanıcı hesabı düzeyinde sözlükte depolanır. Yazım denetleyicisi bağlam menüsünden bir öneri seçtiğinizde, seçilen öneri Doğruya sütununa eklenir. Ancak, Doğruya Düzelt sütununda bir öneri seçerseniz, sütundaki değer seçilen öneriyle değiştirilir.
Yazım denetleyicisi özelliği, etkileşimli temizleme aşamasında varsayılan olarak etkindir. Etkileşimli temizleme aşamasında Yazım Denetleyicisini Etkinleştir/Devre Dışı Bırak simgesine tıklayarak veya etki alanı değerleri alanına sağ tıklayıp kısayol menüsünde Yazım Denetleyicisi'ne tıklayarak yazım denetleyicisini devre dışı bırakabilirsiniz. Yeniden etkinleştirmek için aynı işlemi yapın.
Uyarı
Yazım denetleyicisi özelliği yalnızca üst bölmede (etki alanı değerleri) kullanılabilir. Ayrıca, bileşik etki alanları için yazım denetleyicisini etkinleştiremez veya devre dışı bırakamazsınız. Dize türünde olan ve yazım denetleyicisi özelliği için etkinleştirilen bileşik etki alanlarındaki alt etki alanları, etkileşimli temizleme aşamasında varsayılan olarak yazım denetleyicisi işlevselliğini etkinleştirir.
Etkileşimli temizleme aşamasında, gerçek zamanlı veri profili oluşturma ve bildirimleri görüntülemek için Profil Oluşturucu sekmesine tıklayarak profil oluşturucuyu açabilirsiniz. Daha fazla bilgi için Profil Oluşturucu İstatistikleri'ne bakın.
Tüm etki alanı değerlerini gözden geçirdikten sonra, dışarı aktarma aşamasına geçmek için İleri'ye tıklayın.
Dışarı Aktarma Aşaması
Dışarı aktarma aşamasında, temizlenmiş verilerinizi dışarı aktarmak için parametreleri belirtirsiniz: ne ve nereye dışarı aktarılacak.
Temizleme veri kalitesi sihirbazının Dışarı Aktar sayfasında, temizlenmiş verilerinizi dışarı aktarmak için hedef türü seçin: SQL Server, CSV Dosyası veya Excel Dosyası.
Önemli
Excel'in 64 bit sürümünü kullanıyorsanız, temizlenmiş verilerinizi bir Excel dosyasına aktaramazsınız; yalnızca SQL Server veritabanına veya .csv dosyasına aktarabilirsiniz.
SQL Server: Verilerinizi burada dışarı aktarmak istiyorsanız hedef veritabanı olarak DQS_STAGING_DATA seçin ve dışarı aktarılan verilerinizi depolamak için oluşturulacak bir tablo adı belirtin. Aksi takdirde, verileri farklı bir veritabanına aktarmak istiyorsanız başka bir veritabanı seçin ve dışarı aktarılan verilerinizi depolamak için oluşturulacak bir tablo adı belirtin. Veritabanı açılan listesinde kullanılabilir olması için hedef veritabanınızın Veri Kalitesi Sunucusu ile aynı SQL Server örneğinde bulunması gerekir.
CSV Dosyası: Gözat'a tıklayın ve temizlenen verileri dışarı aktarmak istediğiniz .csv dosyasının adını ve konumunu belirtin. Temizlenen verileri dışarı aktarmak istediğiniz tam yol ile birlikte .csv dosyasının dosya adını da yazabilirsiniz. Örneğin, "c:\ExportedData.csv". Dosya, Veri Kalitesi Sunucusu'nın yüklü olduğu bilgisayara kaydedilir.
Excel Dosyası: Gözat'a tıklayın ve temizlenen verileri dışarı aktarmak istediğiniz Excel dosyasının adını ve konumunu belirtin. Temizlenen verileri dışarı aktarmak istediğiniz tam yol ile birlikte Excel dosyasının dosya adını da yazabilirsiniz. Örneğin, "c:\ExportedData.xlsx". Dosya, Veri Kalitesi Sunucusu'nın yüklü olduğu bilgisayara kaydedilir.
Çıktıyı etki alanı için seçilen çıkış biçimine göre standartlaştırmak için Çıktıyı Standartlaştır onay kutusunu seçin. Örneğin, dize değerini büyük harfle değiştirin veya sözcüğün ilk harfini büyük harfe dönüştürin. Bir etki alanının çıkış biçimini belirtme hakkında bilgi için, Etki Alanı Özelliklerini Ayarla'dakiÇıktıyı Biçimlendir listesine bakın.
Ardından veri çıkışını seçin: yalnızca temizlenen verileri dışarı aktarın veya temizleme bilgileriyle birlikte temizlenmiş verileri dışarı aktarın.
Yalnızca Veri: Yalnızca temizlenen verileri dışarı aktarmak için radyo düğmesine tıklayın.
Veri ve Temizleme Bilgileri: Her etki alanı için aşağıdaki verileri dışarı aktarmak için radyo düğmesine tıklayın:
<Etki alanı>_Source: Etki alanındaki özgün değer.
<Etki alanı>_Output: Etki alanındaki temizlenen değerler.
<Etki alanı>_Reason: Değerin düzeltilmesi için belirtilen neden.
<Etki alanı>_Confidence: Düzeltilen tüm terimlerin güvenilirlik düzeyi. Karşılık gelen yüzde değerine eşdeğer ondalık değer olarak görüntülenir. Örneğin, 95% güvenilirlik düzeyi .9500000 olarak görüntülenir.
<Etki alanı>_Status: Veri temizlemeden sonra etki alanı değerinin durumu. Örneğin, Önerilen, Yeni, Geçersiz, Düzeltildi veya Düzeltildi.
Kayıt Durumu: Eşlenen her etki alanı için bir durum alanı (<DomainName>_Status) dışında , Kayıt Durumu alanı bir kaydın durumunu görüntüler. Kayıttaki etki alanının durumundan biri Yeni veya Doğru ise, Kayıt DurumuDoğru olarak ayarlanır. Kayıttaki etki alanının durumundan herhangi biri Önerilen, Geçersiz veya Düzeltildi ise, Kayıt Durumu ilgili değere ayarlanır. Örneğin, kayıttaki etki alanının durumundan biri Önerilen ise, Kayıt DurumuÖnerilen olarak ayarlanır.
Uyarı
Temizleme işlemi için başvuru veri hizmetini kullanıyorsanız, dışarı aktarma için etki alanı değeriyle ilgili bazı ek veriler de kullanılabilir. Daha fazla bilgi için bkz. Başvuru Verilerini Kullanarak Verileri Temizleme (Dış) Bilgi.
Verileri seçili veri hedefine aktarmak için Dışarı Aktar'a tıklayın. Seçtiyseniz:
Veri hedefi olarak SQL Server, seçilen veritabanında belirtilen ada sahip yeni bir tablo oluşturulur.
Veri hedefi olarak CSV Dosyası, Veri Kalitesi Sunucusu bilgisayarındaki konumda CSV Dosya adı kutusunda daha önce belirttiğiniz dosya adıyla bir .csv dosyası oluşturulur.
Veri hedefi olarak Excel Dosyası, Veri Kalitesi Sunucusu bilgisayarındaki konumda, Excel dosya adı kutusunda daha önce belirttiğiniz dosya adıyla bir Excel dosyası oluşturulur.
Veri kalitesi projesini kapatmak için Son'a tıklayın.
Profil Oluşturucu İstatistikleri
Profil Oluşturucu sekmesi, kaynak verilerin kalitesini gösteren istatistikler sağlar. Profil oluşturma, veri temizleme etkinliğinin etkinliğini değerlendirmenize yardımcı olur ve veri temizlemenin verilerin kalitesini ne ölçüde artırabileceğini belirleyebilirsiniz.
Profil Oluşturucu sekmesi, alan ve etki alanına göre kaynak veriler için aşağıdaki istatistikleri sağlar:
Kayıtlar: Veri temizleme etkinliği için veri örneğindeki kaç kayıt analiz edildi?
Doğru Kayıtlar: Kaç kaydın doğru olduğu bulundu
Düzeltilen Kayıtlar: Kaç kaydın düzeltildiği
Önerilen Kayıtlar: Kaç kayıt önerildi?
Geçersiz Kayıtlar: Kaç kayıt geçersizdi
Alan istatistikleri şunları içerir:
Alan: Kaynak verilerdeki alanın adı
Etki Alanı: Alana eşleyen etki alanının adı
Düzeltilen Değerler: Düzeltilen etki alanı değerlerinin sayısı
Önerilen Değerler: Önerilen etki alanı değerlerinin sayısı
Tamlık: Temizleme etkinliğiyle eşlenen her kaynak alanın eksiksizliği
Doğruluk: Temizleme etkinliğiyle eşlenen her kaynak alanın doğruluğu
DQS profili oluşturma iki veri kalitesi boyutu sağlar: eksiksizlik (verilerin mevcut olduğu kapsam) ve doğruluk (verilerin amaçlanan kullanım için kullanılabilmesinin kapsamı). Profil oluşturma size bir alanın nispeten eksik olduğunu söylüyorsa, bunu veri kalitesi projesinin bilgi bankasından kaldırmak isteyebilirsiniz. Profil oluşturma, bileşik etki alanları için güvenilir tamlık istatistikleri sağlamayabilir. Tamlık istatistiklerine ihtiyacınız varsa bileşik etki alanları yerine tek etki alanları kullanın. Bileşik etki alanlarını kullanmak istiyorsanız, profil oluşturma için tek etki alanları içeren bir bilgi bankası oluşturmak, tamlığı belirlemek ve temizleme işlemi için bileşik etki alanıyla başka bir etki alanı oluşturmak isteyebilirsiniz. Örneğin, profil oluşturma bileşik bir etki alanı kullanan adres kayıtları için 95% eksiksizlik gösterebilir, ancak sütunlardan biri için çok daha yüksek bir eksiklik düzeyi (örneğin, posta kodu sütunu) olabilir. Bu örnekte, tek bir etki alanıyla posta kodu sütununun eksiksizliğini ölçmek isteyebilirsiniz. Birden çok sütunun doğruluğunu birlikte ölçebildiğiniz için profil oluşturma büyük olasılıkla bileşik etki alanları için güvenilir doğruluk istatistikleri sağlar. Bu verilerin değeri bileşik toplamadadır, bu nedenle bileşik etki alanıyla doğruluğu ölçmek isteyebilirsiniz.
Bir başvuru veri hizmeti kullanmıyorsanız doğruluk istatistikleri büyük olasılıkla daha fazla yorum gerektirir. Veri temizleme için bir başvuru veri hizmeti kullanıyorsanız doğruluk istatistiklerinde bir güven düzeyine sahip olursunuz. Referans veri hizmetini kullanarak veri temizleme hakkında daha fazla bilgi için bkz. Referans Verileri Kullanarak Verileri Temizleme (Dış) Kılavuzu.
Bildirimleri Temizleme
Aşağıdaki koşullar bildirimlerle sonuçlanır:
Bir alan için düzeltme veya öneri yoktur. Eşlemeden kaldırmak, önce bilgi bulmayı çalıştırmak veya başka bir bilgi bankası kullanmak isteyebilirsiniz.
Bir alan için nispeten az düzeltme veya öneri vardır. Eşlemeden kaldırmak, önce bilgi bulmayı çalıştırmak veya başka bir bilgi bankası kullanmak isteyebilirsiniz.
Alanın doğruluk düzeyi çok düşüktür. Öncelikle bilgi keşfi yapmayı düşünmelisiniz veya eşlemeyi doğrulamalısınız.
Profil oluşturma hakkında daha fazla bilgi için bkz. DQS'de Veri Profili Oluşturma ve Bildirimler.