Aracılığıyla paylaş


Görev profil oluşturma verileri kurulumu

Önce bir profil kaynak verileri gözden geçirebilirsiniz, kurmak ve veri profil oluşturma görev çalıştırmak için ilk adım olduğunu. Bu görevi içinde oluşturduğunuz bir Integration Servicespaket. Veri profil oluşturma görev yapılandırmak için veri profil oluşturma görev Düzenleyicisi'ni kullanın. Bu düzenleyici Profil çıkış nerede ve hangi profilleri hesaplamak için seçmenize olanak sağlar. Görev ayarladıktan sonra veri profilleri hesaplamak için paketi çalıştırın.

Gereksinimleri ve sınırlamaları

Veri profil oluşturma görev depolanan verileri ile çalışır SQL Server. Üçüncü taraf veya dosya tabanlı veri kaynakları ile çalışmaz.

Ayrıca, veri profil oluşturma görev içeren bir paket çalıştırmak için create table izni, dahil, okuma ve yazma izinleri olan bir hesap kullanmalısınız tempdbveritabanı.

Veri profil oluşturma görev bir paket

Veri profil oluşturma görev sadece profillerini yapılandırır ve hesaplanan profilleri içeren çıkış dosyası oluşturur. Bu çıkış dosyasını gözden geçirebilmeleri için veri profil Görüntüleyicisi, tek başına görüntüleyici programı kullanmanız gerekir. Çıkış ayrı ayrı görüntülemek için veri profil oluşturma görev diğer görevler içeren bir paket kullanabilirsiniz.

Ancak, veri profil oluşturma görev yalnızca görev bir paket kullanmak gerekmez. Daha karmaşık bir paket iş akışı veya veri akışının veri profil oluşturma gerçekleştirmek istiyorsanız, aşağıdaki seçenekler vardır:

  • Paketi denetimi akışı görev çıktı dosyasının temel Koşul mantığını uygulamak için bir komut dosyası görevi sonra veri profil oluşturma görev koydu. Bu Script görev daha sonra çıktı dosyasını sorgulamak için de kullanabilirsiniz.

  • Profil verileri veri akışı, veri yüklendikten ve dönüşüm sonra sen-si olmak için geçici olarak değiştirilen verileri kaydetmek bir SQL Servertablosu. Daha sonra kaydedilen veri profil.

Daha fazla bilgi için, bkz. Paket iş akışı görev profil oluşturma verileri birleştirmek.

Görev çıkış kurulumu

Veri profil oluşturma görev bir paket sonra çıktı compute görev profilleri için ayarlamanız gerekir. Kullandığınız çıktı için profilleri ayarlamak için Genel sayfa veri profil oluşturma görev Düzenleyicisi. Çıktı hedefi belirleyen ek olarak Genel sayfa da size hızlı profil verileri gerçekleştirme olanağı sunar. Seçtiğinizde Hızlı profil, bazı kullanarak bir tablo veya görünümü veri profil oluşturma görev profilleri veya tüm varsayılan profiller varsayılan ayarlarına.

Daha fazla bilgi için Veri profil oluşturma görev Düzenleyicisi (Genel sayfa)ve Tek tablo hızlı profil formuna (veri görev profil oluşturma).

Önemli notÖnemli

Veritabanı verileri içeren ve çıktı dosyasının veritabanı hakkındaki önemli veriler içerebilir. Bu dosya daha güvenli yapma hakkında öneriler için bkz: Paketleri tarafından kullanılan dosyalara erişimi.

Seçim ve hesaplanması için profillerini yapılandırma

Çıktı dosyasını oluşturduktan sonra hesaplamak için hangi veri profili seçmeniz gerekir. Veri profil oluşturma görev sekiz farklı veri profilleri hesaplayabilir. Beş bu profilleri tek tek sütunların çözümlemek ve kalan üç birden çok sütun veya sütunları ve tablolar arasındaki ilişkileri analiz. Tek bir veri profil oluşturma görev içinde birden fazla sütun veya birden fazla tablo veya görünümlerin sütun birleşimleri için birden çok profil hesaplayabilir.

Aşağıdaki tabloda bu computes ve profil geçerli olduğu veri türlerini profilleri raporları açıklar.

Hesaplamak için

Tanımlama Yardımı

Bu profili kullan

Tüm farklı uzunlukları dize değerleri seçili sütun ve her boy gösteren tablo satırları yüzdesi.

Dize geçerli olmayan değerler— Örneğin, profil Amerika Birleşik Devletleri, durum kodları için iki karakter kullanması beklenir bir sütunun ama iki karakterden daha uzun olan değerler keşfedin.

Sütun uzunluğu dağıtım —geçerli sütun ile bu veri türleri:

  • Karakter veri türleri: char, nchar, varchar, venvarchar

Belirtilen bir dize sütundaki değerleri yüzdesi kapak normal ifadeler kümesi.

Ayrıca, gelecekte yeni değerleri doğrulamak için kullanılan normal ifadeler bulmak için

Dize değerleri geçerli veya doğru biçimde değil değil —Örneğin, bir posta kodu sütun deseni profil normal ifadeler üretebilir: \d{5}-\d{4}, \d{5} ve \d{9}. Çıktı diğer normal ifadeler içeriyorsa, verileri geçerli değil veya yanlış bir biçimde değerler içerir.

Sütun deseni profil —geçerli sütun ile bu veri türleri:

  • Karakter veri türleri: char, nchar, varchar, venvarchar

Seçili sütundaki boş değerler yüzdesi.

Bir sütundaki boş değerler beklenmedik biçimde yüksek bir oranı —Örneğin, ABD posta kodları içerir, ancak eksik posta kodları unacceptably yüksek bir yüzdesi keşfetmek gerekiyordu bir sütun profil.

Sütun Null oranı —geçerli sütun ile bu veri türleri:

  • Herhangi bir veri türü. Bu image, text, xml, kullanıcı tanımlı türler ve varyant türleri.

En az, en büyük, ortalama ve standart sapma için sayısal sütunlar ve en az ve en fazla için gibi istatistikleri datetimesütun.

Sayısal değerleri ve geçerli olmayan tarihleri— Örneğin, historical tarihleri sütun profil ama gelecekte en büyük tarihi keşfedin.

Sütun istatistikleri profil —geçerli sütun ile bu veri türleri:

  • Sayısal veri türleri: Tamsayı türlerini (dışında bit), money, smallmoney, decimal, float, real, venumeric

  • Date and time data types: datetime, smalldatetime, timestamp, date, time, datetime2, and datetimeoffset

    NotNot
    Tarih ve Saat veri türüne sahip bir sütun için profil minimum ve maksimum yalnızca hesaplar.

Tüm farklı değerler seçili sütun ve her değeri gösteren tablo satırları yüzdesi. Veya daha fazla tabloda belirtilen yüzde temsil eden değerleri.

Ayrı değerleri bir sütun yanlış sayıda— Örneğin, Amerika Birleşik Devletleri'nde içeren bir sütun profil ancak 50'den fazla farklı değerler keşfedin.

Sütun değeri dağıtım —geçerli sütun ile bu veri türleri:

  • Sayısal veri türleri: Tamsayı türlerini (dışında bit), money, smallmoney, decimal, float, real, venumeric

  • Karakter veri türleri: char, nchar, varchar, venvarchar

  • Date and time data types: datetime, smalldatetime, timestamp, date, time, datetime2, and datetimeoffset

Bir sütun veya sütunları kümesi bir anahtarı veya seçili tablo için yaklaşık bir anahtarı olup olmadığı.

Yinelenen değerleri olası anahtar sütunu —Örneğin, Müşteriler tablosu adı ve adresi sütunları profil ve yinelenen değerleri, burada ad ve adres birleşimleri benzersiz keşfedin.

Aday anahtar —bir sütun veya sütunları kümesi seçili tablo için bir anahtar olarak hizmet verecek uygun olup olmadığını raporlar birden çok sütun profil.

Bu veri türleri içeren sütunlar için geçerli:

  • Integer data types: bit, tinyint, smallint, int, and bigint

  • Karakter veri türleri: char, nchar, varchar, venvarchar

  • Date and time data types: datetime, smalldatetime, timestamp, date, time, datetime2, and datetimeoffset

Uzantı için başka bir sütun veya sütunları (determinant sütun) kümesi değerleri (bağımlı sütun) bir sütundaki değerlere bağlıdır.

Bağımlı sütun geçerli olmayan değerler —Örneğin, ABD posta kodları içeren bir sütun ve Amerika Birleşik Devletleri'nde içeren bir sütun arasında bağımlılık profil. Aynı alan kodu her zaman aynı durum olmalıdır. Ancak, profil bağımlılık ihlalleri keşfeder.

İşlevsel bağımlılık —bu veri türleri içeren sütunlar için geçerli:

  • Integer data types: bit, tinyint, smallint, int, and bigint

  • Karakter veri türleri: char, nchar, varchar, venvarchar

  • Date and time data types: datetime, smalldatetime, timestamp, date, time, datetime2, and datetimeoffset

Bir sütun veya sütunları kümesi arasında seçili tabloları bir yabancı anahtar olarak hizmet verecek uygun olup olmadığı.

Başka bir deyişle, bu profili değerler iki sütun veya sütunları kümesi arasında örtüşme bildirir.

Geçerli olmayan değerler —Örneğin, bir satış tablosunun ProductID sütununa profil. Sütun Products tablosunun ProductID sütununa bulunmayan değerler içeren profil keşfeder.

Değerin eklenmesi —bu veri türleri içeren sütunlar için geçerli:

  • Integer data types: bit, tinyint, smallint, int, and bigint

  • Karakter veri türü: char, nchar, varchar, venvarchar

  • Date and time data types: datetime, smalldatetime, timestamp, date, time, datetime2, and datetimeoffset

Hangi profilleri hesaplamak için seçmek için kullandığınız Profil istekleri sayfa veri profil oluşturma görev Düzenleyicisi. Daha fazla bilgi için, bkz. Veri profil oluşturma görev Düzenleyicisi (profil istekleri sayfa).

Tarih Profil isteği sayfasında da belirttiğiniz veri kaynağı ve veri profillerini yapılandırmak. Görevi yapılandırmak, hakkında aşağıdaki bilgileri düşünüyorum:

  • Yapılandırmayı basitleştirmek ve bilmediğiniz veri özellikleri keşfetmek kolaylaştırmak için joker karakter kullanabilirsiniz (*), bir tek sütun adı yerine. Bu joker karakter kullanırsanız, görevi sırayla işleme yavaşlatabilir ve uygun veri türünü, her sütun profil.

  • Seçili tablo veya Görünüm boş olduğunda, veri profil oluşturma görev herhangi bir profil hesaplaması yapmıyor.

  • Seçili sütundaki tüm değerleri null olduğunda, veri profil oluşturma görev yalnızca sütun Null oranı profil hesaplar. Bu sütun uzunluğu dağıtım profili, sütun deseni profil, sütun istatistikleri profil veya sütun değeri dağıtım profili boş sütun hesaplaması yapmıyor.

Kullanılabilir veri profilleri, kendi yapılandırma seçenekleri vardır. Bu seçenekler hakkında daha fazla bilgi için aşağıdaki konulara bakın:

Görev profil oluşturma verileri içeren paketi yürütme

Veri profil oluşturma görev ayarladıktan sonra görev çalıştırabilirsiniz. Görev sonra veri profilleri hesaplar ve bu bilgileri bir dosyaya veya bir paketi değişken xml biçiminde çıktılar. Bu xml yapısını DataProfile.xsd şema izler. Sen-ebilmek açık şemada Microsoft  Visual Studioya da başka bir şema editörü, bir xml Düzenleyicisi veya Not Defteri gibi bir metin düzenleyicisinde. Bu şema veri kalite bilgi aşağıdaki amaçlar için yararlı olabilir:

  • Içinde ve kuruluşlar arasında veri kalite bilgi değişimi için.

  • Veri kalite bilgilerle çalışmak özel araçlar oluşturmak için.

Hedef ad alanı, şema tanımlanır https://schemas.microsoft.com/sqlserver/2008/DataDebugger/.

Sonraki Adım

Veri profil Görüntüleyicisi.

İlişkili İçerik

Integration Services simgesi (küçük) Integration Services ile güncel kalın

En son karşıdan yüklemeler, makaleler, örnekler ve Microsoft video yanı sıra topluluk seçili çözümleri için ziyaret Integration ServicesMSDN sayfası:


Bu güncelleştirmelerle ilgili otomatik bildirim almak için, sayfadaki RSS akışlarına abone olun.