Aracılığıyla paylaş


Sütun deseni profil isteği seçenekleri (veri görev profil oluşturma)

Use Özellikler iste bölmesiProfil istekleri sayfasına küme ilgili seçenekleriSütun deseni profil isteği istekleri bölmesinde seçili.Bir sütun deseni profili belirtilen bir dize sütunundaki değerlerin yüzdesini kapsayan normal ifadeler kümesini raporlar.Bu profil, yardımcı verilerinizde geçersiz bir dize gibi sorunları belirlemek ve gelecekte yeni değerlerini doğrulamak için kullanılan normal ifadeler önerebilir.Örneğin, ABD posta kodları, sütun bir desen profili normal ifadeler \d{5}-\d{4 üretebilir}, \d{5} ve \d{9}.Diğer normal ifadeler görürseniz, verileriniz büyük olasılıkla, geçersiz veya hatalı bir biçimde değerlerini içerir.

Not

Bu konuda açıklanan seçenekler görünür Profil istekleri sayfa of the Veri Profiling görev Düzenleyicisi.Bu sayfa düzenleyicisinin hakkında daha fazla bilgi için bkz: Veri görev Düzenleyicisi'ni (profil istekleri sayfa) profil oluşturma.

Profil oluşturma veri görevi'ni kullanma hakkında daha fazla bilgi için bkz: Görev için profil oluşturma verileri ayarlama. Profil oluşturma veri görevinin çıkış çözümlenecek veri profil görüntüleyiciyi kullanma hakkında daha fazla bilgi için bkz: Profil çıkış veri profil Görüntüleyicisi'nde görüntüleme.

Ayırıcılar ve simgeleri kullanımını anlama

Desenleri için bilgisayar önce bir Sütun deseni profil isteği, profil oluşturma veri görev verileri tokenizes.Diğer bir deyişle, görevin daha küçük birimlerine simgeleri bilinen dize değerlerini ayırır.Simgeleri sınırlayıcıları ve belirlediğiniz simgeleri bağlı olarak, görev dizeleri ayırır Sınırlayıcılar and Simgeleri özellikleri:

  • Sınırlayıcılar   Varsayılan olarak, aşağıdaki karakterleri sınırlayıcıları listesini içerir: alanı, Yatay sekmeyi (\t), yeni bir satır (\n) ve satır başı (\r) döndürür. Ek sınırlayıcıları belirtebilirsiniz, ancak bu, varsayılan sınırlayıcılar kaldıramazsınız.

  • Simgeleri   Varsayılan olarak, listesiSimgeleri aşağıdaki karakterleri içeriyor: ,.;:-"'`~=&/\@!?()<>[]{}|#*^%.For example, if the symbols are "()-", the value "(425) 123-4567" is tokenized as ["(", "425", ")", "123", "-", "4567", ")"].

Ayırıcı hem de bir simge, BIR karakter olamaz.

Simgeleri korunur ancak tokenizing işleminin bir parçası olarak tek bir alan için tüm sınırlayıcı normalleştirilmiş.

Etiket tablo kullanımını anlama

Oluşturduğunuz özel bir tablo etiketleri ve ilgili şartları depolayarak tek bir etiket ile ilgili belirteçleri isteğe bağlı olarak Grup bir SQL Server Veritabanı. Tablo etiketi bir adlandırılmış "Tag" diğer "Terimi" adlı iki dize sütun olması gerekir.Bu sütun türü olabilir. char, nchar, varchar, veya nvarchar, ancak değil text veya ntext. Birden çok etiket ve ilgili şartları tek bir araya getirebileceğiniz tablo.Bir sütun deseni profil isteği yalnızca bir etiket kullanın tablo.Ayrı bir kullanabilirsiniz. ADO.NET Bağlantı Yöneticisi etikete bağlanmak için tablo. Bu nedenle, etiket tablo farklı bir veritabanında veya kaynak verilerden farklı bir sunucuda bulunabilir.

Örneğin, değerleri "Doğu", "Batı" grubuna, "Kuzey" ve "Güney", sokak adresi kullanarak tek bir etiketi, "Yön" görünebilir.Aşağıdaki tablo bir etiket örneğidir tablo.

Etiket

Terim

Yön

Doğu

Yön

Batı

Yön

Kuzey

Yön

Güney

Başka bir etiket, bir "açık" sokak adresleri kavramı ifade farklı sözcükler gruplandırmak için kullanabilirsiniz:

Etiket

Terim

Cadde

Cadde

Cadde

Yolunu

Cadde

Yerleştir

Cadde

Yol

Bir adres için oluşturulan deseni birleşimindeki etiketleri bağlı olarak, aşağıdaki desen benzer:

\d+\ LookupTag=Direction \d+\p{L}+\ LookupTag=Street

Not

Bir etiket kullanılarak tablo veri profil oluşturma görev performansını düşürür.10'Dan fazla etiket veya etiket başına 100'den fazla koşulları kullanmayın.

Aynı dönem için birden fazla etikete ait olabilir.

Istek özellikleri seçenekleri

Için bir Sütun deseni profil isteği, the Özellikler iste bölmesinde aşağıdaki seçenek grupları görüntüler:

  • Veriiçeren TableOrView and Sütun seçenekleri

  • Genel

  • Seçenekler

Veri seçenekleri

  • ConnectionManager
    Varolan seçin. ADO.NET Bağlantı Yöneticisi, .NET veri sağlayıcı için kullanır. SQL Server (SqlClient) bağlanmak için SQL Server profiled için Görünüm veya tablo içeren veritabanıdır.

  • TableOrView
    Varolan seçin tablo veya profiled için sütun içeren görünüm.

    Daha fazla bilgi için bu konudaki "TableorView Seçenekleri" bölümüne bakın.

  • Sütun
    Profiled için varolan sütun seçin.Seçin (*) tüm sütunları profil.

    Daha fazla bilgi için bu konudaki "Sütun Seçenekleri" bölümüne bakın.

TableOrView seçenekleri

  • Şema
    Hangi şema belirtir seçili tablo ait.Bu seçenek, salt-okunurdur.

  • Table
    Seçili tablonun adını görüntüler.Bu seçenek, salt-okunurdur.

Sütun seçenekleri

  • IsWildCard
    Belirtir olup olmadığını (*) joker seçildi.Bu seçenek küme için Doğru Seçtiğiniz, (*) tüm sütunları profil. Bu Yanlış profiled için tek bir sütun seçtiyseniz.Bu seçenek, salt-okunurdur.

  • ColumnName
    Seçili sütunun adını görüntüler.Bu seçenek, seçtiğiniz boş olur. (*) tüm sütunları profil. Bu seçenek, salt-okunurdur.

  • StringCompareOptions
    Bu seçenek, sütun deseni profil için geçerli değildir.

Genel Seçenekler

  • Istekkimliği
    Bu profil istek tanımlamak için açıklayıcı bir ad yazın.Genellikle, autogenerated değerini değiştirmeniz gerekmez.

Seçenekler

  • MaxNumberOfPatterns
    En fazla sayısını hesaplamak için profil istediğiniz desenleri belirtin.Bu seçeneğin varsayılan değeri 10'dur.En büyük değer 100'dür.

  • PercentageDataCoverageDesired
    Yüzde olarak hesaplanan desenleri kapsamasını istediğiniz verileri belirtin.95 (Yüzde) bu seçeneğin varsayılan değeridir.

  • CaseSensitive
    Desenleri büyük/küçük durum duyarlı olmayacağını belirtir.Bu seçeneğin varsayılan değeri Yanlış.

  • Sınırlayıcılar
    Metin tokenizing, sözcükler arasında boşluk eşdeğeri olarak değerlendirilmelidir karakterleri listeleyin.Varsayılan olarak, listesi Sınırlayıcılar aşağıdaki karakterleri içeriyor: alan, yatay sekmeyi (\t), yeni bir satır (\n) ve satır başı (\r) döndürür. Ek sınırlayıcıları belirtebilirsiniz, ancak bu, varsayılan sınırlayıcılar kaldıramazsınız.

    Daha fazla bilgi için bu konunun önceki kısımlarında "Anlama kullan, ayırıcılar ve simgeler" konusuna bakın.

  • Simgeleri
    Desenleri bir parçası olarak tutulan simgeleri listeler.Örnekler "/" tarih":" saat için ve "@" e-posta adresleri.Varsayılan olarak, listesi Simgeleri aşağıdaki karakterleri içeriyor: ,.;:-"'`~=&/\@!?()<>[]{}|#*^%.

    Daha fazla bilgi için bu konunun önceki kısımlarında "Anlama kullan, ayırıcılar ve simgeler" konusuna bakın.

  • TagTableConnectionManager
    Varolan seçin. ADO.NET Bağlantı Yöneticisi, .NET veri sağlayıcı için kullanır. SQL Server (SqlClient) bağlanmak için SQL Server etiketi içeren bir veritabanı tablo.

    Daha fazla bilgi için bkz: "etiketi kullanımını anlama tablo" Bu konunun önceki.

  • TagTableName
    Varolan bir etiketi seçin tablo, etiket ve terim adlı iki dize sütun olması gerekir.

    Daha fazla bilgi için bkz: "etiketi kullanımını anlama tablo" Bu konunun önceki.