Udostępnij za pośrednictwem


Profil wzorca kolumnŻądanie opcje (dane profilowania zadania)

Użyj Właściwości żądania okienku Żądania profilu strony zestaw opcje Kolumny deseń profilu żądania zaznaczony w okienku żądania.Profil deseń kolumna raporty zestaw wyrażeń regularnych, które obejmują określony procent wartości kolumna ciąg.Ten profil może pomóc zidentyfikować problemy, takie jak nieprawidłowe ciągi danych i może sugerować wyrażeń regularnych, które mogą być używane w przyszłości do sprawdzania poprawności nowych wartości.Na przykład profil deseń kolumna kodów pocztowych Stanów Zjednoczonych może dawać \d{5}-\d{4 wyrażeń regularnych}, \d{5} i \d{9}.Jeśli widzisz innych wyrażeń regularnych, prawdopodobnie dane zawierają wartości, które są nieprawidłowe lub niepoprawny format.

Ostrzeżenie

Opcje opisane w tym temacie pojawiają się na profilu żąda strona z Danych profilowania zadanie edytora.Aby uzyskać więcej informacji na temat tej strona w edytorze Zobacz Dane profilowania Edytor zadań (profil żąda strony).

Aby uzyskać więcej informacji na temat zadań profilowania danych, zobacz Konfigurowanie danych profilowania zadania.Aby uzyskać więcej informacji na temat używania Przeglądarka profilu danych Aby analizować dane wyjściowe zadania profilowania danych, zobacz Wyświetlanie profilu wyjściowego wPrzeglądarka profilu danych.

Opis ograniczników i symbole

Przed computing desenie dla Profil wzorca kolumn żądania, zadania profilowania danych tokenizes danych.Oznacza to, że zadanie oddziela wartości ciąg na mniejsze jednostki, znany jako tokenów.Zadanie oddziela ciągi w tokenach na podstawie ograniczników i symboli, które określają dla ograniczników i symbole właściwości:

  • Ograniczniki liście ograniczników zawiera domyślnie następujące znaki: miejsca, tabulator poziomy (\t), nowego wiersza (\n) i przewozu zwrotu (\r).Można określić dodatkowe ograniczniki, ale nie można usunąć domyślne ograniczniki.

  • Symboledomyślnie na liście symbole zawiera następujące znaki: ,.;:-"'`~=&/\@!?()<>[]{}|#*^%.For example, if the symbols are "()-", the value "(425) 123-4567" is tokenized as ["(", "425", ")", "123", "-", "4567", ")"].

Znak nie może być ogranicznika i symbol.

Wszystkie ograniczniki są znormalizowane do pojedynczej spacji jako część procesu tokenizing, gdy symbole są zachowywane.

Opis użycia tagu tabeli

Opcjonalnie można grupować tokeny powiązanych z jednym znacznikiem przechowując tagów i pokrewne warunki specjalne tabela utworzonej w SQL Server bazy danych.Tabela etykieta musi zawierać dwie kolumny ciąg, o nazwie "Tag" i innych o nazwie "Określenie".These columns can be of type char, nchar, varchar, or nvarchar, but not text or ntext.Można łączyć wiele tagów i odpowiednich warunków w jednej tabela.A Profil wzorca kolumn żądanie można używać tylko jeden znacznik tabela.Można użyć osobne ADO.NET menedżer połączeń, aby połączyć tagu tabela.Dlatego tagu tabela może być zlokalizowany w innej bazie danych lub na innym serwerze niż źródło danych.

Na przykład można pogrupować wartości "Wschód", "Zachód", "Północ" i "Południe" który może się pojawić adresy pocztowe przy użyciu pojedynczego tagu "Kierunek".Poniższa tabela jest przykładem tabeli tagu.

Tag

Termin

Kierunek

Wschód

Kierunek

Zachód

Kierunek

Północna

Kierunek

Południowa

Można użyć innego znacznika do grupowania różnych słowa, które express pojęcie "ulicy" w adresy pocztowe:

Tag

Termin

Ulica

Ulica

Ulica

Avenue

Ulica

Miejsce

Ulica

Sposób

W zależności od ta kombinacja tagów uzyskany wzór dla adresu pocztowego może wyglądać następujący wzór:

\d+\ LookupTag=Direction \d+\p{L}+\ LookupTag=Street

Ostrzeżenie

Za pomocą tagu tabela zmniejsza wydajność profilowania dane zadanie.Nie należy używać znaczników więcej niż 10 lub więcej niż 100 terminów na tagu.

Ten sam termin może należeć do więcej niż jeden tag.

Opcje właściwości żądania

Dla Profil wzorca kolumn żądania, Właściwości żądania okienku wyświetlane są następujące grupy opcji:

  • Dane, która obejmuje TableOrView i kolumny opcje

  • Ogólne

  • Opcje

Opcje danych

  • ConnectionManager
    Wybierz istniejące ADO.NET menedżer połączeń, który używa.Dostawca danych netto dla SQL Server (SqlClient), aby połączyć się z SQL Server bazę danych zawierającą tabela lub widok, aby być wyprofilowane.

  • TableOrView
    Zaznacz istniejącą tabela lub widok zawierający kolumna, aby być wyprofilowane.

    Aby uzyskać więcej informacji zobacz sekcję ""TableorView Opcje, w tym temacie.

  • Kolumna
    Wybierz istniejącą kolumna być wyprofilowane.Wybierz (*) do profilu wszystkie kolumny.

    Aby uzyskać więcej informacji zobacz sekcję ""kolumny Opcje, w tym temacie.

Opcje TableOrView

  • Schemat
    Określa schemat, do której należy wybranej tabela.Opcja ta jest tylko do odczytu.

  • Tabela
    Wyświetla nazwę wybranej tabela.Opcja ta jest tylko do odczytu.

Opcje kolumn

  • IsWildCard
    Określa, czy (*) został wybrany symbol wieloznaczny.Opcja ta jest zestaw do True po wybraniu (*) do profilu wszystkie kolumny.Jest False po wybraniu pojedynczej kolumna, aby być wyprofilowane.Opcja ta jest tylko do odczytu.

  • Element ColumnName
    Wyświetla nazwę zaznaczonej kolumna.Ta opcja jest puste, jeśli wybrano (*) do profilu wszystkie kolumny.Opcja ta jest tylko do odczytu.

  • StringCompareOptions
    Ta opcja nie ma zastosowania do Profil wzorca kolumn.

Opcje ogólne

  • IdentyfikatorŻądania
    Wpisz opisową nazwę identyfikującą ten wniosek profilu.Zazwyczaj nie trzeba zmieniać wartości wygenerowany automatycznie.

Opcje

  • MaxNumberOfPatterns
    Określ maksymalną liczbę desenie, które profil ma obliczyć.Wartością domyślną tej opcji jest 10.Wartość maksymalna jest 100.

  • PercentageDataCoverageDesired
    Określ procent wzorcach obliczaną na pokrycie dane.Wartością domyślną tej opcji jest 95 (procent).

  • CaseSensitive
    Wskazuje, czy desenie powinny być przypadek-poufne.Wartością domyślną tej opcji jest False.

  • Ograniczniki
    Lista znaków, które powinny być traktowane jako równoważne spacji między wyrazami, gdy tokenizing tekst.Domyślnie listy ograniczników zawiera następujące znaki: miejsca, tabulator poziomy (\t), nowego wiersza (\n) i przewozu zwrotu (\r).Można określić dodatkowe ograniczniki, ale nie można usunąć domyślne ograniczniki.

    Aby uzyskać więcej informacji zobacz "Opis użycia z ogranicznikami i symbole" wcześniej w tym temacie.

  • Symbole
    Na liście symboli, które powinny być zachowywane jako część wzorców.Przykłady może zawierać "/" dla dat ":" dla godzin i "@" dla adresów e-mail.Domyślnie listy symbole zawiera następujące znaki: ,.;:-"'`~=&/\@!?()<>[]{}|#*^%.

    Aby uzyskać więcej informacji zobacz "Opis użycia z ogranicznikami i symbole" wcześniej w tym temacie.

  • TagTableConnectionManager
    Wybierz istniejące ADO.NET menedżer połączeń, który używa.Dostawca danych netto dla SQL Server (SqlClient), aby połączyć się z SQL Server bazę danych zawierającą tabela znacznikiem.

    Aby uzyskać więcej informacji zobacz "Opis użycia tagu tabeli" wcześniej w tym temacie.

  • TagTableName
    Wybierz tabela znacznikiem istniejących musi mieć dwie kolumny ciąg o nazwie znacznika i termin.

    Aby uzyskać więcej informacji zobacz "Opis użycia tagu tabeli" wcześniej w tym temacie.