Udostępnij za pośrednictwem


Opcje żądania Profil wzorca kolumn (dane Profilowanie zadań)

Użycie Żądaj właściwości Okienko Żądania profilu strona, aby ustawić opcje dla Wzorzec kolumna żądania profilu wybranego w okienku żądania.Profil wzorca kolumn raportów zestaw wyrażeń regularnych, obejmujące określonej wartości procentowej wartości kolumna ciąg znaków.Ten profil może pomóc w identyfikacji problemów danych, takich jak nieprawidłowe ciągi i może sugerować wyrażeń regularnych, które mogą być używane w przyszłości do sprawdzania poprawności nowych wartości.Na przykład, profil deseń kolumna z kody ZIP Stanów Zjednoczonych może dawać \d{5}-\d{4 wyrażeń regularnych}, \d{5}, a \d{9}.Jeśli widzisz innych wyrażeń regularnych, prawdopodobnie dane zawierają wartości, które są nieprawidłowe lub niepoprawny format.

Uwaga

Opcje opisane w tym temacie są wyświetlane na Profil żądań strona of the Edytor zadań profilowania danych.Aby uzyskać więcej informacji na temat tej strona edytora zobacz Dane Profilowanie Edytor zadań (strona profil żądań).

Aby uzyskać więcej informacji na temat korzystania z danych Profilowanie zadania Zobacz Konfigurowanie danych Profilowanie zadań. Aby uzyskać więcej informacji dotyczących sposobów korzystania z Przeglądarka profilu danych do analizowania danych wyjściowych danych Profilowanie zadania Zobacz Wyświetlanie profil wyjściowy w oknie Przeglądarka profilu danych.

Opis stosowania ograniczniki i symbole

Przed przetwarzania desenie dla Wzorzec kolumna żądania profilu, zadanie Profilowanie danych tokenizes danych.To znaczy zadania oddziela wartości ciąg na mniejsze jednostki nazywane tokenów.Zadanie oddziela ciągi znaków do tokenów w oparciu o ograniczników i symbole, których można określić dla Ograniczniki and Symbole właściwości:

  • Ograniczniki   Domyślnie na liście ograniczników zawiera następujące znaki: miejsce, kartę poziomy (\t), nowego wiersza (\n) i przewozu zwracać (\r). Można określić dodatkowe ograniczniki, ale nie można usunąć ograniczniki domyślne.

  • Symbole   Domyślnie na liście Symbole zawiera następujące znaki: ,.;:-"'`~=&/\@!?()<>[]{}|#*^%.For example, if the symbols are "()-", the value "(425) 123-4567" is tokenized as ["(", "425", ")", "123", "-", "4567", ")"].

Znak nie może być zarówno ogranicznik i symbol.

Wszystkie ograniczniki są znormalizowane do pojedynczą spacją jako część procesu tokenizing, podczas gdy symbole są zachowywane.

Opis użycia tabela tagów

Opcjonalnie można grupować tokeny powiązane z jednym znacznikiem dzięki przechowywaniu w specjalnej tabela, utworzonego przy użyciu tagów i odpowiednich warunków SQL Server Baza danych. Tabela tag musi zawierać dwie kolumny ciąg znaków, o nazwie "etykieta", a druga o nazwie "" termin ".Kolumny te mogą być typu char, nchar, varchar, lub nvarchar, ale nie text lub ntext. Można łączyć wiele tagów i odpowiednich warunków w jednej tabela.Deseń kolumna żądania profilu można użyć tylko jedną tabela tagu.Można użyć oddzielne ADO.NET Menedżer połączeń, aby połączyć się z tagu tabela. Dlatego tagu tabela może być umieszczone w innej bazie danych lub na innym serwerze niż urządzenie źródłowe danych.

Na przykład można grupowania wartości „ Wschód","Zachód.","Północ"i"Południe", może się pojawić adresy ulic za pomocą pojedynczego tagu"Kierunek".W poniższej tabela przedstawiono przykładowy tabela tagu.

Tag

Termin

Kierunek

Wschód

Kierunek

Zachód

Kierunek

Północna

Kierunek

Południowa

Inny znacznik, można użyć do grupowania różnych wyrazy, które wyrażają pojęcie "domowy" w adresach ulicy:

Tag

Termin

Ulica

Ulica

Ulica

Ścieżek

Ulica

Umieść

Ulica

Sposób

W oparciu o tę kombinację tagów, wynikowy wzorzec dla adres zamieszkania może wyglądać jest następujący wzór:

\d+\ LookupTag=Direction \d+\p{L}+\ LookupTag=Street

Uwaga

Przy użyciu tabela tag zmniejsza wydajność Profilowanie dane zadanie.Nie należy używać więcej niż 10 tagów lub więcej niż 100 terminów na tagu.

Termin ten sam może należeć do więcej niż jeden tag.

Opcje właściwości żądania

Aby Wzorzec kolumna żądania profilu, the Żądaj właściwości okienku wyświetlane są następujące grupy opcji:

  • Dane, która obejmuje TableOrView and kolumna opcji

  • Ogólne

  • Opcje

Opcje danych

  • ConnectionManager
    Wybierz istniejące ADO.NET Menedżer połączeń, który używa dostawca danych .NET dla SQL Server Klient (SQL) do łączenia się z SQL Server Baza danych zawierająca tabela lub widok, aby być profiled.

  • TableOrView
    Wybierz istniejącą tabela lub widok zawierający kolumna, aby być profiled.

    Aby uzyskać więcej informacji zobacz sekcję "Opcje TableorView" w tym temacie.

  • Kolumna
    Wybierz istniejącą kolumna można profiled.Wybierz opcję (*) profile wszystkich kolumn.

    Aby uzyskać więcej informacji zobacz sekcję kolumna "Opcje," w tym temacie.

Opcje TableOrView

  • Schemat
    Określa schemat, do której należy dany wybranej tabela.Ta opcja jest tylko do odczytu.

  • Table
    Wyświetla nazwę wybranej tabela.Ta opcja jest tylko do odczytu.

Opcje kolumn

  • IsWildCard
    Określa, czy (*) symbol wieloznaczny został wybrany.Ta opcja jest ustawiona na Wartość true w przypadku wybrania (*) profile wszystkich kolumn.Jest on Fałszywe po wybraniu pojedynczej kolumna do się profiled.Ta opcja jest tylko do odczytu.

  • Element ColumnName
    Wyświetla nazwę zaznaczonej kolumna.Ta opcja jest puste, jeśli została wybrana (*) profile wszystkich kolumn.Ta opcja jest tylko do odczytu.

  • StringCompareOptions
    Ta opcja nie ma zastosowania do Profil wzorca kolumn.

Opcje ogólne

  • IdentyfikatorŻądania
    Wpisz opisową nazwę identyfikującą to żądanie profilu.Zazwyczaj nie trzeba zmieniać wartości wygenerowany automatycznie.

Opcje

  • MaxNumberOfPatterns
    Określanie maksymalnej liczby wzorców, który ma profil do obliczenia.Wartością domyślną tej opcji jest 10.Maksymalna wartość wynosi 100.

  • PercentageDataCoverageDesired
    Umożliwia określenie procentu dane, które mają być obliczane desenie na pokrycie.Wartością domyślną tej opcji jest 95 (procent).

  • CaseSensitive
    Wskazuje, czy desenie powinna być uwzględniana wielkość liter.Wartością domyślną tej opcji jest Fałszywe.

  • Ograniczniki
    Listę znaków, które powinny być traktowane jako odpowiednik spacje między wyrazami podczas tokenizing tekstu.Domyślnie, wykaz Ograniczniki zawiera następujące znaki: miejsca, kartę poziomy (\t), nowego wiersza (\n) i przewozu zwracają (\r). Można określić dodatkowe ograniczniki, ale nie można usunąć ograniczniki domyślne.

    Aby uzyskać więcej informacji zobacz „ opis korzystanie z ograniczniki i symboli „ we wcześniejszej części tego tematu.

  • Symbole
    Na liście symboli, które powinny być przechowywane jako część wzorców.Przykładem może być "/"dla dat,": „ dla godzin a "@" adresów e-mail.Domyślnie, wykaz Symbole zawiera następujące znaki: ,.;:-"'`~=&/\@!?()<>[]{}|#*^%.

    Aby uzyskać więcej informacji zobacz „ opis korzystanie z ograniczniki i symboli „ we wcześniejszej części tego tematu.

  • TagTableConnectionManager
    Wybierz istniejące ADO.NET Menedżer połączeń, który używa dostawca danych .NET dla SQL Server Klient (SQL) do łączenia się z SQL Server Baza danych zawierająca tabela tagu.

    Aby uzyskać więcej informacji zobacz "Opis korzystanie z tag tabela" we wcześniejszej części tego tematu.

  • TagTableName
    Wybierz istniejącą tabela tag musi mieć dwie kolumny ciąg o nazwie znacznika i termin.

    Aby uzyskać więcej informacji zobacz "Opis korzystanie z tag tabela" we wcześniejszej części tego tematu.