Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Dotyczy:SQL Server
SSIS Integration Runtime w ramach usługi Azure Data Factory
Użyj okienka Właściwości żądania na stronie Żądania profilu , aby ustawić opcje dla żądania profilu wzorca kolumny wybranego w okienku żądań. Profil wzorca kolumny raportuje zestaw wyrażeń regularnych, które obejmują określony procent wartości w kolumnie typu string. Ten profil może pomóc w zidentyfikowaniu problemów w danych, takich jak nieprawidłowe ciągi, i może sugerować wyrażenia regularne, które mogą być używane w przyszłości do weryfikowania nowych wartości. Na przykład profil wzorca kolumny Kodów pocztowych Stanów Zjednoczonych może generować wyrażenia regularne \d{5}-\d{4}, \d{5} i \d{9}. Jeśli widzisz inne wyrażenia regularne, dane prawdopodobnie zawierają wartości, które są nieprawidłowe lub w nieprawidłowym formacie.
Uwaga / Notatka
Opcje opisane w tym temacie są wyświetlane na stronie Żądania profiluw Edytorze zadań profilowania danych. Aby uzyskać więcej informacji na temat tej strony edytora, zobacz Edytor zadań profilowania danych (strona żądań profilu).
Aby uzyskać więcej informacji na temat korzystania z zadania profilowania danych, zobacz Konfigurowanie zadania profilowania danych. Aby uzyskać więcej informacji na temat używania przeglądarki profilów danych do analizowania danych wyjściowych zadania profilowania danych, zobacz Podgląd profilu danych.
Opis używania ograniczników i symboli
Przed obliczeniem wzorców dla żądania profilu wzorca kolumny zadanie profilowania danych tokenizuje dane. Oznacza to, że zadanie dzieli wartości ciągu na mniejsze jednostki znane jako tokeny. Zadanie oddziela ciągi na tokeny na podstawie ograniczników i symboli, które określisz dla właściwości Ograniczniki i Symbole :
Ograniczniki Domyślnie lista ograniczników zawiera następujące znaki: spacja, karta pozioma (\t), nowy wiersz (\n) i powrót karetki (\r). Możesz określić dodatkowe ograniczniki, ale nie można usunąć ograniczników domyślnych.
Symbole Domyślnie lista Symboli zawiera następujące znaki:
,.;:-"'~=&/@!?()<>[]{}|#*^%oraz znacznik wyboru. Na przykład jeśli symbole to "()-", wartość "(425) 123-4567" jest tokenizowana jako ["(", "425", ")", "123", "-", "4567", ")".
Znak nie może być ogranicznikiem i symbolem.
Wszystkie ograniczniki są znormalizowane do pojedynczego miejsca w ramach procesu tokenizowania, podczas gdy symbole są zachowywane.
Opis korzystania z tabeli tagów
Opcjonalnie możesz grupować powiązane tokeny za pomocą pojedynczego tagu, przechowując tagi i powiązane terminy w specjalnej tabeli utworzonej w bazie danych programu SQL Server. Tabela tagów musi mieć dwie kolumny ciągów, jedną o nazwie "Tag" i drugą o nazwie "Term". Te kolumny mogą być typu char, nchar, varchar lub nvarchar, ale nie tekst lub ntext. Można połączyć wiele tagów i odpowiadające im terminy w jednej tabeli. Żądanie profilu wzorca kolumny może używać tylko jednej tabeli tagów. Do nawiązania połączenia z tabelą tagów można użyć oddzielnego menedżera połączeń ADO.NET. W związku z tym tabela tagów może znajdować się w innej bazie danych lub na innym serwerze niż dane źródłowe.
Można na przykład pogrupować wartości "Wschód", "Zachód", "Północ" i "Południe", które mogą pojawiać się w adresach ulicznych, używając pojedynczego tagu "Direction". Poniższa tabela jest przykładem takiej tabeli tagów.
| Tag | Termin |
|---|---|
| Direction | Wschód |
| Direction | Zachód |
| Direction | Północ |
| Direction | Południe |
Możesz użyć innego tagu, aby zgrupować różne wyrazy, które wyrażają pojęcie "ulicy" w adresach ulicznych:
| Tag | Termin |
|---|---|
| Ulica | Ulica |
| Ulica | Avenue |
| Ulica | Miejsce |
| Ulica | Droga |
Na podstawie tej kombinacji tagów wynikowy wzorzec dla adresu ulicy może przypominać następujący wzorzec:
\d+\ LookupTag=Direction \d+\p{L}+\ LookupTag=Street
Uwaga / Notatka
Użycie tabeli tagów zmniejsza wydajność zadania profilowania danych. Nie używaj więcej niż 10 tagów lub więcej niż 100 terminów na tag.
Ten sam termin może należeć do więcej niż jednego tagu.
Opcje właściwości żądania
W przypadku żądania profilu wzorca kolumny okienko Właściwości żądania wyświetla następujące grupy opcji:
Dane, które obejmują opcje TableOrView i Column
Ogólne
Options
Opcje danych
Connectionmanager
Wybierz istniejącego menedżera połączeń ADO.NET, który używa dostawcy danych platformy .NET dla programu SQL Server (SqlClient), aby nawiązać połączenie z bazą danych programu SQL Server zawierającą tabelę lub widok do profilowania.
Tableorview
Wybierz istniejącą tabelę lub widok zawierający kolumnę do profilowania.
Aby uzyskać więcej informacji, zobacz sekcję "Opcje tableorView", w tym temacie.
Kolumna
Wybierz istniejącą kolumnę do profilowania. Wybierz (*), aby profilować wszystkie kolumny.
Aby uzyskać więcej informacji, zobacz sekcję "Opcje kolumny" w tym temacie.
Opcje TableOrView
schemat
Określa schemat, do którego należy wybrana tabela. Ta opcja jest tylko do odczytu.
tabela
Wyświetla nazwę wybranej tabeli. Ta opcja jest tylko do odczytu.
Opcje kolumn
IsWildCard
Określa, czy symbol wieloznaczny (*) został wybrany. Ta opcja jest ustawiona na True, jeśli wybrano (*) w celu profilowania wszystkich kolumn. To jest fałsz, jeśli wybrano profilowanie pojedynczej kolumny. Ta opcja jest tylko do odczytu.
ColumnName
Wyświetla nazwę wybranej kolumny. Ta opcja jest pusta, jeśli wybrano opcję (*) w celu profilowania wszystkich kolumn. Ta opcja jest tylko do odczytu.
StringCompareOptions
Ta opcja nie ma zastosowania do profilu wzorca kolumny.
Opcje ogólne
RequestID
Wpisz opisową nazwę, aby zidentyfikować to żądanie profilu. Zazwyczaj nie trzeba zmieniać automatycznie wygenerowanej wartości.
Opcje
MaxNumberOfPatterns
Określ maksymalną liczbę wzorców, które mają być obliczane przez profil. Wartość domyślna tej opcji to 10. Wartość maksymalna to 100.
PożądanyProcentPokryciaDanymi
Określ procent danych, które mają być objęte obliczonymi wzorcami. Wartość domyślna tej opcji to 95 (procent).
CaseSensitive
Określ, czy wzorce powinny rozróżniać wielkość liter. Wartość domyślna tej opcji to Fałsz.
Ograniczniki
Wyświetl listę znaków, które powinny być traktowane jako odpowiednik spacji między wyrazami podczas tokenizowania tekstu. Domyślnie lista ograniczników zawiera następujące znaki: spacja, karta pozioma (\t), nowy wiersz (\n) i powrót karetki (\r). Możesz określić dodatkowe ograniczniki, ale nie można usunąć ograniczników domyślnych.
Aby uzyskać więcej informacji, zobacz "Opis używania ograniczników i symboli" we wcześniejszej części tego tematu.
Symbole
Wyświetl listę symboli, które powinny być zachowywane w ramach wzorców. Przykłady mogą obejmować ciąg "/" dla dat, ":" dla godzin i "@" dla adresów e-mail. Domyślnie lista symboli zawiera następujące znaki: ,.;:-"'~=&/@!?()<>[]{}|#*^%.
Aby uzyskać więcej informacji, zobacz "Opis używania ograniczników i symboli" we wcześniejszej części tego tematu.
TagTableConnectionManager
Wybierz istniejący menedżer połączeń ADO.NET, który używa dostawcy danych platformy .NET dla programu SQL Server (SqlClient) do nawiązania połączenia z bazą danych programu SQL Server zawierającą tabelę tagów.
Aby uzyskać więcej informacji, zobacz "Understanding of the Tag Table" (Opis używania tabeli tagów) we wcześniejszej części tego tematu.
TagTableName
Wybierz istniejącą tabelę tagów, która musi zawierać dwie kolumny ciągów o nazwie Tag i Termin.
Aby uzyskać więcej informacji, zobacz "Understanding of the Tag Table" (Opis używania tabeli tagów) we wcześniejszej części tego tematu.
Zobacz też
Edytor zadań profilowania danych (strona ogólna)
Formularz szybkiego profilu dla jednej tabeli (Zadanie profilowania danych)