Termin wyszukiwania transformacji
transformacja termin wyszukiwania dopasowuje wyodrębniony z tekstu w warunkach dane wejściowe przekształcenia kolumny z warunkami tabela referencyjna.Następnie zlicza ile razy termin tabeli odnośników występuje w zestawie danych wejściowych i zapisuje licznik wraz z określeniem z tabela referencyjna do kolumn w wynik przekształcenia.Wynikiem tej transformacja jest przydatne przy tworzeniu listy niestandardowej programu word na podstawie tekstu wejściowego z word częstotliwości statystyki.
Przed transformacja termin wyszukiwania przeprowadza wyszukiwanie, wyodrębnia wyrazy z tekstu w wejściowy kolumna, jako termin ekstrakcji transformacja przy użyciu tej samej metoda:
Tekst jest dzielony na zdania.
Zdania są podzielone na wyrazy.
Wyrazy są znormalizowane.
Dalsze dostosowywanie Określanie terminów, aby dopasować, transformacja termin wyszukiwania można skonfigurowane do wykonywania przypadek-Uwzględnij wielkość liter.
Wyszukaj termin przeprowadza wyszukiwanie i zwraca wartość, stosując następujące reguły:
Jeśli transformacja jest skonfigurowany do wykonywania przypadek-wrażliwe odpowiada, fail to odpowiada przypadek-porównanie poufne są odrzucane.Na przykład studentów i studentów są traktowane jako osobne słowa.
Ostrzeżenie
Word kapitalizacji można uzgodnić z wyraz, który jest kapitalizowana na początku zdania.Na przykład dopasowania między studentów i studentów powiedzie się, kiedy studentów jest pierwszy wyraz zdania.
Jeśli formularz mnogiej rzeczownik lub frazy rzeczownik istnieje tabela referencyjna, wyszukiwania dopasowuje tylko mnoga rzeczownik lub rzeczownik frazy.Na przykład wszystkie wystąpienia studentów będą zliczane oddzielnie od wystąpienia studentów.
Jeśli tylko pojedyncza wyraz znajduje się tabela referencyjna, liczbie pojedynczej i mnogiej wyrazu lub frazy są dopasowywane liczbie pojedynczej.Na przykład, jeśli tabela odnośników zawiera studentów, i transformacja znajdzie słowa studentów i studentów, oba wyrazy będzie liczony jako odpowiednik warunku wyszukiwania studentów.
Jeśli tekst kolumna wejściowy jest frazę rzeczownik lemmatized, tylko ostatnie słowo frazy rzeczownik dotyczy normalizacji.Na przykład, lemmatized wersja terminów lekarzy jest termin lekarzy.
Gdy element wyszukiwania zawiera warunki, które nakładają się w odwołaniu zestaw— czyli sub-term znajduje się w więcej niż jednym rekordem odwołanie — transformacja termin wyszukiwania zwraca wynik wyszukiwania tylko jeden.Poniższy przykład przedstawia wynik, gdy element wyszukiwania zawiera nakładające się sub-term.Nakładające się sub-term w tym przypadek jest Windows, który znajduje się w obrębie dwóch warunków odniesienia.Jednakże nie zwracają wyniki dwóch transformacja, ale zwraca tylko termin pojedynczy odniesienia, Systemu Microsoft Windows.Drugi warunek odniesienia Systemu Windows XP Główny Edition z dodatkiem SP1, nie jest zwracana.
Element |
Wartość |
---|---|
Termin wejścia |
Microsoft Windows XP Główny Edition SP |
Warunki odniesienia |
Microsoft Windows, Windows XP Główny Edition z dodatkiem SP1 |
Output |
Microsoft Windows |
transformacja termin wyszukiwania można dopasować rzeczowniki i wyrażenia rzeczownikowe, które zawierają znaki specjalne, a dane z tabela referencyjna mogą obejmować te znaki.Znaki specjalne są następujące: %, @, &, $, #, *, :, ;, ., , , !, ?, <, >, +, =, ^, ~, |, \, /, (, ), [, ], {, }, “, and ‘.
transformacja termin wyszukiwania można używać tylko kolumna, która ma DT_WSTR lub DT_NTEXT typu danych.Jeśli kolumna zawiera tekst, ale nie ma jednego z tych typów danych, transformacja konwersji danych można dodać kolumnę z DT_WSTR lub DT_NTEXT dane typ przepływ danych i wartości kolumn skopiowane do nowej kolumny.Jako dane wejściowe do transformacja termin wyszukiwania można następnie wyjście z transformacja konwersji danych.Aby uzyskać więcej informacji, zobacz Przekształcenie konwersji danych.
The Term Lookup transformation input columns includes the InputColumnType property, which indicates the use of the column.InputColumnType can contain the following values:
Wartość 0 wskazuje kolumna, są przekazywane do wyjścia tylko oraz nie jest używany w wyszukiwania.
Wartość 1 wskazuje, kolumna jest używana tylko odnośnika.
Wartość 2 wskazuje kolumna, są przekazywane do wyjścia i jest również używany w wyszukiwaniu.
Kolumn wyjściowych transformacji którego InputColumnType właściwość jest zestaw 0 lub 2 obejmują CustomLineageID Właściwości dla kolumna, która zawiera identyfikator rodowodu przypisane do kolumna przez składnik przepływ danych nadrzędnym.
The Term Lookup transformation adds two columns to the transformation output, named by default Term and Frequency.Term contains a term from the lookup table and Frequency contains the number of times the term in the reference table occurs in the input data set.Kolumny te nie zawierają CustomLineageID właściwość.
Tabela odnośników musi być tabeli w SQL Server 2000, SQL Server, lub bazy danych programu Access.Zapisanie danych wyjściowych transformacja ekstrakcji termin do tabeli w tej tabeli może być używany jako tabela referencyjna, ale można również użyć innych tabel.Tekst w plików płaskich, skoroszytów programu Excel lub innych źródeł należy importować do SQL Server lub bazy danych programu Access przed użyciem transformacja termin wyszukiwania.
transformacja termin wyszukiwania używa osobnego połączenia OLE DB, aby połączyć się z tabela referencyjna.Aby uzyskać więcej informacji, zobacz Menedżer połączeń OLE DB.
transformacja termin wyszukiwania działa w trybie w pełni buforowana.W czasie wykonywania transformacja termin wyszukiwania odczytuje warunki z tabela referencyjna i przechowuje w swojej pamięci prywatnej przed przetwarza on żadnych dane wejściowe przekształcenia wierszy.
Ponieważ powtórzyć warunki w wierszu kolumna wejściowe, wyjściowe transformacja termin wyszukiwania ma zazwyczaj więcej wierszy niż dane wejściowe przekształcenia.
transformacja ma jedno wejście i wyjście.Nie obsługuje błąd wyjść.
Konfigurowanie transformacji termin wyszukiwania
zestaw właściwości poprzez SSIS Projektant lub programowo.
Aby uzyskać więcej informacji na temat właściwości, które zestaw w Termin wyszukiwania transformacji edytora okna dialogowego kliknij jedną z następujących tematów:
Termin wyszukiwania transformacji edytora (karta odwołanie tabela)
Termin wyszukiwania transformacji edytora (karta termin wyszukiwania)
Termin wyszukiwania transformacji edytora (karta Zaawansowane)
Aby uzyskać więcej informacji na temat właściwości, które zestaw w Zaawansowanego edytora okno dialogowe pole lub programowo, kliknij jeden z następujących tematów:
Aby uzyskać więcej informacji dotyczących sposobu zestaw właściwości, zobacz Jak Ustawianie właściwości składnika przepływu danych.
|