transformacja wyszukiwania terminu
Transformacja wyszukiwanie termin jest taka sama, jak terminy wyodrębniony z tekstu kolumna danych wejściowych transformacji z warunkami w tabela referencyjna.Go następnie zlicza ile razy termin tabeli odnośników pojawia się zestaw danych wejściowych i zapisuje liczby wraz z określeniem z tabela referencyjna do kolumn w wynik transformacja.Wynikiem tej transformacja jest przydatna podczas tworzenia listy wyrazów niestandardowych na podstawie wprowadzania tekstu, zawierająca wyraz częstotliwości statystyki.
Zanim transformacja termin wyszukiwania są wykonywane jest wyszukiwanie, wyodrębnia wyrazy w tekście kolumna danych wejściowych jako termin wyodrębniania transformacja przy użyciu tej samej metoda:
Tekst jest dzielony na zdania.
Zdania są podzielone na wyrazy.
Wyrazy są znormalizowane.
Aby dodatkowo dostosować warunki, które odpowiadający, transformacja wyszukiwanie termin można skonfigurować tak, aby wykonać przypadek-Uwzględnij wielkość liter.
Wyszukiwanie termin wykonywane jest wyszukiwanie i zwraca wartość za pomocą następujących zasad:
Jeśli transformacja jest skonfigurowany do przeprowadzania dopasowań uwzględniana wielkość liter, zostaną odrzucone dopasowania zakończone niepowodzeniem porównania uwzględniana wielkość liter.Na przykład dla studentów and DLA STUDENTÓW są traktowane jako osobne słowa.
Uwaga
Wyraz nie kapitalizacji można uzgodnić z wyraz, który jest kapitalizowana na początku zdania.Na przykład dopasowanie między dla studentów and Dla studentów powiedzie się, kiedy Dla studentów jest pierwszy wyraz zdania.
Formularz mnogiej rzeczownik lub frazy rzeczownik tabela referencyjna, wyszukiwania jest zgodna tylko mnogiej formularza rzeczownik lub rzeczownik frazy.Na przykład wszystkie wystąpienia studentów będą zliczane oddzielnie z wystąpień dla studentów.
Jeśli tylko pojedynczą formularza wyrazu znajduje się w tabela referencyjna, osobliwego i mnogiej form wyrazu lub frazy zostają dopasowane do pojedynczej formularza.Na przykład, jeśli zawiera tabela przeszukiwania dla studentówi transformacja znajdzie słowa dla studentów and studentów, oba wyrazy będzie traktowany jako pasującego termin wyszukiwania dla studentów.
Jeśli tekst kolumna danych wejściowych jest frazę lemmatized rzeczownik, tylko ostatniego wyrazu w zdaniu rzeczownik dotyczy normalizacji.Na przykład lemmatized wersja terminy lekarze is termin lekarze.
Gdy element wyszukiwania zawiera terminy, które nakładają się zestaw odwołanie — to znaczy sub-term znajduje się w więcej niż jeden rekord odwołanie — transformacja termin wyszukiwanie zwraca wynik wyszukiwania tylko jeden.Poniższy przykład przedstawia wynik, gdy element wyszukiwania zawiera sub-term nakładających się.W takim przypadek jest sub-term nakładające się System Windows, który znajduje się w ciągu dwóch warunków odwołania.Jednak nie zwraca wyniki dwóch transformacja, ale zwraca tylko termin pojedynczy odwołanie, Microsoft Windows.Drugi warunek odwołania System Windows XP Główny Edition SP1 nie jest zwracane.
Element |
Wartość |
---|---|
Określenie danych wejściowych |
Microsoft Windows XP Główny Edition SP |
Określenia odwołania |
Microsoft Windows, Windows XP Główny Edition z dodatkiem SP1 |
Output |
Microsoft Windows |
transformacja termin wyszukiwania można dopasować rzeczowniki i rzeczownik frazy, które zawierają znaki specjalne, a dane z tabela referencyjna mogą zawierać następujących znaków.Znaki specjalne są następujące: %, @, &, $, #, *, :, ;, ., , , !, ?, <, >, +, =, ^, ~, |, \, /, (, ), [, ], {, }, “, and ‘.
transformacja termin wyszukiwania można używać tylko kolumna, która ma DT_WSTR lub DT_NTEXT typu danych.Jeśli kolumna zawiera tekst, ale nie ma jednego z tych typów danych, konwersja danych transformacja można dodać kolumnę z DT_WSTR lub DT_NTEXT danych typu przepływ danych i kopiować wartości kolumny do nowej kolumny.Jako dane wejściowe do transformacja termin wyszukiwania można następnie dane wyjściowe z transformacja konwersji danych.Aby uzyskać więcej informacji zobacztransformacja konwersji danych.
The Term Lookup transformation input columns includes the InputColumnType property, which indicates the use of the column.InputColumnType can contain the following values:
Wartość 0 wskazuje kolumna, zostaje przesłany w wyniku jedynie i nie zostały użyte podczas wyszukiwania.
Wartość 1 wskazuje, kolumna jest używana tylko odnośnika.
Wartość 2 wskazuje kolumna, zostaje przesłany w danych wyjściowych i jest również używana w wyszukiwania.
kolumna wyjściowe transformacja którego InputColumnType Właściwość jest ustawiona na 0 lub 2 obejmują CustomLineageID Właściwość dla kolumna, która zawiera identyfikator rodowodu przypisanego do kolumna przez składnik poprzednie przepływ danych.
The Term Lookup transformation adds two columns to the transformation output, named by default Term and Frequency.Term contains a term from the lookup table and Frequency contains the number of times the term in the reference table occurs in the input data set.Te kolumny nie należy dołączać CustomLineageID Właściwość.
Tabela odnośników musi być tabelą w SQL Server 2000, SQL Server, lub bazy danych programu Access. Zapisanie danych wyjściowych transformacja wyodrębniania termin do tabeli w tej tabeli może być używany jako tabela referencyjna, ale można również używać innych tabel.Tekst w plików płaskich, skoroszytów programu Excel lub innych źródeł, należy importować do SQL Server Baza danych lub bazy danych programu Access przed użyciem transformacja wyszukiwanie termin.
transformacja termin wyszukiwania używa oddzielnego połączenia OLE DB do łączenia się z tabela referencyjna.Aby uzyskać więcej informacji zobaczMenedżer połączeń OLE DB.
transformacja termin wyszukiwanie działa w trybie pełnego precached.Przy uruchomieniu czas, przekształcania wyszukiwanie termin odczytuje warunki z tabela referencyjna i przechowuje je w prywatnej pamięci przed przetwarza wszystkie wiersze danych wejściowych transformacja.
Ponieważ może powtórzyć warunki jest wiersz wejściowy kolumna, danych wyjściowych transformacja wyszukiwanie termin zazwyczaj ma więcej wierszy niż dane wejściowe transformacja.
transformacja ma jeden wejściowych i wyjściowych w jeden.Błąd wyjścia nie są obsługiwane.
Konfigurowanie transformacja wyszukiwanie termin
zestaw właściwości za pomocą SSIS Projektant lub programowo.
Aby uzyskać więcej informacji na temat właściwości, które zestaw w Edytor transformacja wyszukiwania terminu okna dialogowego kliknij jedną z następujących tematów:
Określenie wyszukiwanie transformacja Edytor (karta Tabela odwołanie)
Określenie wyszukiwanie transformacja Edytor (karta wyszukiwanie termin)
Edytor transformacja wyszukiwania terminu (karta Zaawansowane)
Aby uzyskać więcej informacji na temat właściwości, które zestaw w Zaawansowany edytor okna dialogowego pole lub programowo, kliknij jedną z następujących tematów:
Aby uzyskać więcej informacji na temat ustawiania właściwości, zobacz Jak Ustawianie właściwości składnik przepływu danych.
|