Jak Edytuj plik tezaurusa (wyszukiwanie pełnotekstowe)
Edytując jej plik tezaurusa (plik XML) można skonfigurować tezaurusa dla danego języka.Podczas instalacji, pliki tezaurusa, które zawierają tylko pusty <xml> kontener i próbki komentarzem poza <tezaurusa> zainstalowany element.W celu dla przeszukiwanie pełnego tekstu kwerendy tego poszukaj synonimy działało poprawnie, należy utworzyć rzeczywistej <tezaurusa> element, który definiuje zestaw synonimy.Można zdefiniować dwa rodzaje synonimów, rozszerzenia zestawów i zestawów zastępczych.Informacje dotyczące lokalizacji i struktury pliku tezaurusa, zobacz Konfiguracja tezaurusa.
Ograniczenia dotyczące plików tezaurusa
Do edytowania pliku tezaurusa, obowiązują następujące ograniczenia:
Tylko administratorzy systemu można zaktualizować, zmodyfikować lub usunąć pliki tezaurusa.
Podczas edytowania plików tezaurusa przy użyciu narzędzi edytora tekstu, należy zapisać pliki w formacie Unicode, a znaki kolejność bajtów musi być określona.
Wpisy tezaurusa nie może być pusta lub wyraz podziału na pusty ciąg.
Zwroty w pliku tezaurusa musi być dłuższy niż 512 znaków.
Tezaurus nie może zawierać zduplikowanych wpisów między <sub> wpisów Zestawy rozszerzające i <pat> elementy zastępcze zestawów.
Zalecenia dotyczące plików tezaurusa
Zaleca się, że wpisy w pliku tezaurusa zawierają znaki specjalne.Jest tak, ponieważ subtelne zachowań znaki specjalne moduły dzielenia wyrazów.Jeżeli wpis tezaurusa zawiera znaków specjalnych, moduły dzielenia wyrazów w połączeniu z tym wpisem może mieć subtelne behawioralnej implikacje dla zapytanie pełnotekstowe.
Zalecane jest <sub> wpisy zawierają nie stopwords, ponieważ pominięto stopwords indeksu pełnotekstowego.Kwerendy są rozwinięte, aby uwzględnić <sub> wpisy z pliku tezaurusa i jeśli <sub> stopwords zawiera wpis, niepotrzebnie zwiększa się rozmiar kwerendy.
Aby edytować plik tezaurusa
Otwórz plik tezaurusa w Notatniku.
Jeśli edytujesz plik tezaurusa dla pierwszego czas, usuń następujące wiersze komentarza na początku i na końcu pliku, odpowiednio:
<!--Commented out -->
Dodawanie, modyfikowanie lub usuwanie zestaw zastępczy lub zestaw rozszerzający.Aby uzyskać więcej informacji, zobacz Konfiguracja tezaurusa.
Zapisz plik i zamknij Notatnik.
Użyj sp_fulltext_load_thesaurus_file do ładowania zawartości pliku tezaurusa w tempdb, określając identyfikator lokalnych (LCID), który odpowiada język pliku tezaurusa.Na przykład plik tezaurusa angielskim tsenu.xml odpowiednich LCID jest 1033.
USE AdventureWorks2008R2 ; EXEC sys.sp_fulltext_load_thesaurus_file 1033; GO