Udostępnij za pośrednictwem


Jak Edytuj plik tezaurusa (wyszukiwanie pełnotekstowe)

Edytując jej plik tezaurusa (plik XML) można skonfigurować tezaurusa dla danego języka.Podczas instalacji, pliki tezaurusa, które zawierają tylko pusty <xml> kontener i próbki komentarzem poza <tezaurusa> zainstalowany element.W celu dla przeszukiwanie pełnego tekstu kwerendy tego poszukaj synonimy działało poprawnie, należy utworzyć rzeczywistej <tezaurusa> element, który definiuje zestaw synonimy.Można zdefiniować dwa rodzaje synonimów, rozszerzenia zestawów i zestawów zastępczych.Informacje dotyczące lokalizacji i struktury pliku tezaurusa, zobacz Konfiguracja tezaurusa.

Ograniczenia dotyczące plików tezaurusa

Do edytowania pliku tezaurusa, obowiązują następujące ograniczenia:

  • Tylko administratorzy systemu można zaktualizować, zmodyfikować lub usunąć pliki tezaurusa.

  • Podczas edytowania plików tezaurusa przy użyciu narzędzi edytora tekstu, należy zapisać pliki w formacie Unicode, a znaki kolejność bajtów musi być określona.

  • Wpisy tezaurusa nie może być pusta lub wyraz podziału na pusty ciąg.

  • Zwroty w pliku tezaurusa musi być dłuższy niż 512 znaków.

  • Tezaurus nie może zawierać zduplikowanych wpisów między <sub> wpisów Zestawy rozszerzające i <pat> elementy zastępcze zestawów.

Zalecenia dotyczące plików tezaurusa

Zaleca się, że wpisy w pliku tezaurusa zawierają znaki specjalne.Jest tak, ponieważ subtelne zachowań znaki specjalne moduły dzielenia wyrazów.Jeżeli wpis tezaurusa zawiera znaków specjalnych, moduły dzielenia wyrazów w połączeniu z tym wpisem może mieć subtelne behawioralnej implikacje dla zapytanie pełnotekstowe.

Zalecane jest <sub> wpisy zawierają nie stopwords, ponieważ pominięto stopwords indeksu pełnotekstowego.Kwerendy są rozwinięte, aby uwzględnić <sub> wpisy z pliku tezaurusa i jeśli <sub> stopwords zawiera wpis, niepotrzebnie zwiększa się rozmiar kwerendy.

Aby edytować plik tezaurusa

  1. Otwórz plik tezaurusa w Notatniku.

  2. Jeśli edytujesz plik tezaurusa dla pierwszego czas, usuń następujące wiersze komentarza na początku i na końcu pliku, odpowiednio:

    <!--Commented out
    -->
    
  3. Dodawanie, modyfikowanie lub usuwanie zestaw zastępczy lub zestaw rozszerzający.Aby uzyskać więcej informacji, zobacz Konfiguracja tezaurusa.

  4. Zapisz plik i zamknij Notatnik.

  5. Użyj sp_fulltext_load_thesaurus_file do ładowania zawartości pliku tezaurusa w tempdb, określając identyfikator lokalnych (LCID), który odpowiada język pliku tezaurusa.Na przykład plik tezaurusa angielskim tsenu.xml odpowiednich LCID jest 1033.

    USE AdventureWorks2008R2 ;
    EXEC sys.sp_fulltext_load_thesaurus_file 1033;
    GO