如何:編輯同義字檔案 (全文檢索搜尋)
您可以透過編輯給定語言的同義字檔案 (XML 檔案),設定同義字。在安裝期間,系統會安裝僅包含 <xml> 容器和標記為註解之範例 <thesaurus> 元素的空白同義字檔案。若要讓尋找同義字的全文檢索搜詢查詢正常運作,您必須建立定義一組同義字的實際 <thesaurus> 元素。您可以定義兩種同義字形式:展開集和取代集。如需有關同義字檔案之位置和結構的詳細資訊,請參閱<同義字組態>。
同義字檔案的限制
當您編輯同義字檔案時,就會適用下列限制:
只有系統管理員能夠更新、修改或刪除同義字檔案。
當您使用文字編輯器工具編輯同義字檔案時,必須以 Unicode 格式儲存這些檔案,而且必須指定位元組順序標示 (BOM)。
同義字項目不得為空白或斷詞為空字串。
同義字檔案中的片語長度不得超過 512 個字元。
在展開集的 <sub> 項目與取代集的 <pat> 元素之間,同義字不得包含任何重複的項目。
同義字檔案的建議
我們建議同義字檔案中的項目不應該包含任何特殊字元。這是因為斷詞工具在處理特殊字元方面具有難以察覺的行為。如果某個同義字項目包含任何特殊字元,與該項目搭配使用的斷詞工具可能會針對全文檢索查詢產生難以察覺的行為隱含。
我們建議 <sub> 項目不應該包含任何停用字詞,因為全文檢索索引已經省略了停用字詞。查詢會展開成包含同義字的 <sub> 項目,而且如果 <sub> 項目包含停用字詞,查詢的大小就會不必要地增加。
編輯同義字檔案
在 [記事本] 中,開啟同義字檔案。
如果是第一次編輯同義字檔案,則請分別移除檔案開頭及結尾處的下列註解行:
<!--Commented out -->
加入、修改或刪除取代集或展開集。如需詳細資訊,請參閱<同義字組態>。
儲存檔案並關閉記事本。
使用 sp_fulltext_load_thesaurus_file,將同義字檔案的內容載入 tempdb,並指定對應至同義字檔案語言的地區設定識別碼 (LCID)。例如,英文同義字檔案 tsenu.xml 的對應 LCID 就是 1033。
USE AdventureWorks2008R2 ; EXEC sys.sp_fulltext_load_thesaurus_file 1033; GO