全文檢索搜尋基礎觀念
本主題簡短描述與「全文檢索搜尋」關聯的元件、程序以及詞彙。「全文檢索搜尋」與 Microsoft SQL Server 共用許多詞彙,但仍有一些詞彙僅用於「全文檢索搜尋」,例如「編目」與「Token」。
全文檢索搜尋詞彙
使用「全文檢索搜尋」時,需熟悉下列詞彙與元件。
全文檢索索引
儲存有關重要單字及其在特定資料行中的位置等資訊。您可運用這些資訊快速地計算全文檢索查詢,以便在資料列中搜尋特定單字或單字組合。如需詳細資訊,請參閱<全文檢索索引>。
全文檢索目錄
全文檢索目錄內含零或多個全文檢索索引。全文檢索目錄必須位在與 SQL Server 之執行個體相關聯的本機硬碟中。每個目錄皆可滿足資料庫中一或多個資料表的索引需求。全文檢索目錄無法儲存在抽取式磁碟機、軟碟或網路磁碟中,除非您是要附加包含全文檢索目錄的唯讀資料庫。
文字分隔
對於指定的語言,文字分隔可根據該語言的語彙規則將單字 Token 化。如需詳細資訊,請參閱<斷詞工具與詞幹分析器>。
Token
可由文字分隔來識別的單字或字元字串。
字根
對於指定的語言,字根可根據該語言的規則對特定單字產生字形變化。字根會因語言而有所不同。如需詳細資訊,請參閱<斷詞工具與詞幹分析器>。
篩選
指定特定的檔案類型後,例如 .doc,篩選即可將 varbinary(max) 中或 image 資料行中儲存的文字取出。如需詳細資訊,請參閱<全文檢索搜尋篩選>。
擴展或編目
是指建立與維護全文檢索索引的程序。如需詳細資訊,請參閱<全文檢索索引結構>。
贅字
是指無助於搜尋卻經常出現的單字。 以地區設定英文為例,"a"、"and"、"is" 及 "the" 皆會視為贅字。這些單字會被忽略,以精簡全文檢索索引。如需詳細資訊,請參閱<贅字>。
附註: |
---|
Microsoft Windows 容錯移轉叢集環境完全支援全文檢索索引。 |
請參閱
概念
其他資源
CREATE FULLTEXT INDEX (Transact-SQL)