全文檢索搜尋篩選
在 varbinary、varbinary(max)、image 或 xml 資料類型資料行中索引文件需要進行額外處理。這項處理必須由篩選執行。篩選會從文件中擷取文字資訊 (移除格式)。然後,篩選會將文字傳送至與資料表資料行相關聯之語言的斷詞工具元件。
給定的篩選是給定文件類型 (.doc、.pdf、.xls 和 .xml 等等) 特有的。這些篩選會實作 IFilter 介面。如需有關這些文件類型的詳細資訊,請查詢 sys.fulltext_document_types 目錄檢視。
二進位文件可以儲存在單一 varbinary(max) 或 image 資料行中。SQL Server 會根據文件的副檔名,為每個文件選擇正確的篩選。由於在 varbinary(max) 或 image 資料行中儲存檔案後,將會看不到副檔名,因此必須將副檔名 (.doc、.xls、.pdf 等等) 儲存在資料表的不同資料行中,此資料行稱為類型資料行。此類型資料行可以是任何一種字元式資料類型,且包含文件副檔名,如 Microsoft Word 文件的 .doc。在 Adventure Works 的 Document 資料表中,Document 資料行的類型為 varbinary(max),而 FileExtension 類型資料行的類型為 nvarchar(8)。如需此資料表之結構描述的詳細資訊,請參閱<Document 資料表 (AdventureWorks)>。
[!附註]
根據篩選的實作方式,篩選可能會處理父物件中內嵌的物件。不過,SQL Server 不會將篩選設定成遵循其他物件的連結。
SQL Server 2008 會安裝其自有的 XML 和 HTML 篩選。此外,SQL Server 也會載入已經安裝在作業系統上的其他任何 Microsoft 專用格式 (.doc、.xdoc、.ppt 等等) 篩選。若要識別目前載入到 SQL Server 執行個體上的篩選,請使用 sp_help_fulltext_system_components 預存程序,如下所示:
EXEC sp_help_fulltext_system_components 'filter';
不過,您必須先手動將非 Microsoft 格式的篩選載入伺服器執行個體中,然後才能使用它們。如需有關安裝其他篩選的詳細資訊,請參閱<如何:更改已註冊的斷詞工具和篩選清單 (Transact-SQL)>。
若要檢視現有全文檢索索引中的類型資料行
變更記錄
更新的內容 |
---|
新增有關安裝篩選的資訊。 |