SharePoint Server 的搜尋結構描述概觀
適用於:2013 Subscription Edition SharePoint in Microsoft 365
搜尋索引是搜尋的核心。 搜尋索引中的物件決定了使用者輸入搜尋查詢或與網際網路或內部網路網頁互動來尋找資訊時可以找到的物件。
本文說明內容的收集標準以及如何使用搜尋結構描述從搜尋索引擷取內容。 搜尋結構描述包含編目屬性、編目屬性類別、編目 Managed 屬性對應以及 Managed 屬性設定。 Managed 屬性設定定義了您可以搜尋的項目和方法,例如,您是否可以精簡屬性或查詢屬性。
為了建立搜尋索引,必須先編目內容。 您可以編目各種內容來源,例如:SharePoint Server 內容、檔案共用或使用者設定檔。 編目項目的內容和中繼資料以「編目屬性」表示。
被編目並傳送到內容處理元件的每個項目,都會有關聯的編目屬性。 屬性範例包括 Author 、 Title 以及 Creation Date 。 任何新增的編目屬性都能夠被自動探索。
編目屬性會依據項目的 IFilter 或通訊協定處理常式分組到各個類別。 類別範例包括 Office (Word 文件、Excel 工作表的編目屬性等等)、 Business Data (範例資料庫的編目屬性) 以及 Web (網站的編目屬性)。
如需編目的詳細資訊,請參閱在 SharePoint Server 中規劃編目及同盟。
若要在搜尋索引中包含編目屬性的內容和中繼資料,必須將編目屬性對應到 Managed 屬性。 只有 Managed 屬性會被寫入搜尋索引。
Managed 屬性可以包含許多設定。 Managed 屬性上的設定決定了搜尋結果中內容的顯示方式,以及使用者搜尋的方式。
您可以將多個編目屬性對應至單一 Managed 屬性。 例如,您可以將 “Writer” 和 “Author” 編目屬性對應至 “Author” Managed 屬性。 或者,您可以將單一編目屬性對應至多個 Managed 屬性。
另外,編目屬性對應至 Managed 屬性的順序會決定 Managed 屬性的內容。 例如,Managed 屬性可以有多個對應的編目屬性,並且可設定為包含所有對應的編目屬性之中的所有值。 但是,如果您提供的編目屬性所包含的 SharePoint 標題優先順序高於對應中的其他標題,則將在搜尋結果中顯示 SharePoint 標題。
已定義一組預設編目及管理屬性之間的對應,請參閱 SharePoint Server 中的編目及管理屬性概觀。
有些編目屬性類型會自動產生新的 Managed 屬性,並在編目屬性與 Managed 屬性之間建立對應。 例如,SharePoint 文件庫的所有網站欄都有這個自動產生及對應的功能。 您在清單中建立網站欄並編目該清單的時候,就會為網站欄自動建立編目屬性、Managed 屬性以及編目屬性與 Managed 屬性之間的對應。
您可以變更編目屬性與 Managed 屬性之間的預設對應或任何其他對應、建立新的對應或建立新的 Managed 屬性。 建立新的 Managed 屬性或變更現有 Managed 屬性上的特定設定時,必須先完成完整編目,搜尋索引中才能包含新的 Managed 屬性及其值。 如果新的或變更的屬性是在 SharePoint 文件庫或清單中,您可以針對該個別文件庫或清單重新編製索引,不需要啟動整個 SharePoint 內容來源的完整編目。 這個動作的效果與完整編目相同。
如需詳細資訊,請參閱本文後續的 Managed 屬性設定概觀表格。
搜尋結構描述儲存在搜尋管理資料庫中。 搜尋結構描述包含:
編目屬性與 Managed 屬性之間的對應。 這可以是一個編目屬性對一個 Managed 屬性、一個編目屬性對多個 Managed 屬性、多個編目屬性對一個 Managed 屬性或多個編目屬性對多個 Managed 屬性的對應。
將 Managed 屬性寫入搜尋索引的方式。 例如,Managed 屬性的值應該寫入哪個全文索引,以及要寫入哪個權數群組 (內容)。
不同 Managed 屬性的設定。 例如,是否依特定 Managed 屬性搜尋、查詢或縮小搜尋結果。
依據屬性的 IFilter 或通訊協定處理常式將屬性分組的編目屬性類別。 如果編輯編目屬性類別,這個變更會套用到該類別內的所有編目屬性。 這會影響效能以及搜尋索引中項目的儲存方式。
搜尋結構描述更新會每分鐘透過搜尋系統散佈出去。
您可以建立多個搜尋結構描述。 主搜尋結構定義於Search Service 應用程式,在管理中心中可以進行編輯。 網站集合系統管理員與承租人系統管理員可以變更特定網站集合或承租人的搜尋結構描述。 例如,網站集合系統管理員可以變更該網站集合的搜尋結構描述,自訂搜尋索引要包含的項目;這種作法可以自訂該網站集合的搜尋經驗。 網站擁有者可以檢視搜尋結構描述,但不能變更它。
注意
[!附註] 您無法檢視或變更管理中心中的網站集合搜尋結構。 若要檢視或變更網站集合的搜尋結構,您必須使用 [網站集合管理]。
搜尋索引由伺服器上資料夾的一組檔案組成。 內容處理元件會處理已編目的項目,使用搜尋結構描將編目屬性對應到 Managed 屬性,以及將 Managed 屬性轉譯為寫入搜尋索引的格式。 除了各種全文檢索索引以外,還有個別的 Managed 屬性索引,分別標示為可擷取和可查詢。 另外也有個別的屬性向量索引和數值索引。
只要項目一變更,就必須在重新編目之後重新編製索引。 為了降低重新編製索引的負荷,SharePoint Server 引入了數個個別的索引更新群組。
Default 包含大部分的 Managed 屬性。 這個索引更新群組包含不屬於 Security、Link、Usage 或 People 索引更新群組的所有 Managed 屬性。
Security 包含文件存取控制清單 (ACL) Managed 屬性
Link 包含與連結結構相關的 Managed 屬性
Usage 包含與使用狀況資料相關的 Managed 屬性
People 包含與人員搜尋相關的 Managed 屬性
每個更新群組分別儲存於搜尋索引的個別資料夾。
全文檢索索引中包含所有可搜尋 Managed 屬性中的文字,儲存在全文檢索索引內。 每個全文檢索索引被分為權數群組,也稱為內容。 不同的內容與 Managed 屬性的相對重要性相關,這也是用來計算搜尋結果相關程度排名的排名功能之一。 內容的編號 (或 ID) 並不重要,排名模型是藉著指派比重加權給特定內容,來決定它的相對重要性。 比重加權越高,排名分數也就越高。 如需詳細資訊,請參閱<SharePoint Server 中的搜尋結果排名概觀>一文中的<使用搜尋結構描述影響搜尋結果的排名>小節。
除了預設全文檢索索引之外,還有兩個預先定義的全文檢索索引:SharePoint Terms 全文檢索索引 (SpTermsIdx) 和 People 索引 (PeopleIdx)。
依預設,大多數 Managed 屬性均已對應至合適的內容及全文檢索索引。 建議您,不要變更任何現有可搜尋 Managed 屬性的內容。
Managed 屬性上的設定決定內容儲存在搜尋索引中的方式,以及使用者搜尋並擷取內容的方式。
搜尋結構描述可以在管理中心、網站集合管理以及承租人管理中編輯。 網站系統管理員可以檢視搜尋結構描述,但不能編輯它。 下表說明不同的設定以及在不同的系統管理員層級上是否可以編輯它們。
Managed 屬性設定 | 功能 | 範例 | 可在 中使用 | 變更設定後所需的完整編目或重新編製索引 SharePoint 清單/文件庫 |
---|---|---|---|---|
可搜尋 | 能夠查詢 Managed 屬性的內容。 這個 Managed 屬性的內容包含於全文檢索索引。 | 例如,如果屬性為 "author",則只要查詢 "Smith",即會傳回包含單字 "Smith" 的項目,以及作者屬性包含 "Smith" 的項目。 | 管理中心 / 網站集合管理 / 承租人管理 | 是 |
進階可搜尋設定 | 啟用檢視及變更 Managed 屬性所寫入的全文檢索索引。 它也可讓您變更相關性排名計算的Managed屬性內容。 我們不建議變更任何現有 Managed 屬性的內容。 如需詳細資訊,請參閱<SharePoint Server 中的搜尋結果排名概觀>一文中的<使用搜尋結構描述影響搜尋結果的排名>小節。 | 管理中心 / 網站集合管理 / 承租人管理 | 是 | |
可查詢 | 能夠查詢特定 Managed 屬性。 Managed 屬性名稱必須包含於查詢中,可以在查詢本身中指定或者以程式設計的方式包含在查詢內。 | 如果 Managed 屬性為 "author",查詢必須包含 "author:Smith"。 | 管理中心 / 網站集合管理 / 承租人管理 | 從停用到啟用。 |
可擷取 | 讓搜尋結果能夠傳回此 Managed 屬性的內容。 為相關的 Managed 屬性啟用這個設定,以便在搜尋結果中顯示。 | 管理中心 / 網站集合管理 / 租用戶管理 | 從停用到啟用。 | |
允許多個值 | 允許此 Managed 屬性中同一個類型具有多個值。 | 如果是 "author" Managed 屬性且文件有多位作者,將每位作者的名稱在 Managed 屬性中會儲存個別值。 | 管理中心 | 是 |
可精簡搜尋 | Yes - active:能夠在前端使用屬性作為搜尋結果精簡器。 您必須手動在網頁組件中設定精簡器。 Yes - latent:能夠稍後將可精簡搜尋切換為啟用,而不用在切換時重新執行完整編目。 這兩個選項都需要完整編目才能生效。 重要事項: 如果選取 [Yes - active] 或 [Yes - latent],必須也要將 Managed 屬性設定為可查詢。 新式搜尋體驗不支援 。 |
如果 "author"Managed 屬性是設定為可精簡搜尋,則稍後可以在搜尋前端將 Author 設定精簡器。 | 管理中心 | 從停用到啟用 (如果尚未設定為可排序) |
可排序 | Yes - active:能夠在結果集傳回前先按照屬性排序結果集。 Yes - latent:能夠稍後將排序切換為啟用,而不用在切換時重新執行完整編目。 這兩個選項都需要完整編目才能生效。 新式搜尋體驗不支援 。 |
用於無法同時排序和擷取的大型結果集。 | 管理中心 | 從停用到啟用 (如果尚未設定為 可精簡搜尋) |
別名 | 如果想要在查詢和搜尋結果中使用別名而不是 Managed 屬性,這個設定可以定義 Managed 屬性的別名。 請使用原來的 Managed 屬性而不是別名來對應編目屬性。 | 如果您不想或無權限建立新的 Managed 屬性,請使用別名。 | 管理中心 / 網站集合管理 / 承租人管理 | 否 |
Token 正規化 | 能夠傳回與查詢中使用之字母大小寫和讀音符號無關的結果。 | 查詢 "curacao" 也可以找到 "Curacao"、"curacao" 及 "Curacao" 的相符項目。 | 管理中心 / 網站集合管理 / 承租人管理 | 是 |
完全相符 | 根據預設,搜尋會傳回針對 Managed 屬性的查詢與 Managed 屬性內容之間的部分相符專案。 選取 [完成比對] 進行搜尋,以改為傳回完全相符專案。 |
如果 Managed 屬性 「Title」 包含 「Contoso Sites」,則只有查詢標題:「Contoso Sites」 會提供結果。 | 管理中心 / 網站集合管理 / 承租人管理 | 是 |
僅限 SharePoint Server 2019 (語言中性令牌化) | 如果您有多語系內容,且 Managed 屬性包含以元數據字片組或其他標識碼為基礎的標記,請選取語言中性標記。 根據預設,搜尋會在將查詢和內容分成部分 (令牌化) 時,視語言而定。 例如,包含英文和中文產品數據工作表的文檔庫,其中產品標識碼具有非英數位元,例如 “11.132-84-115#4”。 當搜尋處理數據工作表時,它會偵測其語言,並根據該語言將其中 的所有內容 標記化。 當使用者搜尋產品標識碼時,搜尋會根據其所在 SharePoint 網站的語言設定,將查詢標記化。 如果網站設定為英文,且用戶搜尋已標記為中文文字的產品標識符,則 令牌可能不 相符,而且使用者不會得到任何結果。 若要改善用戶的結果,請將產品標識碼的編目屬性對應至新的 Managed 屬性 「ProductID」,並啟用語言中性令牌化。 指示用戶針對新的 Managed 屬性搜尋產品識別碼,如下所示:ProductID:“11.132-8”。 |
如果產品標識碼的編目屬性對應至 Managed 屬性 「ProductID」,則搜尋會針對 「ProductID」 的查詢使用語言中性令牌化。 | 管理中心 / 網站集合管理 / 承租人管理 | 是 |
僅限 SharePoint Server 2019 (更精細的查詢令牌化) | 使用此設定可協助使用者在包含非英數位元數據的 Managed 屬性中搜尋時,取得更好的搜尋結果。 此設定會使針對 Managed 屬性的查詢變慢。 想要快速輸入查詢,然後瀏覽結果以尋找所尋找數據工作表的使用者,通常會輸入 ProductID:“132-884” 之類的查詢。 由於搜尋預設會將搜尋索引的內容分成比查詢更小的部分,因此搜尋可能找不到這些查詢的相符專案。 當查詢進行更細微的標記化時,搜尋索引和查詢中的令牌之間比較可能相符。 使用者也可以查詢產品標識碼的中間或最後一個部分。 搜尋數據工作表且預期只會取得符合完整產品標識碼之結果的使用者,通常會撰寫 ProductID:“11.132-884-115#4” 之類的查詢。 更精細的查詢令牌化不會影響這類查詢。 |
如果您的 Managed 屬性 “Product identifier” 包含 “11.132-884-115#4”,則 ProductID:“132-884” 之類的搜尋可能會取得結果。 | 管理中心 / 網站集合管理 / 承租人管理 | 否 |
對應到編目屬性 | 清單中顯示與該 Managed 屬性對應的所有編目屬性清單。 Managed 屬性可以從一或多個編目屬性取得內容。 您可以包含所有編目屬性的內容或只包含第一個不是空的編目屬性以下的內容 (按照指定的順序)。 |
管理中心 / 網站集合管理 / 承租人管理 | 是 | |
公司名稱擷取 | 編目新的或更新的項目時,能讓系統從 Managed 屬性擷取公司名稱實體。 擷取的實體稍後可以用來設定精簡器。 已經為公司名稱擷取內含一個預先填入的字典。 系統會將原來的 Managed 屬性內容儲存在索引中,而且不變更內容,而且再將擷取的實體複製到 Managed 屬性 "companies"。 "companies" Managed 屬性已設定為可搜尋、可查詢、可擷取、可排序和可精簡搜尋。 您可以在字詞庫中編輯公司名稱字典。 如需詳細資訊,請參閱<在 SharePoint Server 中管理公司名稱擷取>。 新式搜尋體驗不支援 。 |
管理中心 / 網站集合管理 / 承租人管理 | 是 | |
自訂實體擷取 | 允許一或多個自訂實體擷取器與此 Managed 屬性關聯。 編目新的或更新的項目時,能讓系統從 Managed 屬性擷取實體。 擷取的實體稍後可以用來設定精簡器。 如需詳細資訊,請參閱在 SharePoint Server 中建立及部署自訂實體擷取器。 新式搜尋體驗不支援 。 |
管理中心 / 網站集合管理 | 是 |