在 SharePoint Server 中建立及部署自訂實體擷取器
**適用版本:**SharePoint Server 2013, SharePoint Server 2016
**上次修改主題的時間:**2017-09-11
摘要: 了解如何建立自訂實體擷取器以及如何用來設定自訂精簡器。建立一或多個自訂實體擷取字典,並連接到 Managed 屬性。
您可以在 SharePoint Server 的外部系統中建立及維護自訂實體擷取器檔案,再匯入 SharePoint Server ,以確保搜尋系統可以使用此自訂實體擷取器。
若要使用自訂實體作為精簡器,請先建立及部署自訂實體擷取字典。然後設定 Managed 屬性,以使用自訂實體擷取器並執行完整編目。在這之後,即可設定搜尋結果頁面上的精簡搜尋網頁組件,以使用自訂實體作為精簡器。
本文內容:
開始之前
建立自訂實體擷取字典
部署自訂實體擷取字典
設定自訂實體擷取的 Managed 屬性
在網頁組件中設定精簡器
開始之前
在開始這項作業之前,您必須擁有的項目:
Search Service 應用程式
至少有一個完整已編目的內容來源
搜尋結果頁面
建立自訂實體擷取字典
若要建立自訂實體擷取字典
決定您要建立的自訂實體擷取字典類型:全字相符 (不分大小寫)、全字部分相符 (不分大小寫)、全字相符 (區分大小寫) 或全字部分相符 (區分大小寫)。請參閱<自訂實體擷取器類型概觀>。
建立具有 [索引鍵] 和 [顯示表單] 欄的 .csv 檔案。請務必使用逗號分隔各欄。如果檔案包含非 ASCII 字元,例如讀音符號,必須在 UTF-8 中進行編碼。將檔案儲存至將要執行 Microsoft PowerShell Cmdlet 的存取伺服器,以部署自訂實體擷取字典。
在 [索引鍵] 欄中,輸入您要加入作為自訂實體的字詞 (一或多個字)。每個索引鍵可以有多行。請確定字詞前後不含前置空格或結尾空格。
(選用) 在 [顯示表單] 欄中,輸入精簡器名稱。如果將此欄留白,從內容擷取的字詞會顯示為精簡器,並保留其在內容中出現的大小寫。使用 [Display Form] 欄可控制並標準化精簡器的顯示方式。
例如,名為 Contoso 的組織有三種等級的認證系統:Contoso Beginner、Contoso Professional 和 Contoso Expert。Contoso 將擷取這些實體並且進行調整。無論寫入的字詞是 "Contoso"、 "beginner"、"professional" 還是 "expert",都將使精簡器顯示為 Contoso Beginner、Contoso Professional 和 Contoso Expert。由於此範例,自訂實體擷取字典輸入能夠顯示為:
Key,Display form
Contoso Beginner,Contoso Beginner
Contoso B1,Contoso Beginner
Contoso Professional,Contoso Professional
Contoso prof,Contoso Professional
Contoso Expert,Contoso Expert
部署自訂實體擷取字典
若要部署自訂實體擷取字典,您必須將此字典匯入 SharePoint Server。
若要匯入自訂實體擷取字典
確認匯入自訂實體擷取器字典的使用者帳戶是否為 Search Service 應用程式的管理員。
啟動 SharePoint 管理命令介面。
在 Windows PowerShell 命令提示字元處,輸入下列命令:
$searchApp = Get-SPEnterpriseSearchServiceApplication Import-SPEnterpriseSearchCustomExtractionDictionary -SearchApplication $searchApp -Filename <Path> -DictionaryName <Dictionary name>
其中:
<Path> 指定要匯入之 .csv 檔案 (自訂擷取字典) 的完整 UNC 路徑。
<Dictionary name> 是自訂擷取字典類型的名稱。
根據您匯入的字典類型,輸入下列其中一項:
Microsoft.UserDictionaries.EntityExtraction.Custom.Word.n [其中 n = 1、2、3、4 或 5]
Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1
Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.n [其中 n = 1、2、3、4 或 5]
Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1
設定自訂實體擷取的 Managed 屬性
下列程序說明如何建立自訂實體擷取字典與您要擷取自訂實體之現有 Managed 屬性的關聯。一般而言,這會是您預計要包含這些實體的 Managed 屬性,例如 Managed 屬性 Title 或 Body。即使這些內容中的區段標示為 <no index>,仍是從相關聯的 Managed 屬性中擷取自訂實體。
若要指定應擷取自訂實體的現有 Managed 屬性,您可以編輯現有的 Managed 屬性。如需管理編目屬性和 Managed 屬性的詳細資訊,請參閱<在 SharePoint Server 中管理搜尋結構描述>。
若要編輯自訂實體擷取的 Managed 屬性
確認使用者帳戶是否為 Search Service 應用程式的管理員。
在管理中心的 [應用程式管理] 區段中,按一下 [管理服務應用程式]。
按一下 [Search Service 應用程式]。
在 [搜尋管理] 頁面的 [快速啟動] 中,按一下 [查詢與結果] 底下的 [搜尋結構描述]。
在 [Managed 屬性]頁面上,尋找您要與自訂實體擷取字典建立關聯的 Managed 屬性,且包含一或多個字詞 (或局部字詞)。您也可以在 [篩選] 屬性的名稱。
指向 Managed 屬性,按一下箭號,再按一下 [編輯/對應屬性] 。
在 [編輯 Managed 屬性] 頁面上,編輯 [自訂實體擷取] 下的設定。選取已匯入的自訂實體擷取字典,然後按一下 [確定]。
下一次編目完成時,便會啟用自訂實體擷取器。原始的 Managed 屬性內容則會儲存在搜尋索引中而保持不變。此外,取決於啟用的自訂實體擷取器類型,所擷取的實體會複製到下列 Managed 屬性中的一個或多個內:WordCustomRefiner1、WordCustomRefiner2、WordCustomRefiner3、WordCustomRefiner4、WordCustomRefiner5WordExactCustomRefinerWordPartCustomRefiner1、WordPartCustomRefiner2、WordPartCustomRefiner3。WordPartCustomRefiner4、WordPartCustomRefiner5WordPartExactCustomRefinerThese 等 Managed 屬性則會自動設定為可搜尋、可查詢、可擷取、可排序和可精簡搜尋。
在網頁組件中設定精簡器
您可以使用擷取的自訂實體作為搜尋結果頁面中的精簡器。以自訂實體為基礎的精簡器可在精簡搜尋網頁組件中使用。
若要新增以自訂實體擷取器為基礎的精簡器
確認執行此程序的使用者帳戶為搜尋中心網站上設計者 SharePoint 群組的成員。
瀏覽至包含欲設定之精簡搜尋網頁組件的頁面。依序按一下 [設定功能表]、[編輯頁面]。
編輯精簡搜尋網頁組件。按一下 [精簡搜尋網頁組件功能表] 箭頭,然後再按一下 [編輯網頁組件]。
在網頁組件工具窗格的 [精簡搜尋屬性] 區段中,確認是否已選取 [選擇此網頁組件中的精簡器]。
按一下 [選擇精簡器]。
在 [精簡搜尋設定] 頁面中的 [可用的精簡器] 區段中,使用按鈕選取一或多個包含要顯示為清單中之精簡器的擷取實體 Managed 屬性,然後按一下 [新增]。例如,如果已部署全字相符擷取字典 (不分大小寫),請選擇 WordCustomRefiner1。
在 [設定] 區段中,設定您要讓每個精簡器顯示的方式。
按一下 [確定]。
自訂實體擷取器類型概觀
下表顯示您可以建立的自訂擷取字典類型,以及字典項目與搜尋索引中之內容的比對方式、部署字典時須使用的字典名稱,以及將包含擷取實體的 Managed 屬性..
自訂實體擷取器/自訂實體擷取器字典 | 描述 | 範例 | 在 Windows PowerShell 使用的字典名稱 | 將包含擷取實體的 Managed 屬性 |
---|---|---|---|---|
全字相符 |
不區分大小寫,字典項目與 Token 化的內容相符,最多 5 個字典。 |
"anchor" 項目與 "anchor" 和 "Anchor" 相符,而不會與 "anchorage" 相符 |
Microsoft.UserDictionaries.EntityExtraction.Custom.Word.n [其中 n = 1、2、3、4 或 5] |
WordCustomRefiner1 WordCustomRefiner2 WordCustomRefiner3 WordCustomRefiner4 WordCustomRefiner5 |
全字部分相符 |
不區分大小寫,字典項目與未 Token 化的內容相符,最多 5 個字典。 |
"anchor" 項目與 "anchor"、"Anchor" 和 "anchorage" 相符 |
Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.n [其中 n = 1、2、3、4 或 5] |
WordPartCustomRefiner1 WordPartCustomRefiner2 WordPartCustomRefiner3 WordPartCustomRefiner4 WordPartCustomRefiner5 |
全字相符擷取 |
區分大小寫,字典項目與 Token 化的內容相符,最多 1 個字典。 |
"anchor" 項目與 "anchor" 項目相符,不與 "Anchor" 或 "Anchorage" 相符 |
Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1 |
WordExactCustomRefiner |
全字部分相符擷取 |
區分大小寫,字典項目與未 Token 化的內容相符,最多 1 個字典。 |
"anchor" 項目與 "anchor" 和 "anchorage" 相符,不與 "Anchor" 相符 |
Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1 |
WordPartExactCustomRefiner |