在內容搜尋中之部分編製索引的新項目
提示
新的 Microsoft Purview 入口網站現已提供電子檔探索 (預覽) 。 若要深入瞭解如何使用新的電子檔探索體驗,請參閱 瞭解電子檔探索 (預覽) 。
當您執行搜尋時,從 Microsoft Purview 合規性入口網站執行的內容搜尋會自動在估計的搜尋結果中包含部分編製索引的專案。 部分編製索引的專案是 SharePoint 和商務用 OneDrive 網站上的 Exchange 信箱專案和檔,因故未完全編製索引以供搜尋。 在 Exchange 中,部分編製索引的專案通常包含檔類型的檔案 (,該文件類型無法) 附加至電子郵件訊息的索引。 以下是當您執行電子檔探索搜尋時,專案無法編製索引以進行搜尋,並以部分索引專案傳回的其他原因:
- 檔案類型無法辨識或不支援索引編製功能。
- 訊息具有無法開啟的附加檔案;這是部分編製索引電子郵件專案最常見的原因。
- 檔案類型支援索引編製,但在編製特定檔案的索引時發生錯誤。
- 附加至電子郵件訊息的檔案太多。
- 附加至電子郵件訊息的檔案太大。
- 檔案已使用非 Microsoft 技術加密。
- 檔案受密碼保護。
注意事項
大部分組織的內容數量少於 1%,而部分編製索引的大小小於 12%。 磁碟區和大小之間差異的原因是較大的檔案具有較高的機率,包含無法完全編製索引的內容。
若要進行法律調查,您的組織可能需要檢閱部分編製索引的專案。 您也可以指定當您將搜尋結果匯出至本機計算機時,或當您使用電子檔探索 (Premium) 準備分析結果時,是否要包含部分編製索引的專案。 如需詳細資訊,請 參閱調查電子檔探索中部分編製索引的專案。
提示
如果您不是 E5 客戶,請使用 90 天Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據。
未編製搜尋索引的文件類型
某些類型的檔案,例如位圖 (.bmp) 或 MP3 (.mp3) 檔案,不包含可編製索引的內容。 因此,Exchange 和 SharePoint 中的搜尋索引伺服器不會在這些類型的檔案上執行全文檢索索引。 這些類型的檔案會被視為不支援的檔案類型。 也有些檔案類型的全文檢索編製已依預設停用,或是被系統管理員停用。 在內容搜尋中,不支援和停用的文件類型會標示為未編製索引的專案。 如先前所述,當您執行搜尋、將搜尋結果匯出至本機計算機,或準備搜尋結果以供 eDiscovery (Premium) 時,部分編製索引的專案可以包含在搜尋結果集合中。
如需支援和停用的檔案格式清單,請參閱下列文章:
- 交換 - Exchange 搜尋編製索引的檔格式
- 交換 - Get-SearchDocumentFormat
- SharePoint - SharePoint 中的預設編目檔名擴展名和剖析的文件類型
具有部分索引檔類型的訊息和檔可以在搜尋結果中傳回
並非每個含有部分索引檔案附件的電子郵件訊息,或每個部分編製索引的 SharePoint 檔都會自動傳回為部分編製索引的專案。 這是因為其他訊息或文檔屬性,例如電子郵件訊息中的 Subject 屬性,以及檔的 Title 或 Author 屬性都會編製索引並可供搜尋。 例如,如果該關鍵詞出現在電子郵件訊息的主旨或檔名或文件標題中,則搜尋 「financial」 的關鍵詞會傳回具有部分索引檔案附件的專案。 不過,如果關鍵詞只出現在檔案本文中,訊息或檔會以部分索引項目傳回。
同樣地,當其他索引和可搜尋的郵件或文檔屬性符合搜尋準則時,具有部分索引檔案附件和部分索引檔類型的檔的訊息也會包含在搜尋結果中。 會編入搜尋索引中的郵件內容,包括傳送和接收日期、寄件者和收件者、附件的檔案名稱,以及郵件內文中的文字。 為搜尋編製索引的文件屬性包括建立和修改日期。 因此,即使郵件附件可能是部分編製索引的專案,如果其他訊息或文檔屬性的值符合搜尋準則,訊息仍會包含在一般搜尋結果中。
如需您可以在合規性入口網站中使用電子檔探索工具搜尋的電子郵件和文檔屬性清單,請參閱 電子檔探索的關鍵詞查詢和搜尋條件。
注意事項
如果信箱專案從已編製索引的資料夾移至未編製索引的資料夾,則會將旗標設定為該專案的 unindex,而且專案會從索引中移除,而且將無法搜尋。 稍後,如果將相同的專案移回已編製索引的資料夾,則不會重設旗標。 這表示專案會保持未編製索引,且無法搜尋。
搜尋結果中包含部分索引的專案
您的組織可能需要識別部分編製索引的專案並執行其他分析,以判斷其內容、包含的內容,以及它們是否與特定調查相關。 如先前所述,搜尋的內容位置中部分編製索引的專案會自動包含在估計的搜尋結果中。 當您匯出搜尋結果或準備 eDiscovery (Premium) 的搜尋結果時,可以選擇包含這些部分編製索引的專案。
請記住下列部分編製索引的專案:
當您執行電子檔探索搜尋時,搜尋查詢 () 傳回的部分索引 Exchange 專案總數和大小會顯示在飛出視窗頁面上的搜尋統計數據中,並標示為 未編製索引的專案。 飛出視窗頁面上顯示之部分索引專案的統計數據不包含 SharePoint 網站或 OneDrive 帳戶中部分編製索引的專案。
如果您要匯出結果的搜尋是搜尋特定內容位置或組織中的所有內容位置,則只會匯出包含符合搜尋準則之專案之內容位置的未編製索引專案。 In other words, if no search results are found in a mailbox or site, then any unindexed items in that mailbox or site won't be exported. 這是因為從組織中的許多位置匯出部分編製索引的專案可能會增加匯出錯誤的可能性,並增加匯出和下載搜尋結果所需的時間。
若要從搜尋的所有內容位置匯出部分編製索引的專案,請將搜尋設定為傳回 (的所有專案,方法是從搜尋查詢中移除任何關鍵詞) ,然後在匯出搜尋結果時只匯出部分索引的專案 (,方法是選取 [只有格式無法辨識 的專案]、[已加密] 或 [輸出 選項 ] 下的其他原因未編製索引) 。
如果您選擇在搜尋結果中包含所有信箱專案,或搜尋查詢未指定任何關鍵詞或只指定日期範圍,則部分編製索引的專案可能不會複製到包含部分索引專案的 PST 檔案。 這是因為所有專案,包括任何部分編製索引的專案,都會自動包含在一般搜尋結果中。
部分編製索引的項目無法預覽。 您必須匯出搜尋結果,才能檢視搜尋所傳回的部分索引專案。
此外,當您匯出搜尋結果並在導出中包含部分編製索引的專案時,來自 SharePoint 專案的部分索引專案會匯出至名為 Uncrawlable 的檔案夾。 當您匯出部分編製索引的 Exchange 專案時,會根據部分編製索引的專案是否符合搜尋查詢和匯出設定的組態,以不同的方式匯出這些專案。
下表顯示已編製索引和部分編製索引之專案的匯出行為,以及是否針對不同的導出組態設定包含每個專案。
匯出組態 符合搜尋查詢的索引專案 符合搜尋查詢的部分索引專案 部分編製索引的專案不符合搜尋查詢 僅匯出已編製索引的專案 出口 匯出 (隨附於導出的索引項) 未匯出 僅匯出部分編製索引的專案 未匯出 匯出 (為部分編製索引的專案) 匯出 (為部分編製索引的專案) 匯出已編製索引和部分編製索引的專案 出口 匯出 (隨附於導出的索引項) 匯出 (為部分編製索引的專案)
日期範圍和排除部分編製索引的專案
在內容搜尋和Microsoft Purview 電子檔探索中,您無法使用日期範圍來排除部分編製索引的專案,而無法由搜尋查詢傳回。 換句話說,屬於日期範圍以外的部分索引專案仍會包含為搜尋統計數據中部分編製索引的專案,以及導出部分索引專案時。 在 eDiscovery (Premium) 中,可以收集部分編製索引的專案,然後在匯出之前篩選在檢閱集中。
訊息的索引編製限制
下表描述可能導致電子郵件訊息在 Microsoft 365 的電子檔探索搜尋中以部分索引專案傳回的索引限制。
如需 SharePoint 檔的索引編製限制清單,請參閱 SharePoint Online 的搜尋限制。
編製索引限制 | 最大值 | 描述 |
---|---|---|
不含 Excel 檔案 (附件大小上限) |
150 MB |
將剖析索引的電子郵件附件大小上限。 任何大於此限制的附件都不會剖析為編製索引,而且附件的訊息會標示為部分編製索引。 注意: 剖析是索引服務從附件擷取文字、移除標點符號和空格等不必要的字元,然後將文字分割成文字 (在稱為標記化) 的進程中,然後儲存在索引中的程式。 |
Excel 檔案的大小上限 |
4 MB |
位於網站的 Excel 檔案大小上限,或附加至將剖析以編製索引的電子郵件訊息。 任何大於此限制的 Excel 檔案都不會被剖析,而且含有檔案附件的郵件的檔案或電子郵件會標示為未編製索引。 |
附件數目上限 |
250 |
將剖析為編製索引的電子郵件訊息所附加的檔案數目上限。 如果訊息有超過 250 個附件,則會剖析前 250 個附件並編製索引,而且訊息會標示為部分索引,因為它有其他未剖析的附件。 |
附件深度上限 |
30 |
剖析的巢狀附件數目上限。 例如,如果電子郵件訊息附加另一則訊息,且附加的郵件有附加的 Word 檔,則 Word 檔和附加的郵件將會編製索引。 此行為最多會持續 30 個巢狀附件。 |
附加的影像數目上限 |
0 |
剖析器會略過附加至電子郵件訊息的影像,且未編製索引。 |
剖析專案所花費的時間上限 |
30 秒 |
剖析專案以編製索引時,最多會花費 30 秒。 如果剖析時間超過 30 秒,專案會標示為已部分編製索引。 |
剖析器輸出上限 |
200 萬個字元 |
已編製索引之剖析器的文字輸出量上限。 例如,如果剖析器從檔擷取 8 百萬個字元,則只會編製前 2 百萬個字元的索引。 |
批注令牌數目上限 |
2 百萬 |
編製電子郵件訊息的索引時,每個字組都會以不同的處理指示標註,以指定該字組的索引方式。 每一組處理指示稱為批註令牌。 為了維護 Office 365 中的服務質量,電子郵件訊息有 2 百萬個批注令牌的限制。 |
索引中的主體大小上限 |
6700 萬個字元 |
電子郵件訊息本文及其所有附件中的字元總數。 編製電子郵件訊息的索引時,訊息本文和所有附件中的所有文字都會串連成單一字串。 這個已編製索引的字串大小上限為6700萬個字元。 |
主體中唯一令牌的最大值 |
1 百萬 |
如先前所述,令牌是從內容中擷取文字、移除標點符號和空格,然後將它分割成單字的結果, (稱為儲存在索引中的令牌) 。 例如,片語 "cat, mouse, bird, dog, dog" 包含5個令牌。 但其中只有 4 個是唯一的令牌。 每個電子郵件訊息有1百萬個唯一令牌的限制,有助於防止索引因為隨機令牌而變得太大。 |
部分編製索引專案的詳細資訊
- 如先前所述,由於訊息和文檔屬性及其元數據已編製索引,因此如果索引元數據中出現該關鍵詞,關鍵詞搜尋可能會傳回結果。 不過,如果關鍵詞只出現在檔類型不支援的項目內容中,則該相同的關鍵詞搜尋可能不會傳回相同的專案。 在此情況下,專案會以部分編製索引的專案傳回。
- 如果部分編製索引的專案因為符合搜尋查詢準則而包含在搜尋結果中,當您匯出搜尋結果時,不會包含部分索引的專案。
- 雖然支援編製索引並編製索引的文件類型,但可能會發生索引或搜尋錯誤,導致檔案以部分編製索引的專案傳回。 例如,搜尋大型 Excel 檔案可能會在 (部分成功,因為前 4 MB 已編製索引) ,但之後會因為超過檔案大小限制而失敗。 在此情況下,搜尋結果和部分索引專案可能會傳回相同的檔案。
- 使用 Microsoft加密技術 加密並附加至符合搜尋準則的電子郵件訊息的檔案可以預覽,並在導出時解密。 目前,使用Microsoft加密技術加密的檔案 (並儲存在 SharePoint 或商務用 OneDrive) 部分編製索引。
- 使用 S/MIME 加密的電子郵件訊息會部分編製索引。 其中包括含有或不含檔案附件的加密郵件。
- 使用 Azure Rights Management 保護的電子郵件訊息會編制索引,如果符合搜尋查詢,則會包含在搜尋結果中。 受版權保護的電子郵件訊息會解密,而且可以預覽和導出。 這項功能會要求您獲指派預設指派給電子檔探索管理員角色群組的 RMS 解密角色。
- 如果您建立與電子檔探索案例相關聯的查詢型保留,則會保留所有部分編製索引的專案。 這包括部分編製索引的專案不符合保留的搜尋查詢準則。 如需建立查詢型電子檔探索保留的詳細資訊,請參閱 建立電子檔探索保留。