Share via


예상 및 실제 eDiscovery 검색 결과 차이

이 문서는 다음 Microsoft Purview eDiscovery 도구 중 하나를 사용하여 실행할 수 있는 검색에 적용됩니다.

  • 콘텐츠 검색
  • eDiscovery(표준)

eDiscovery 검색을 실행할 때 사용하는 도구는 검색 조건과 일치하는 항목 수(및 총 크기)의 추정치를 반환합니다. 예를 들어 Microsoft Purview 규정 준수 포털 검색을 실행하면 선택한 검색에 대한 예상 검색 결과가 플라이아웃 페이지에 표시됩니다.

검색 플라이아웃 페이지에 표시되는 결과 예측입니다.

이는 결과를 로컬 컴퓨터로 내보내고 검색 결과와 함께 다운로드한 요약 내보내기 보고서에서 eDiscovery 내보내기 도구에 표시되는 총 크기 및 항목 수와 동일한 추정치입니다.

eDiscovery 내보내기 도구의 예상 결과

eDiscovery 내보내기 도구의 예상 결과입니다.

요약 내보내기 보고서의 예상 결과

예상 검색 결과는 내보내기 요약 보고서에 포함됩니다.

그러나 요약 내보내기 보고서의 이전 스크린샷에서 알 수 있듯이 다운로드된 실제 검색 결과의 크기와 수는 예상 검색 결과의 크기와 수와 다릅니다.

예상 검색 결과와 다운로드한 검색 결과의 차이입니다.

이러한 차이점에 대한 몇 가지 이유는 다음과 같습니다.

  • 결과가 예측되는 방식입니다. 검색 결과의 추정치는 검색 쿼리 조건을 충족하는 항목의 추정값(실제 개수가 아님)입니다. Exchange 항목의 예상값을 컴파일하려면 사용 중인 eDiscovery 도구를 통해 Exchange 데이터베이스에서 검색 조건을 충족하는 메시지 ID 목록을 요청합니다. 그러나 검색 결과를 내보내면 검색이 다시 실행되고 Exchange 데이터베이스에서 실제 메시지가 검색됩니다. 따라서 이러한 차이는 예상된 항목 수와 실제 항목 수를 결정하는 방법 때문에 발생할 수 있습니다.

  • 검색 결과를 예측하고 내보낼 때 시간 사이에 발생하는 변경 내용입니다. 검색 결과를 내보내면 검색 조건을 충족하는 검색 인덱스에서 가장 최근 항목을 수집하기 위해 검색이 다시 시작됩니다. 예상 검색 결과가 수집된 시간과 검색 결과를 내보낸 시점 사이에 검색 조건을 충족하는 추가 항목이 생성, 전송 또는 수신되었을 수 있습니다. 검색 결과가 예상될 때 검색 인덱스 내보낸 항목이 검색 결과를 내보내기 전에 콘텐츠 위치에서 제거되었기 때문에 더 이상 없을 수도 있습니다. 이 문제를 완화하는 한 가지 방법은 eDiscovery 검색의 날짜 범위를 지정하는 것입니다. 또 다른 방법은 항목을 보존하고 제거할 수 없도록 콘텐츠 위치를 보류하는 것입니다.

    예상 검색 결과와 내보낸 검색 결과의 차이는 다음과 같습니다.

    • 날짜 쿼리를 사용할 때 항목이 증가합니다. 이는 일반적으로 다음 두 가지로 인해 발생합니다.
      • SharePoint에서 버전 관리를 유지합니다. 유지가 적용된 사이트에서 문서가 삭제되고 문서 버전 관리 기능이 설정되면 삭제된 문서의 모든 버전이 보존됩니다.
      • 일정 항목. 메시지 수락 및 거부 및 되풀이 모임은 이전 날짜가 있는 백그라운드에서 새 항목을 자동으로 만듭니다.
    • 보류를 사용하면 사용자의 기본 사서함과 보관 사서함에 동일한 항목이 유지되는 경우가 있을 수 있습니다. 이 작업은 사용자가 수동으로 항목을 보관 파일로 이동할 때 발생할 수 있습니다.
    • 보류가 적용되는 경우에도 사용자가 편집할 수 없지만 많은 검색 결과에 포함된 기본 제공 일정 항목의 유지 관리는 때때로 제거될 수 있습니다. 일정 항목을 정기적으로 제거하면 내보내는 항목이 줄어듭니다.
  • 인덱스되지 않은 항목입니다. 검색에 인덱스가 없는 항목은 예상 검색 결과와 실제 검색 결과 간에 차이를 일으킬 수 있습니다. 검색 결과를 내보낼 때 인덱스되지 않은 항목을 포함할 수 있습니다. 검색 결과를 내보낼 때 인덱싱되지 않은 항목을 포함하는 경우 내보내는 항목이 더 있을 수 있습니다. 이로 인해 예상 검색 결과와 내보낸 검색 결과가 차이가 발생합니다.

    콘텐츠 검색 도구를 사용하는 경우 검색 결과를 내보낼 때 인덱스되지 않은 항목을 포함할 수 있는 옵션이 있습니다. 검색에서 반환되는 인덱스되지 않은 항목의 수는 다른 예상 검색 결과와 함께 플라이아웃 페이지에 나열됩니다. 인덱스가 없는 항목은 예상 검색 결과의 총 크기에도 포함됩니다. 검색 결과를 내보낼 때 인덱스되지 않은 항목을 포함하거나 포함하지 않는 옵션이 있습니다. 이러한 옵션을 구성하는 방법은 예상 결과와 다운로드된 실제 검색 결과 간에 차이가 발생할 수 있습니다.

  • 모든 콘텐츠 위치를 포함하는 콘텐츠 검색의 결과를 내보냅니다. 결과를 내보내는 검색이 organization 모든 콘텐츠 위치를 검색한 경우 검색 조건과 일치하는 항목이 포함된 콘텐츠 위치의 인덱싱되지 않은 항목만 내보내집니다. In other words, if no search results are found in a mailbox or site, then any unindexed items in that mailbox or site won't be exported. 그러나 검색 쿼리와 일치하는 항목이 포함되지 않은 항목도 모든 콘텐츠 위치의 인덱스되지 않은 항목이 예상 검색 결과에 포함됩니다.

    또는 포함된 특정 콘텐츠 위치에서 결과를 내보내는 검색의 경우 검색에 지정된 모든 콘텐츠 위치에서 인덱싱되지 않은 항목(검색 조건에 의해 제외되지 않음)이 내보내집니다. 이 경우 인덱스가 없는 예상 항목 수와 내보내는 인덱스되지 않은 항목의 수는 동일해야 합니다.

    organization 모든 위치에서 인덱싱되지 않은 항목을 내보내지 않는 이유는 내보내기 오류 가능성이 증가하고 검색 결과를 내보내고 다운로드하는 데 걸리는 시간이 늘어나기 때문입니다.

  • SharePoint 및 OneDrive의 인덱스되지 않은 항목은 검색 예상치에 포함되지 않습니다. SharePoint 사이트 및 비즈니스용 OneDrive 계정의 인덱스되지 않은 항목은 예상 검색 결과에 포함되지 않습니다. 이는 SharePoint 인덱스에 인덱싱되지 않은 항목에 대한 데이터가 포함되어 있지 않기 때문입니다. 사서함의 인덱스되지 않은 항목만 검색 추정치에 포함됩니다. 그러나 검색 결과를 내보낼 때 인덱싱되지 않은 항목을 포함하는 경우 SharePoint 및 OneDrive의 인덱싱되지 않은 항목이 포함되므로 실제로 내보내는 항목 수가 증가합니다. 이로 인해 예상 결과(SharePoint 및 OneDrive 사이트에 인덱스되지 않은 항목이 포함되지 않음)와 다운로드된 실제 항목 간에 차이가 발생합니다. 검색 조건과 일치하는 항목이 포함된 콘텐츠 위치에서만 인덱싱되지 않은 항목을 내보내는 규칙은 여전히 이 상황에서 적용됩니다.

  • SharePoint 및 OneDrive의 문서 버전입니다. SharePoint 사이트 및 OneDrive 계정을 검색할 때 여러 버전의 문서가 예상 검색 결과 수에 포함되지 않습니다. 그러나 검색 결과를 내보낼 때 모든 문서 버전을 포함할 수 있는 옵션이 있습니다. 검색 결과를 내보낼 때 문서 버전을 포함하는 경우 내보낸 항목의 실제 수(및 총 크기)가 증가합니다.

  • SharePoint 폴더. SharePoint의 폴더가 검색 쿼리와 일치하는 경우(예: 날짜별 검색) 검색 예측에는 마지막으로 수정된 날짜 범위(해당 폴더의 항목은 아님)가 포함된 폴더 수가 포함됩니다. 검색 결과를 내보내면 폴더의 항목이 내보내지지만 실제 폴더는 내보내지지 않습니다. 그 결과 내보낸 항목 수가 예상 검색 결과 수보다 많아집니다. 폴더가 비어 있으면 실제 폴더가 내보내지지 않으므로 내보낸 실제 검색 결과의 수가 한 항목씩 줄어듭니다.

    참고

    쿼리 기반 검색을 실행할 때 쿼리에 다음 조건을 추가하여 SharePoint 폴더를 제외할 NOT(ContentType:folder)수 있습니다.

  • SharePoint 목록. SharePoint 목록의 이름이 검색 쿼리와 일치하는 경우 검색 추정치에는 목록의 모든 항목 수가 포함됩니다. 검색 결과를 내보내면 목록(및 목록 항목)이 단일 CSV 파일로 내보내집니다. 이렇게 하면 실제로 내보낸 실제 항목 수가 줄어듭니다. 목록에 첨부 파일이 포함되어 있으면 첨부 파일이 별도의 문서로 내보내지며 내보내는 항목 수도 증가합니다.

    참고

    쿼리 기반 검색을 실행할 때 쿼리에 다음 조건을 추가하여 SharePoint 목록을 제외할 NOT(ContentType:list)수 있습니다.

  • 원시 파일 형식과 내보낸 파일 형식 비교 Exchange 항목의 경우 검색 결과의 예상 크기는 원시 Exchange 메시지 크기를 사용하여 계산됩니다. 그러나 전자 메일 메시지는 PST 파일 또는 개별 메시지(EML 파일 형식)로 내보내집니다. 두 내보내기 옵션 모두 원시 Exchange 메시지와 다른 파일 형식을 사용하므로 내보낸 총 파일 크기가 예상 파일 크기와 다릅니다.

  • 내보내는 동안 Exchange 항목의 중복 제거. Exchange 항목의 경우 중복 제거는 내보낸 항목 수를 줄입니다. 검색 결과를 내보낼 때 중복을 해제하는 옵션이 있습니다. Exchange 메시지의 경우 여러 사서함에서 해당 메시지를 찾을 수 있더라도 메시지의 instance 하나만 내보냅니다. 예상 검색 결과에는 메시지의 모든 instance 포함됩니다. 따라서 검색 결과를 내보낼 때 중복 제거 옵션을 선택하면 내보내는 실제 항목 수가 예상된 항목 수보다 훨씬 적을 수 있습니다.

검색 결과 보고서(Results.csv 파일)에는 중복된 각 메시지에 대한 항목이 포함되어 있으며 중복 메시지가 있는 원본 사서함을 식별합니다. 이렇게 하면 중복 메시지가 포함된 모든 사서함을 식별할 수 있습니다.

참고

검색 결과를 내보내거나 보고서를 다운로드할 때 암호화되거나 인식할 수 없는 형식 옵션이 있는 항목 포함 옵션을 선택하지 않으면 인덱스 오류 보고서가 다운로드되지만 항목이 없습니다. 그렇다고 인덱싱 오류가 없는 것은 아닙니다. 인덱스되지 않은 항목이 내보내기에서 포함되지 않았음을 의미합니다.