주의
Microsoft는 2025년 8월 31일에 모든 클래식 eDiscovery 환경을 사용 중지했습니다. 이 사용 중지에는 클래식 콘텐츠 검색, 클래식 eDiscovery(Standard) 및 클래식 eDiscovery(프리미엄)가 포함됩니다.
이 문서의 지침은 21Vianet(중국)이 운영하는 Microsoft 365에서 호스트되는 조직에만 적용됩니다. organization 21Vianet에서 호스트되지 않는 경우 Microsoft Purview 포털의 새 eDiscovery 환경에 대한 지침을 사용합니다.
eDiscovery(프리미엄)에서 예측 코딩의 기계 학습 기능을 사용하는 첫 번째 단계는 예측 코딩 모델을 만드는 것입니다. 모델을 만든 후에는 검토 집합에서 관련 콘텐츠와 관련이 없는 콘텐츠를 식별하도록 학습할 수 있습니다.
예측 코딩 워크플로를 검토하려면 eDiscovery의 예측 코딩에 대한 자세한 정보(프리미엄)를 참조하세요.
모델을 만들기 전에
- 예측 코딩 모델을 만들려면 검토 집합에 최소 2,000개 항목이 있어야 합니다.
- 모델을 만들기 전에 모든 컬렉션을 검토 집합에 커밋해야 합니다. 모델을 만든 후 검토 집합에 추가된 항목은 처리되지 않으며 모델에서 생성된 예측 점수가 할당되지 않습니다.
- 텍스트가 포함되지 않은 검토 집합의 모든 항목은 모델에서 처리되거나 예측 점수가 할당되지 않습니다. 텍스트가 있는 항목은 컨트롤 집합 또는 학습 집합에 포함됩니다.
모델 만들기
Microsoft Purview 포털에서 eDiscovery(프리미엄) 사례를 연 다음 , 검토 집합 탭을 선택합니다.
검토 집합을 연 다음 분석>예측 코딩 관리(미리 보기)를 선택합니다.
예측 코딩 모델(미리 보기) 페이지에서 새 모델을 선택합니다.
플라이아웃 페이지에서 모델의 이름과 설명(선택 사항)을 입력합니다.
필요에 따라 신뢰 수준 및 오차 범위와 관련된 고급 설정(플라이아웃 페이지에서 고급 옵션을 선택하여)을 구성할 수 있습니다. 이러한 설정은 컨트롤 집합에 포함된 항목 수에 영향을 미칩니다. 컨트롤 집합은 학습 프로세스 중에 모델에서 학습 라운드 중에 수행하는 레이블이 지정된 항목에 할당하는 예측 점수를 평가하는 데 사용됩니다. organization 문서 검토에 대한 신뢰도 수준 및 오차 범위와 관련하여 지침이 있는 경우 해당 상자에 지정합니다. 그렇지 않으면 기본 설정을 사용합니다.
저장을 선택하여 모델을 만듭니다.
시스템에서 모델을 준비하는 데 몇 분 정도 걸립니다. 준비가 되면 첫 번째 훈련을 수행할 수 있습니다.
모델을 만든 후 발생하는 작업
모델을 만든 후 모델을 만들고 준비하는 동안 백그라운드에서 다음과 같은 작업이 수행됩니다.
- 시스템은 컨트롤 집합의 항목 수를 계산합니다. 이 크기는 검토 집합의 항목 수와 신뢰도 수준 및 오차 범위 설정을 기반으로 합니다. 컨트롤 집합에 대한 항목은 임의로 선택되고 컨트롤 집합 항목으로 지정됩니다. 시스템에는 첫 번째 학습 라운드에서 설정된 컨트롤의 10개 항목이 포함됩니다.
- 시스템은 첫 번째 학습 라운드에 대한 학습 집합에 포함할 검토 집합에서 40개의 항목을 임의로 선택합니다. 따라서 첫 번째 학습 라운드에는 레이블 지정을 위한 50개 항목(학습 집합의 항목 40개 및 컨트롤 집합의 항목 10개)이 포함됩니다.
다음 단계
검토 집합에 대한 모델을 만든 후 다음 단계는 조사와 관련된 콘텐츠를 식별하기 위해 모델을 "학습"하기 위한 학습 라운드를 수행하는 것입니다. 자세한 내용은 예측 코딩 모델 학습을 참조하세요.