예측 코딩 모델 만들기(미리 보기)

주의

Microsoft는 2025년 8월 31일에 모든 클래식 eDiscovery 환경을 사용 중지했습니다. 이 사용 중지에는 클래식 콘텐츠 검색, 클래식 eDiscovery(Standard) 및 클래식 eDiscovery(프리미엄)가 포함됩니다.

이 문서의 지침은 21Vianet(중국)이 운영하는 Microsoft 365에서 호스트되는 조직에만 적용됩니다. organization 21Vianet에서 호스트되지 않는 경우 Microsoft Purview 포털의 새 eDiscovery 환경에 대한 지침을 사용합니다.

eDiscovery(프리미엄)에서 예측 코딩의 기계 학습 기능을 사용하는 첫 번째 단계는 예측 코딩 모델을 만드는 것입니다. 모델을 만든 후에는 검토 집합에서 관련 콘텐츠와 관련이 없는 콘텐츠를 식별하도록 학습할 수 있습니다.

예측 코딩 워크플로를 검토하려면 eDiscovery의 예측 코딩에 대한 자세한 정보(프리미엄)를 참조하세요.

모델을 만들기 전에

예측 코딩 모델을 만들려면 검토 집합에 최소 2,000개 항목이 있어야 합니다.
모델을 만들기 전에 모든 컬렉션을 검토 집합에 커밋해야 합니다. 모델을 만든 후 검토 집합에 추가된 항목은 처리되지 않으며 모델에서 생성된 예측 점수가 할당되지 않습니다.
텍스트가 포함되지 않은 검토 집합의 모든 항목은 모델에서 처리되거나 예측 점수가 할당되지 않습니다. 텍스트가 있는 항목은 컨트롤 집합 또는 학습 집합에 포함됩니다.

모델 만들기

Microsoft Purview 포털에서 eDiscovery(프리미엄) 사례를 연 다음 , 검토 집합 탭을 선택합니다.
검토 집합을 연 다음 분석>예측 코딩 관리(미리 보기)를 선택합니다.
예측 코딩 모델(미리 보기) 페이지에서 새 모델을 선택합니다.
플라이아웃 페이지에서 모델의 이름과 설명(선택 사항)을 입력합니다.
필요에 따라 신뢰 수준 및 오차 범위와 관련된 고급 설정(플라이아웃 페이지에서 고급 옵션을 선택하여)을 구성할 수 있습니다. 이러한 설정은 컨트롤 집합에 포함된 항목 수에 영향을 미칩니다. 컨트롤 집합은 학습 프로세스 중에 모델에서 학습 라운드 중에 수행하는 레이블이 지정된 항목에 할당하는 예측 점수를 평가하는 데 사용됩니다. organization 문서 검토에 대한 신뢰도 수준 및 오차 범위와 관련하여 지침이 있는 경우 해당 상자에 지정합니다. 그렇지 않으면 기본 설정을 사용합니다.
저장을 선택하여 모델을 만듭니다.

시스템에서 모델을 준비하는 데 몇 분 정도 걸립니다. 준비가 되면 첫 번째 훈련을 수행할 수 있습니다.

모델을 만든 후 발생하는 작업

모델을 만든 후 모델을 만들고 준비하는 동안 백그라운드에서 다음과 같은 작업이 수행됩니다.

시스템은 컨트롤 집합의 항목 수를 계산합니다. 이 크기는 검토 집합의 항목 수와 신뢰도 수준 및 오차 범위 설정을 기반으로 합니다. 컨트롤 집합에 대한 항목은 임의로 선택되고 컨트롤 집합 항목으로 지정됩니다. 시스템에는 첫 번째 학습 라운드에서 설정된 컨트롤의 10개 항목이 포함됩니다.
시스템은 첫 번째 학습 라운드에 대한 학습 집합에 포함할 검토 집합에서 40개의 항목을 임의로 선택합니다. 따라서 첫 번째 학습 라운드에는 레이블 지정을 위한 50개 항목(학습 집합의 항목 40개 및 컨트롤 집합의 항목 10개)이 포함됩니다.

다음 단계

검토 집합에 대한 모델을 만든 후 다음 단계는 조사와 관련된 콘텐츠를 식별하기 위해 모델을 "학습"하기 위한 학습 라운드를 수행하는 것입니다. 자세한 내용은 예측 코딩 모델 학습을 참조하세요.

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-01-30