분류자 정확도 높이기
SIT( 중요한 정보 유형 ) 및 학습 가능한 분류자와 같은 분류자는 다양한 유형의 정책에서 중요한 정보를 식별하는 데 사용됩니다. 대부분의 이러한 모델과 마찬가지로, 경우에 따라 항목을 중요하지 않은 중요한 것으로 식별합니다. 또는 항목이 실제로 중요한 것으로 식별되지 않을 수 있습니다. 이를 가양성 및 가음성이라고 합니다.
이 문서에서는 분류자에서 일치하는 항목이 참 긍정(일치) 또는 가양성(일치하지 않음)인지 확인하고 일치하지 않음피드백을 제공하는/ 방법을 보여 줍니다. 이 피드백을 사용하여 분류자를 조정하여 정확도를 높일 수 있습니다. Microsoft에서 제공하는 분류자의 정확도를 높이려면 수정된 버전의 문서와 일치, 일치하지 않음 피드백을 Microsoft에 보낼 수도 있습니다.
일치, 일치하지 않음 및 컨텍스트 요약 환경은 다음에서 사용할 수 있습니다.
- 콘텐츠 Explorer - SharePoint 사이트, OneDrive 사이트
- 중요한 정보 유형 일치 항목 페이지 - SharePoint 사이트, OneDrive 사이트
- 학습 가능한 분류자 일치 항목 페이지 - SharePoint 사이트, OneDrive 사이트
- DLP(Microsoft Purview 데이터 손실 방지) 경고 페이지 - SharePoint 사이트, OneDrive 및 Exchange의 전자 메일
- MTP(Microsoft Threat Protection) 경고 페이지 - SharePoint 사이트, OneDrive 사이트 및 Exchange의 전자 메일
컨텍스트 요약 환경은 다음에서 사용할 수 있습니다.
- MIP(Microsoft Purview Information Protection) 시뮬레이션 일치 항목 자동 레이블 지정 - SharePoint 사이트, OneDrive 사이트
팁
E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 규정 준수 포털 평가판 허브에서 지금 시작하세요. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.
적용 대상
분류자 | 컨텍스트 요약 | 수정된 미리 보기 패널 | 일치 및 일치하지 않음 |
---|---|---|---|
앉다 | 예 | 예 | 예 |
사용자 지정 SIT | 예 | 아니요 | 예 |
지문 SIT | 아니요 | 아니요 | 예 |
정확한 데이터 일치 SIT | 아니요* | 아니요 | 아니요 |
명명된 엔터티 | 아니요* | 아니요 | 아니요 |
자격 증명 검사 | 아니요 | 아니요 | 아니요 |
기본 제공 학습 가능 분류자 | 예** | 예 | 예 |
사용자 지정 학습 가능 분류자 | 아니요 | 아니요 | 예 |
* 이러한 분류자는 SharePoint 사이트 및 OneDrive 사이트에 대해 MIP 자동 레이블 지정 시뮬레이션 일치 항목에서 지원됩니다.
** 기본 제공 학습 가능한 분류자 목록 및 컨텍스트 요약을 지원하는 항목입니다.
중요
일치/일치 피드백 및 컨텍스트 요약 환경은 콘텐츠 Explorer, 중요한 정보 유형 및 학습 가능한 분류자 일치 항목, DLP 경고 및 MTP 경고에 대한 SharePoint 사이트 & OneDrive 사이트의 항목을 지원합니다. Exchange의 전자 메일 - DLP 경고 및 MTP 경고용입니다. 컨텍스트 요약 환경은 SharePoint 사이트 및 OneDrive 사이트 - MIP 시뮬레이션 일치 항목의 항목을 지원합니다.
라이선스 및 구독
관련 라이선스 및 구독에 대한 자세한 내용은 데이터 분류 분석에 대한 라이선스 요구 사항: 개요 콘텐츠 & 활동 Explorer 참조하세요.
알려진 제한
- 상황에 맞는 요약은 지정된 항목에서 제한된 수의 일치 항목만 표시하며 모든 일치 항목은 표시되지 않습니다.
- 컨텍스트 요약 및 피드백 환경은 테넌트에서 피드백 환경을 사용하도록 설정한 후에만 만들거나 업데이트된 항목에만 사용할 수 있습니다. 기능을 사용하도록 설정하기 전에 분류된 항목은 상황에 맞는 요약 및 피드백 환경을 사용할 수 없을 수 있습니다.
일치 정확도를 평가하고 피드백을 제공하는 방법
일치하는 항목이 참 긍정(일치) 또는 가양성(일치하지 않음)인지 여부를 나타내는 상황별 요약 환경은 표시되는 모든 위치에서 유사합니다.
중요
ONEDrive 사이트, SharePoint 사이트 또는 Exchange 사서함에 SIT 또는 학습 가능한 분류자를 사용하는 DLP 정책이 이미 배포되어 있어야 합니다. 컨텍스트 요약 페이지에 항목이 표시되기 전에 항목이 일치해야 합니다.
콘텐츠 Explorer 사용
이 예제에서는 상황에 맞는 요약 탭을 사용하여 피드백을 제공하는 방법을 보여 줍니다.
- Microsoft Purview 규정 준수 포털>데이타 분류>콘텐츠 탐색기 페이지를 엽니다.
- 레이블, 정보 유형 또는 범주에 대한 필터에서 일치 항목에 검사 SIT 또는 학습 가능한 분류자의 이름을 입력합니다.
- SIT를 선택합니다.
- 위치를 선택하고 파일 열에 0이 아닌 값이 있는지 확인합니다. (지원되는 위치는 SharePoint 및 OneDrive뿐입니다.)
- 폴더를 열고 문서를 선택합니다.
- 문서의 중요한 정보 유형 열에서 링크를 선택하여 일치하는 항목과 신뢰도 수준을 확인합니다.
- 닫기 선택
- 문서를 열고 컨텍스트 요약 탭을 선택합니다.
- 항목을 검토하고 일치하는지 확인합니다.
- 일치하는 경우 닫기를 선택합니다. 완료되었습니다.
- 일치하지 않는 경우 일치하지 않음을 선택합니다.
- 실수를 하고 잘못된 옵션을 선택한 경우 닫기 옆에 있는 피드백 철회를 선택합니다. 이렇게 하면 항목이 일치하는 항목/이 아님상태로 다시 전환됩니다.
- 항목을 검토하고 텍스트를 수정하거나 수정하지 않습니다.
- 닫기를 선택합니다.
중요한 정보 유형 일치 항목 사용 페이지
중요한 정보 유형 페이지에서 동일한 피드백 메커니즘에 액세스할 수 있습니다.
- Microsoft Purview 규정 준수 포털 열고 데이터 분류>자> 중요한정보 유형으로 이동합니다.
- 검색 필드에 정확도를 검사 SIT의 이름을 입력합니다.
- SIT를 엽니다. 그러면 개요 탭이 표시됩니다. 여기에서 일치하는 항목 수, 일치하지 않는 항목 수 및 피드백이 있는 항목 수를 확인할 수 있습니다.
- 일치하는 항목 탭을 선택합니다.
- 폴더를 열고 문서를 선택합니다. 여기서는 SharePoint, OneDrive만 지원됩니다. 파일 열에 0이 아닌 값이 있는지 확인합니다.
- 항목의 중요한 정보 유형 열에서 링크를 선택하여 일치하는 항목과 신뢰도 수준을 확인합니다.
- 닫기를 선택합니다.
- 문서를 연 다음 상황에 맞는 요약 탭을 선택합니다.
- 항목을 검토하고 일치하는지 확인합니다.
- 일치하는 경우 일치 를 선택한 다음 닫기를 선택합니다.
- 일치하지 않는 경우 **일치하지 않음 **** 를 선택합니다.
- 실수를 하고 잘못된 옵션을 선택하는 경우 닫기 옆에 있는 피드백 철회를 선택합니다. 이렇게 하면 항목이 일치하는 항목/이 아님상태로 다시 전환됩니다.
- 닫기를 선택합니다.
학습 가능한 분류자 일치 항목 사용 페이지
- Microsoft Purview 규정 준수 포털 열고 데이터 분류>자>학습 가능한 분류자로 이동합니다.
- 정확도를 검사 학습 가능한 분류자를 선택합니다.
- 학습 가능한 분류자를 엽니다. 그러면 개요 탭이 표시됩니다. 여기에서 일치하는 항목 수, 일치하지 않는 항목 수 및 피드백이 있는 항목 수를 확인할 수 있습니다.
- 일치하는 항목 탭을 선택합니다.
- 폴더를 열고 문서를 엽니다. 여기서는 SharePoint, OneDrive만 지원됩니다. 파일 열에 0이 아닌 값이 있는지 확인합니다.
- 문서를 연 다음 상황에 맞는 요약 탭을 선택합니다.
- 항목을 검토하고 일치하는지 확인합니다.
- 일치하는 경우 일치 를 선택한 다음, 닫기를 선택합니다.
- 일치하지 않는 경우 **일치하지 않음 **** 를 선택합니다.
- 실수를 하고 잘못된 옵션을 선택하는 경우 닫기 옆에 있는 피드백 철회를 선택합니다. 이렇게 하면 항목이 일치하는 항목/이 아님상태로 다시 전환됩니다.
- 닫기를 선택합니다.
데이터 손실 방지 경고 사용 페이지
- Microsoft Purview 규정 준수 포털 열고 데이터 손실 방지>경고 페이지로 이동합니다.
- 경고를 선택합니다.
- 세부 정보 보기를 선택합니다.
- 이벤트 탭을 선택합니다.
- 세부 정보 탭을 최대화합니다.
- 항목을 검토하고 일치하는지 확인합니다.
- 작업을 선택합니다.
- 일치하는 경우 창을 닫습니다. 완료되었습니다.
- 일치하지 않는 경우 작업을 선택한 다음 일치하지 않음을 선택합니다.
- 항목을 검토하고 텍스트를 수정하거나 수정하지 않습니다.
- 창을 닫습니다.
피드백을 사용하여 분류자 조정
SIT 또는 학습 가능한 분류자에서 피드백에 따라 너무 많은 가양성을 반환하는 경우 이러한 옵션 중 일부를 시도하여 구체화하고 정확도를 높입니다.
교육 가능한 분류자
사용자 지정 분류자 재학습은 더 이상 지원되지 않습니다. 만든 학습 가능한 분류자의 정확도를 개선해야 하는 경우 분류자를 제거하고 더 큰 샘플 집합으로 새로 시작합니다. 자세한 내용은 학습 가능한 분류자 시작을 참조하세요.
중요한 정보 유형
심각도를 확인하기 위해 찾은 중요한 정보 유형의 임계값을 늘입니다. 개별 분류자의 경우 다른 임계값을 사용해도 됩니다.
신뢰 수준 및 정의 방법을 이해합니다. 신뢰도가 낮고 instance 개수가 높거나 instance 개수가 낮은 신뢰도 수준을 사용해 보세요.
키워드의 존재, 더 엄격한 값 일치 또는 더 강력한 서식 지정 요구 사항과 같은 다른 조건을 포함하도록 기본 제공 SIT를 복제하고 수정합니다.
알려진 접두사, 접미사 또는 패턴을 제외하도록 사용자 지정 SIT를 수정합니다. 예를 들어 전자 메일 서명 또는 문서 머리글에 전화 번호가 포함된 경우 전화 번호를 검색하는 사용자 지정 SIT가 모든 전자 메일에 대해 트리거될 수 있습니다. 사용자 지정 SIT에서 organization 전화 번호 시퀀스를 제외하면 규칙이 모든 전자 메일 또는 문서에 대해 트리거되지 않을 수 있습니다.
관련 문서에 대해 이야기하는 항목으로 일치 항목을 좁힐 수 있는 조건으로 더 많은 사전 기반 SID를 포함합니다. 예를 들어 진단, 진단, 상태, 증상 및 환자와 같은 단어가 있어야 환자 진단 일치시키는 규칙이 향상될 수 있습니다.
모든 전체 이름과 같은 명명된 엔터티 SID의 경우 10 또는 50과 같이 더 높은 instance 개수 임계값을 설정하는 것이 가장 좋습니다. 사용자 이름과 SSN(사회 보장 번호)이 모두 함께 검색되면 SSN이 진정한 SSN일 가능성이 높으며 SSN이 너무 적기 때문에 정책이 트리거되지 않는 위험을 줄일 수 있습니다.