정확한 데이터 일치 기반 중요한 정보 유형에 대해 알아보기

중요한 정보 유형(SIT)은 실수로 또는 부적절하게 공유되지 않도록 중요한 데이터를 식별하는 데 사용됩니다. 또한 eDiscovery에서 관련 데이터를 찾고 특정 유형의 정보에 거버넌스 작업을 적용하는 데에도 사용됩니다. 다음을 기반으로 사용자 지정 SIT를 정의합니다.

  • 패턴
  • 직원, 사회 보장 번호 또는 ID와 같은 키워드(keyword) 증거
  • 특정 패턴의 증거에 대한 문자 근접성
  • 신뢰 수준

그러나 제네릭 패턴에 따라 일치 항목을 찾는 대신 정확하거나 거의 정확한 데이터 값을 사용하는 사용자 지정 SIT를 원한다면 어떻게 해야 할까요? EDM(정확한 데이터 일치) 기반 분류를 사용하여 다음을 위해 설계된 사용자 지정 중요한 정보 유형을 만들 수 있습니다.

  • 역동적이며 쉽게 새로 고침
  • 가양성 감소
  • 구조화된 중요한 데이터 사용
  • Microsoft를 비롯한 누구와도 공유하지 않고 중요한 정보를 보다 안전하게 처리
  • 여러 Microsoft 클라우드 서비스와 함께 사용 가능

E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 규정 준수 포털 평가판 허브에서 지금 시작하세요. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.

EDM 기반 분류를 사용하면 중요한 정보의 데이터베이스에서 정확한 값을 참조하는 사용자 지정 SID를 만들 수 있습니다. 데이터베이스는 매일 새로 고칠 수 있으며 최대 1억 행의 데이터를 포함할 수 있습니다. 따라서 직원, 환자 및 클라이언트가 오고 가고 레코드가 변경됨에 따라 사용자 지정 중요한 정보 유형은 최신 상태이며 적용 가능한 상태로 유지됩니다. 또한 Microsoft Purview 데이터 손실 방지 정책 또는 Microsoft Cloud App Security 파일 정책과 같은 정책과 함께 EDM 기반 분류를 사용할 수 있습니다.

다음 다이어그램은 EDM 분류의 기본 작업을 보여 줍니다.

EDM 기반 분류.

참고

Microsoft Purview Information Protection 더블 바이트 문자 집합을 사용하는 다음 언어를 지원합니다.

  • 중국어(간체)
  • 중국어(번체)
  • 한국어
  • 일본어

이 지원은 중요한 정보 유형에 대해 사용할 수 있습니다. 자세한 내용은 더블 바이트 문자 집합에 대한 정보 보호 지원: 릴리스 정보(미리 보기)를 참조하세요.

EDM SIT의 다른 기능

EDM SID를 사용하는 경우 고유한 몇 가지 개념을 이해하는 것이 좋습니다.

스키마

스키마는 XML 파일입니다. Microsoft Purview는 스키마를 사용하여 중요한 정보 유형이 검색하도록 설계된 문자열과 일치하는 문자열이 데이터에 포함되어 있는지 여부를 확인합니다.

스키마 XML 파일은 다음을 정의합니다.

  • 나중에 DataStore라고 하는 스키마의 이름입니다.
  • 중요한 정보 원본 테이블에 포함된 필드 이름입니다. 중요한 정보 원본 테이블의 열 이름에 스키마 필드 이름을 1:1 매핑합니다.
  • 다중 토큰 일치 모드가 필요한 확증 증거 필드입니다.
  • 검색할 수 있는 데이터 필드입니다.
  • 구성 가능한 일치 항목이 각 필드에 대해 지원되는지 여부입니다. 구성 가능한 일치 항목은 검색된 값의 구분 기호 및 대/소문자를 무시하는 것과 같이 검색을 수정하는 매개 변수가 있는 일치 항목입니다.

중요한 정보 원본 테이블

중요한 정보 원본 테이블에는 EDM SIT가 찾는 값이 포함됩니다. 테이블은 열과 행으로 구성됩니다. 열 머리글은 필드 이름이고 행은 항목의 인스턴스이며 행의 각 셀에는 해당 필드에 대한 instance 해당 항목에 대한 값이 포함됩니다.

다음은 중요한 정보 원본 테이블의 간단한 예입니다.

이름 Date of Birth
Isaiah 랑거 (랑거) 05-05-1960
아나 보 우먼 11-24-1971
오스카 02-12-1998

규칙 패키지

모든 중요한 정보 유형에는 규칙 패키지가 있습니다. EDM SIT의 규칙 패키지를 사용하여 EDM SIT의 다양한 구성 요소를 정의합니다. 다음 표에서는 각 구성 요소에 대한 설명을 제공합니다.

구성 요소 설명
일치 정확한 조회에 사용할 기본 요소(데이터 필드)를 지정합니다. 체크섬 유효성 검사, 키워드(keyword) 목록, 키워드(keyword) 사전 또는 함수가 있거나 없는 정규식일 수 있습니다.
분류 EDM 조회를 트리거하는 중요한 정보 유형 일치를 지정합니다.
지원 요소 발견되면 일치 항목의 신뢰도를 높이는 데 도움이 되는 증거를 제공하는 요소입니다. 예를 들어 실제 사회 보장 번호와 근접한 성의 발생입니다. 지원 요소는 체크섬 유효성 검사, 키워드(keyword) 목록, 키워드(keyword) 사전 또는 단일 또는 다중 토큰 문자열 일치가 있거나 없는 정규식일 수 있습니다.
신뢰 수준
(높음, 중간, 낮음)
기본 요소 외에도 얼마나 많은 지원 증거가 검색되는지를 나타냅니다. 항목에 포함된 증거가 많을수록 일치하는 항목에 찾고 있는 중요한 정보가 포함되어 있다는 신뢰도가 높아질 수 있습니다. 신뢰도 수준에 대한 자세한 내용은 중요한 정보 유형의 기본 부분을 참조하세요.
근접 기본 요소와 지원 요소 사이의 문자 수입니다.

고유한 스키마 및 데이터 제공

Microsoft Purview에는 미리 정의된 많은 기본 제공 SID가 함께 제공됩니다 . 이러한 SID에는 스키마, REGEX 패턴, 키워드 및 신뢰도 수준이 함께 제공됩니다. 그러나 EDM SID를 사용하면 중요한 항목을 식별하는 기본 및 보조 필드뿐만 아니라 스키마를 정의할 책임이 있습니다. 스키마와 기본 및 보조 데이터 값은 모두 매우 민감하기 때문에 임의로 생성되거나 자체 제공된 솔트 값을 포함하는 해시 함수를 통해 암호화합니다. 해시된 값만 서비스에 업로드되므로 중요한 데이터가 열려 있는 상태가 되지 않습니다.

기본 및 보조 지원 요소

EDM SIT를 만들 때 규칙 패키지에서 기본 요소 필드를 정의합니다. 그런 다음 EDM은 모든 콘텐츠에서 기본 요소를 검색합니다. EDM에서 검색할 수 있도록 기본 요소는 기존 SIT를 통해 검색할 수 있어야 합니다.

참고

사용 가능한 SID의 전체 목록은 중요한 정보 유형 엔터티 정의를 참조하세요.

EDM SIT에서 검색하려는 중요한 정보를 검색하는 기본 제공 SIT를 찾아야 합니다. 예를 들어 EDM SIT 스키마에 기본 요소로 미국 사회 보장 번호 가 있는 경우 EDM 스키마를 만들 때 미국 SSN(사회 보장 번호) SIT와 연결했습니다. 기본 요소는 감지하려면 정의된 패턴을 따라야 합니다.

주 요소가 검사된 항목에서 발견되면 EDM은 보조 요소(지원 요소라고도 함) 찾습니다. 주 요소와 달리 보조 요소에는 패턴을 따르는 옵션이 있습니다. 보조 요소에 여러 토큰이 포함된 경우 해당 요소를 해당 콘텐츠를 검색할 수 있는 SIT와 연결하거나 다중 토큰 일치를 위해 구성할 수 있어야 합니다. 일치 항목이 검색되려면 모든 경우에 보조 요소가 주 요소와 특정 근접한 위치에 있어야 합니다.

일치의 작동 방식

EDM은 문서 및 전자 메일의 문자열을 중요한 정보 원본 테이블의 값과 비교하여 작동합니다. 이 비교를 사용하여 스캔한 콘텐츠의 값이 테이블에 있는지 여부를 확인합니다. 단방향 암호화 해시를 비교하여 결정합니다.

DLP 규칙에서 EDM SID와 기반이 되는 미리 정의된 SID를 함께 사용하여 중요한 데이터 검색을 개선할 수 있습니다. 신뢰 수준이 높은 EDM SIT를 사용하고 신뢰 수준이 낮은 미리 정의된 SIT를 사용합니다. 예를 들어 신뢰도가 높은 엄격한 요구 사항이 있는 사회 보장 번호 및 기타 지원 데이터를 찾는 EDM SIT를 사용합니다. 신뢰도가 높은 일치 항목에 대해 구성된 경우 EDM은 몇 개의 인스턴스만 검색되면 DLP 일치를 생성합니다. 더 많은 수의 발생이 검색될 때 DLP 일치를 트리거하려면 미국 사회 보장 번호와 같은 기본 제공 SIT를 사용합니다.

지원 요소가 EDM에서 작동하는 방식

EDM SIT의 다른 기능에서 설명한 것처럼 지원 요소는 발견되면 일치의 신뢰를 높이는 데 도움이 되는 증거를 제공하는 요소입니다.

EDM SID를 지원하면 여러 필드로 구성된 지원 요소를 찾고 검색할 수 있습니다. 지원 요소 일치는 키워드(keyword) 목록, 키워드(keyword) 사전, 단일 영숫자 문자열 또는 다중 토큰 문자열로 구성됩니다.

예제를 살펴보겠습니다. 미국 사회 보장 번호를 검색하려는 것으로 가정합니다. 일치 신뢰도를 높이기 위해 지원 요소에는 , last namedate of birth (DoB)가 포함됩니다first name. 따라서 원본 테이블은 다음과 같습니다.

Ssn FirstName LastName 생년월일
987-65-4320 Isaiah 랑거 (랑거) 05-05-1960
078-05-1120 아나 보 우먼 11-24-1971
219-09-9999 오스카 02-12-1998

보호된 파일에서 일치하는 지원 요소를 찾을 때 EDM SIT는 기본 요소가 검색되면 각 지원 요소(개별적으로 및 조합)를 확인합니다.

instance 경우 첫 번째 사회 보장 번호가 감지되었다고 말합니다. 정확한 데이터 일치 기능은 다음으로 원본 테이블의 모든 열에서 지원 요소의 조합을 찾습니다.

  • Isaiah
  • 랑거 (랑거)
  • 05-05-1960
  • Isaiah Langer
  • 이사야 05-05-1960
  • 랑거 05-05-1960
  • 이사야 랑거 05-05-1960

다중 토큰 일치

다중 토큰 일치는 확증 증거 필드에 다중 토큰 값이 포함되어 있지만 이러한 값을 SIT와 일치시키는 것은 쉽지 않은 경우에 사용하도록 설계되었습니다. instance 경우 또는 123 Main Street, New York, NY와 같은 1 Microsoft Way, Redmond, WA 값을 포함하는 필드가 있는 경우 Address

이 기능을 사용하면 EDM이 콘텐츠에서 연속된 단어의 해시를 데이터 원본의 다중 토큰 필드 해시와 비교할 수 있습니다. 동일한 경우 EDM은 일치 항목을 생성합니다. 이러한 방식으로 EDM은 EDM 스키마에서 다중 토큰으로 표시된 한 이름, 주소, 의료 조건 또는 둘 이상의 단어를 포함할 수 있는 기타 확증 증거 필드와 같은 다중 토큰 필드를 검색할 수 있습니다.

예를 들어 다중 토큰 일치를 일치 옵션으로 선택하는 경우 두 가지 추가 이점을 얻을 수 있습니다.

  1. 정책은 원본 테이블의 열에서 여러 필드와 일치하는 콘텐츠를 검색합니다.
  2. 원본 테이블에는 미리 구성된 단어 수로 구성된 문자열 값이 있는 필드가 포함될 수 있습니다. 다음 표에는 샘플 원본 테이블이 표시됩니다.
Ssn 이름 주소
987-65-4320 Isaiah Langer 1432 링컨 로드
078-05-1120 아나 보우먼 8250 퍼스트 스트리트
219-09-9999 Oscar Ward 424 205th Avenue

다중 토큰 일치를 사용하면 NameStreet Address 필드는 독립적인 지원 요소 문자열로, 개별 필드와 함께 일치합니다. 따라서 사회 보장 번호 987-65-4320에 대한 지원 요소로 다중 토큰 문자열로 일치하면 일치 항목은 다음과 같습니다.

  • Isaiah Langer
  • 1432 링컨 로드

조합으로 일치하면 일치 항목은 다음과 같습니다.

  • 이사야 랑거 + 1432 링컨 로드

다중 토큰 일치는 일반적으로 공백을 사용하여 단어를 구분하지 않는 더블 바이트 문자 집합에도 지원됩니다.

EDM에서 지원하는 서비스

서비스 위치
Microsoft Purview 데이터 손실 방지 - SharePoint
- OneDrive
- Teams 채팅
- Exchange Online
- 디바이스
Microsoft Defender for Cloud Apps - SharePoint
- OneDrive
자동 레이블 지정(서비스 쪽) - SharePoint
- OneDrive
- Exchange Online
자동 레이블 지정(클라이언트 쪽) - Word
- Excel
- PowerPoint
- Exchange 데스크톱 클라이언트
고객 관리형 키 - SharePoint
- OneDrive
- Teams 채팅
- Exchange Online
- Word
- Excel
- PowerPoint
- Exchange 데스크톱 클라이언트
- 디바이스
eDiscovery - SharePoint
- OneDrive
- Teams 채팅
- Exchange Online
- Word
- Excel
- PowerPoint
- Exchange 데스크톱 클라이언트
내부자 위험 관리 - SharePoint
- OneDrive
- Teams 채팅
- Exchange Online
- Word
- Excel
- PowerPoint
- Exchange 데스크톱 클라이언트

참고 항목