다음을 통해 공유


중요한 정보 유형 REGEX 유효성 검사기 및 추가 검사

중요

Microsoft 고객 서비스 및 지원은 사용자 지정 분류 또는 정규식 패턴 만들기를 지원할 수 없습니다. 지원 엔지니어는 기능을 테스트하기 위한 샘플 정규식 패턴을 제공하거나 예상대로 트리거되지 않는 기존 정규식 패턴 문제 해결을 지원하는 등 기능에 대한 제한된 지원을 제공할 수 있습니다. 그러나 지원 엔지니어는 사용자 지정 콘텐츠 일치 개발이 요구 사항 또는 의무를 충족한다고 보장할 수 없습니다.

E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 평가판 허브에서 지금 시작합니다. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.

중요한 정보 형식 정규식 유효성 검사기

체크섬 유효성 검사기

정규식의 숫자에서 체크섬을 실행하려면 체크섬 유효성 검사기를 사용할 수 있습니다. 예를 들어 마지막 숫자가 mod 9 계산을 사용하여 유효성이 검사된 체크섬 숫자인 8자리 라이선스 번호에 대한 SIT를 만들어야 하는 경우 다음과 같이 체크섬 알고리즘을 설정합니다.

Sum = digit 1 * Weight 1 + digit 2 * weight 2 + digit 3 * weight 3 + digit 4 * weight 4 + digit 5 * weight 5 + digit 6 * weight 6 + digit 7 * weight 7 + digit 8 * weight 8
Mod value = Sum % 9
If Mod value == digit 8
    Account number is valid
If Mod value != digit 8
    Account number is invalid
  1. 다음 정규식을 사용하여 기본 요소를 정의합니다.

    \d{8}
    
  2. 체크섬 유효성 검사기를 추가합니다.

  3. 쉼표로 구분된 가중치 값, 검사 숫자의 위치 및 모드 값을 추가합니다. Modulo 작업에 대한 자세한 내용은 Modulo 작업을 참조하세요.

    참고

    검사 숫자가 체크섬 계산의 일부가 아닌 경우 0을 검사 숫자의 가중치로 사용합니다. 예를 들어 이전의 경우 검사 숫자가 검사 숫자를 계산하는 데 사용되지 않는 경우 가중치 8은 0과 같습니다.

    구성된 체크섬 유효성 검사기의 스크린샷

매개 변수

  • 무게: 정규식의 위치 1에서 마지막 위치까지 시작하는 각 숫자를 곱해야 하는 일련의 숫자를 정의합니다. 그러면 합계 제품이 계산됩니다. 가중치 위치는 숫자의 순서만 참조하며 대시와 같은 비디지트 문자는 고려하지 않습니다.
  • 모드: 이전 작업의 결과에 대해 Modulo 작업을 수행합니다.
  • ModCoefficient: 모듈로 결과에 대한 추가 또는 빼기를 수행합니다.
  • CheckDigit: 계산된 숫자를 비교할 검사 숫자의 위치를 정의합니다.

고급 체크섬 유효성 검사기

PositionBasedUpdate, UseAscii, MultiDigitResult, CheckDigitValue와 같은 매개 변수를 사용하여 스크립팅 없이 고급 체크섬을 사용할 수 있습니다.

  • 계산 전 숫자 바꾸기: 체크섬 계산 전에 위치 또는 값에 따라 숫자를 바꾸는 규칙을 정의합니다.

  • 문자-ASCII 변환: 이제 비디지팅 문자를 무시하지 않고 ASCII 값으로 변환하여 영숫자 입력에 대한 체크섬 지원을 사용할 수 있습니다.

  • 여러 자릿수 결과의 한 자릿수 감소: 이제 중간 결과를 한 자릿수(12개 → 1+2 = 3)로 합산하여 한 자리로 줄일 수 있으므로 보다 간결하고 일관된 출력을 사용할 수 있습니다.

  • Two-Digit 결과의 사후 처리: 나누기 또는 모듈로와 같은 수학 연산을 두 자리 결과에 적용하여 최종 값을 파생시킵니다.

  • 특정 Check Digit 값 제외: 허용되지 않는 검사 숫자 값 목록을 정의합니다. 계산된 결과가 일치하는 경우 시스템은 입력을 수정하고 체크섬 논리를 다시 실행합니다.

  • 최종 검사 숫자 대체: 계산 후 특정 검사 숫자 값을 대안으로 대체할 수 있습니다.

고급 체크섬 유효성 검사기 매개 변수

  • UseAscii: 알파벳을 ascii 값으로 바꾸기
  • PositionBasedUpdate: 사전 체크섬 계산. match-position-replacewith 특성에 따라 숫자를 업데이트합니다.
  • CheckDigitValue: 체크섬 계산 후. 계산된 체크섬이 반복 목록의 일부인 경우 정의된 작업을 수행합니다.
  • ltiDigitResult:** 사후/중간 체크섬 계산. 사후/중간 계산 결과가 여러 자릿수인 경우 한 자릿수가 될 때까지 정의된 작업을 수행합니다.

예를 들어 아래 XML에서는 가중치, 모드, checkdigit 및 ascii 매개 변수를 전달했습니다.

<Validators id="Validator_test_id_card_number">
<Validator type="Checksum">
<Param name="Weights">1,1,2,1,1,1,1,1,1,1,1,1,1,1,1,1</Param>
<Param name="Mod">9</Param>
<Param name="CheckDigit">7</Param>
<Param name="UseAscii">1</Param>
</Validator>
</Validators>
제한 사항
  • 고급 체크섬 논리를 사용하여 UI를 만들거나 편집하는 UI 지원은 UX를 통해 사용할 수 없습니다.
  • 영숫자 SID에서는 가중치가 정의되지 않은 경우 문자를 건너뜁니다.

날짜 유효성 검사기

정규식에 포함된 날짜 값이 만드는 새 패턴의 일부인 경우 날짜 유효성 검사기를 사용하여 해당 날짜 값이 조건을 충족하는지 테스트할 수 있습니다. 예를 들어 9자리 직원 ID 번호에 대한 SIT를 만들려고 합니다. 처음 6자리 숫자는 DDMMYY 형식의 고용 날짜이며 마지막 세 자리는 임의로 생성된 숫자입니다. 다음 단계를 사용하여 처음 6자리 숫자가 올바른 형식으로 되어 있는지 확인합니다.

  1. 다음 정규식을 사용하여 기본 요소를 정의합니다.

    \d{9}
    
  2. 날짜 유효성 검사기를 추가합니다.

  3. 날짜 형식과 시작 오프셋을 선택합니다. 날짜 문자열은 처음 6자리 숫자이므로 오프셋은 입니다 0.

    구성된 날짜 유효성 검사기의 스크린샷

유효성 검사기로서의 기능 프로세서

가장 일반적으로 사용되는 일부 SID에 대한 함수 프로세서를 유효성 검사기로 사용할 수 있습니다. 함수 프로세서를 사용하면 SIT에 필요한 추가 검사를 통과하도록 하면서 고유한 정규식을 정의할 수 있습니다. 예를 들어 Func_India_Aadhar 정의한 사용자 지정 정규식이 인도 Aadhar 카드 필요한 유효성 검사 논리를 통과하도록 합니다. 유효성 검사기로 사용할 수 있는 DLP 함수에 대한 자세한 내용은 중요한 정보 형식 함수를 참조하세요.

Luhn 검사 유효성 검사기

Luhn 알고리즘을 전달해야 하는 정규식을 포함하는 사용자 지정 중요한 정보 유형이 있는 경우 Luhn 검사 유효성 검사기를 사용할 수 있습니다.

중요한 정보 유형 추가 검사

사용 가능한 추가 검사에 대한 정의와 몇 가지 예제는 다음과 같습니다.

특정 일치 항목 제외: 이 검사 편집 중인 패턴에 대한 일치 항목을 검색할 때 제외할 키워드를 정의할 수 있습니다. 예를 들어 '4111111111111111'과 같은 테스트 신용 카드 번호가 유효한 숫자로 매칭되지 않는 경우를 제외할 수 있습니다.

해당 문자로 시작하거나 시작하지 않음: 이 검사를 통해 일치하는 항목을 시작하거나 시작할 수 없는 문자를 정의할 수 있습니다. 예를 들어 패턴에서 41, 42 또는 43으로 시작하는 신용 카드 번호만 검색하려면 시작을 선택하고 목록에 41, 42, 43을 쉼표로 구분하여 추가합니다.

해당 자로 끝나거나 문자로 끝나지 않음: 이 검사를 통해 일치하는 항목이 끝나야 하거나 끝나서는 안 되는 문자를 정의할 수 있습니다. 예를 들어 직원 ID 번호가 0 또는 1로 끝날 수 없는 경우 로 끝나지 않음 을 선택하고 목록에 0과 1을 쉼표로 구분하여 추가합니다.

중복 문자 제외: 이 검사를 통해 모든 숫자가 동일한 일치 항목을 무시할 수 있습니다. 예를 들어 6자리 직원 ID 번호가 모두 같을 수 없는 경우 중복 문자 제외 를 선택하여 직원 ID에 대한 유효한 일치 항목 목록에서 111111, 222222, 333333, 444444, 555555, 666666, 777777, 888888, 999999 및 000000을 제외할 수 있습니다.

접두사 포함 또는 제외: 이 검사를 사용하면 일치하는 엔티티 바로 전에 있거나 있어서는 안 되는 키워드를 정의할 수 있습니다. 선택한 항목에 따라 여기에 포함된 접두사 앞에 엔터티가 있으면 일치하거나 일치하지 않습니다. 예를 들어 접두사 GUID제외하면 GUID 앞에 오는 모든 엔터티가 일치하지 않습니다.

접미사 포함 또는 제외: 이 검사를 사용하면 일치하는 엔티티 바로 뒤에 있거나 있어서는 안 되는 키워드를 정의할 수 있습니다. 선택한 항목에 따라 여기에 포함된 접미사가 뒤에 오면 엔터티가 일치하거나 일치하지 않습니다. 예를 들어 접미사를 GUID제외하면 뒤에 붙 :GUID 는 모든 텍스트가 일치하지 않습니다.