다음을 통해 공유


정확한 데이터 일치 기반 중요한 정보 유형에 대해 중요한 정보 원본 테이블을 해시하고 업로드합니다.

이 문서에서는 중요한 정보 원본 테이블을 해시하고 업로드하는 방법을 보여줍니다.

E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 규정 준수 포털 평가판 허브에서 지금 시작하세요. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.

적용 대상

중요한 정보 원본 테이블 해시 및 업로드

이 단계에서는 다음을 수행합니다.

  1. 사용자 지정 보안 그룹 및 사용자 계정을 설정합니다.
  2. EDM(정확한 데이터 일치) 에이전트 업로드 도구를 설정합니다.
  3. EDM 업로드 에이전트 도구를 사용하여 솔트 값, 중요한 정보 원본 테이블을 사용하여 해시하고 업로드합니다.

해시에 설명된 대로 두 컴퓨터 메서드 또는 단일 컴퓨터 메서드 를 사용하여 중요한 데이터를 해시 하고 업로드하고 데이터를 업로드할 수 있습니다. 두 컴퓨터를 사용하여 중요한 데이터를 해시하고 업로드하는 프로세스를 분리하는 것이 가장 좋습니다. 두 컴퓨터에서 단계를 분리하면 인터넷 연결로 인해 손상될 수 있는 컴퓨터에서 실제 데이터를 명확한 텍스트 형식으로 사용할 수 없도록 할 수 있습니다. 이렇게 하면 발생하는 문제를 쉽게 식별할 수 있습니다.

필수 조건

기술 요구 사항

  • Microsoft 365의 회사 또는 학교 계정입니다. 이 계정은 EDM_DataUploaders 보안 그룹에 추가해야 합니다.
  • 다음 운영 체제 중 하나가 있는 컴퓨터입니다. 이 컴퓨터는 EDM 업로드 에이전트를 실행합니다.
    • Windows 10
    • .NET 버전 4.6.2가 포함된 Windows Server 2016
    • Windows Server 2019
  • 데이터를 업로드하는 데 사용하는 컴퓨터의 디렉터리입니다. 이 디렉터리에는 다음이 포함됩니다.
    • EDM 업로드 에이전트입니다.
    • .csv, .tsv 또는 파이프(|) 형식의 중요한 정보 데이터 파일입니다. 기본적으로 EDM 업로드 에이전트는 데이터 파일이 .csv 형식이어야 합니다. > [! TIP]

      매개 변수를 사용하여 "(Tab)" 또는 "(|)" 옵션을 표시하여 쉼표 대신 탭 또는 파이프로 구분된 데이터와 함께 /ColumnSeparated 파일을 사용할 수 있습니다. 예: EdmUploadAgent.exe /UploadData /DataStoreName PatientRecords /DataFile C:\Edm\Hash\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5

    • 출력에는 해시 프로시저를 완료할 때 생성되는 및 솔트 파일이 있습니다.
    • edm.xml 파일의 데이터 저장소 이름입니다. 이 예제에서는 를 사용합니다 PatientRecords.

보안 그룹 및 사용자 계정 요구 사항

  1. 전역 관리자는 구독에 대한 적절한 링크를 사용하여 관리 센터로 이동하여 EDM_DataUploaders라는 보안 그룹을 만듭니다.

  2. EDM_DataUploaders 보안 그룹에 하나 이상의 사용자를 추가합니다. (중요한 정보의 데이터베이스를 관리하는 사용자입니다.)

정확한 데이터 일치 스키마

환경에 EDM 스키마 및 중요한 정보 유형 도구를 사용했거나 클래식 환경에 EDM 중요한 정보 유형/규칙 패키지를 사용한 경우 해당 스키마를 다운로드하여 중요한 정보 원본 테이블을 해시해야 합니다. 자세한 내용은 XML 형식으로 EDM 스키마 파일 내보내기를 참조하세요.

이 EDM 스키마를 다운로드하려면 명령 프롬프트 창을 열고 다음 명령을 실행합니다.

EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>

데이터 서식 요구 사항

중요한 데이터를 해시하고 업로드하기 전에 테이블에서 콘텐츠를 구문 분석하는 데 문제가 발생할 수 있는 특수 문자를 검색합니다.

다음 구문과 함께 EDM 업로드 에이전트를 사용하여 테이블이 적절한 형식인지 확인할 수 있습니다.

EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

일반적인 서식 문제

  1. 일치하지 않는 열 수: 이는 EDM이 열 구분 기호로 해석하는 테이블의 값 내에 쉼표 또는 따옴표 문자가 있기 때문일 수 있습니다. 전체 값을 둘러싼 경우가 아니면 작은따옴표와 큰따옴표로 인해 도구가 개별 열의 시작과 끝을 잘못 확인할 수 있습니다.
  2. 값 내의 작은따옴표 문자 또는 쉼표: 예를 들어 사람의 이름에 작은따옴표(예: Tom O'Neil)가 포함되거나 도시의 이름이 아포스트로피(예: 's-Gravenhage')로 시작하는 경우 중요한 정보 테이블을 생성하고 이러한 열을 큰따옴표로 둘러싸는 데 사용되는 데이터 내보내기 프로세스를 수정해야 합니다.
  3. 값 내의 큰따옴표 문자: 테이블의 탭으로 구분된 형식을 사용하는 것이 가장 좋습니다. 탭으로 구분된 테이블은 이러한 문제에 덜 취약합니다.

해시 및 데이터 업로드

중요한 정보 원본 테이블의 서식은 지우기 텍스트로 지정됩니다. 해시 단계에 하나의 컴퓨터와 업로드 단계에 다른 컴퓨터를 사용하면 Microsoft 365 테넌트와 직접 연결된 컴퓨터에서 데이터가 일반 텍스트로 노출되지 않도록 보호할 수 있습니다.

중요

이 방법을 사용하려면 두 컴퓨터에 동일한 버전의 EDM 업로드 에이전트를 설치해야 합니다. 그런 다음 보안 컴퓨터에서 Microsoft 365 테넌트로 직접 연결할 수 있는 컴퓨터로 해시 파일과 솔트 파일을 복사할 수 있습니다.

  1. 보안 환경의 컴퓨터에서 명령 프롬프트 창에서 다음 명령을 실행합니다.EdmUploadAgent.exe /CreateHash /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /AllowedBadLinesPercentage [value] 예를 들어: EdmUploadAgent.exe /CreateHash /DataFile C:\Edm\Data\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5

    /Salt <saltvalue> 옵션을 지정하지 않은 경우 이러한 확장명과 함께 해시된 파일과 솔트 파일을 출력합니다.

    • EdmHash
    • EdmSalt
  2. 중요한 정보 원본 테이블(예: PatientRecords.csv)을 테넌트로 업로드하는 데 사용하는 컴퓨터에 이러한 파일을 안전하게 복사합니다.

  3. EDM 업로드 에이전트 권한 부여:

    1. 관리자 권한으로 명령 프롬프트 창을 엽니다.
    2. EDM 업로드 에이전트가 설치된 디렉터리로 전환합니다. (권장 디렉터리가 C:\EDM\Data입니다.)
    3. 다음 명령을 실행합니다.

    EDM Upload Agent.exe /Authorize

    중요

    설치되어 있는 폴더에서 EDM 업로드 에이전트를 실행해야 하며 데이터 파일에 대한 전체 경로를 적용해야 합니다.

  4. 회사 또는 학교 Microsoft 365 계정으로 로그인합니다. ( EDM_DataUploaders 보안 그룹에 추가된 계정입니다. 테넌트 정보는 연결을 위해 사용자 계정에서 추출됩니다.

  5. 해시된 데이터를 업로드하려면 명령 프롬프트 창에서 다음 명령을 실행합니다.

    EdmUploadAgent.exe /UploadHash /DataStoreName \<DataStoreName\> /HashFile \<HashedSourceFilePath\ /ColumnSeparator ["{Tab}"|"|"]

    예: EdmUploadAgent.exe /UploadHash /DataStoreName PatientRecords /HashFile C:\\Edm\\Hash\\**PatientRecords.EdmHash**

  6. 중요한 데이터의 업로드가 성공했는지 확인하려면 명령 프롬프트 창에서 다음 명령을 실행합니다.

    EdmUploadAgent.exe /GetDataStore

    업로드에 성공하면 데이터 저장소 목록과 마지막으로 업데이트된 시점이 표시됩니다.

  7. 모든 데이터 업로드를 특정 저장소에 표시하고 업데이트할 때 명령 프롬프트 창에서 다음 명령을 실행합니다.

    EdmUploadAgent.exe /GetSession /DataStoreName <DataStoreName>

해시 및 업로드 프로세스를 처음 만든 후 자동화하려면 정확한 데이터 일치 중요한 정보 원본 테이블 파일 새로 고침을 참조하세요.

EDM 및 더블 바이트 문자 집합 언어

정확한 데이터 일치는 중국어, 일본어 및 한국어로 사용되는 것과 같은 더블 바이트 문자를 지원합니다. 그러나 이중 바이트 문자로 인코딩된 확증 증거에 대한 문자열 일치는 지원하지 않습니다. 아래 설명된 대로 EDM에 대한 세계화를 사용하도록 설정하지 않는 한 분류된 콘텐츠에서 검색된 다중 토큰 CJK 텍스트와도 일치하지 않습니다. 모든 경우에 SIT는 기본 필드와 확증 증거 필드 모두에 대한 모든 다중 토큰 텍스트에 매핑되어야 합니다.

더블 바이트 문자에 대한 정확한 데이터 일치를 호출하려면 다음 단계를 수행합니다.

  1. 일본어 간지와 같은 더블 바이트 문자 집합 언어에서 일치하도록 구성된 EDM 중요 정보 유형(SIT)을 만듭니다.

  2. EDM 업로드 에이전트 버전 17.01.0495.0 이상을 다운로드하고 설치했는지 확인합니다.

  3. EdmUploadAgent.exe.config 파일의 세계화 매개 변수를 true로 업데이트합니다.<add key=" IsGlobalizationEnabled" value="true">

  4. 일치시킬 데이터를 사용하여 원본 테이블을 해시하고 업로드합니다.

다음 단계