Microsoft Purview에서 데이터 원본 검사

Microsoft Purview에서 데이터 원본을 등록한 후 원본을 검사하여 기술 메타데이터를 캡처하고, 스키마를 추출하고, 데이터에 분류를 적용할 수 있습니다.

이 문서에서는 데이터 원본을 검사하기 위한 기본 단계를 알아봅니다.

각 원본에는 검사에 대한 고유한 지침과 필수 구성 요소가 있습니다. 가장 완전한 검사 지침은 지원되는 원본 목록에서 원본을 선택하고 해당 검사 지침을 검토합니다.

필수 구성 요소

다음은 현재 Microsoft Purview에서 등록 및 검사할 수 있는 모든 원본 목록입니다.

데이터 원본을 검사하려면 먼저 다음 단계를 수행해야 합니다.

  1. 데이터 원본 등록 - 기본적으로 Microsoft Purview에 데이터 원본의 주소를 제공하고 Microsoft Purview 데이터 맵 컬렉션에 매핑합니다.
  2. 네트워크 고려 - 원본이 온-프레미스 네트워크 또는 VPN(가상 사설망)에 있거나 Microsoft Purview 계정이 프라이빗 엔드포인트를 사용하는 경우 자체 호스팅 통합 런타임이 필요합니다. 이 도구는 원본 및 Microsoft Purview가 검사 중에 연결할 수 있도록 개인 네트워크의 컴퓨터에 배치되는 도구입니다. 자체 호스팅 통합 런타임을 만드는 지침은 다음과 같습니다.
  3. 원본에 연결하는 데 사용할 자격 증명을 고려합니다. 모든 원본 페이지에 는 사용 가능한 인증 유형에 대한 세부 정보가 포함된 검사 섹션이 있습니다.

검사 만들기

아래 단계에서는 Azure Blob Storage 예로 사용하고 Microsoft Purview 관리 ID를 사용하여 인증합니다.

중요

이는 검사를 만들기 위한 일반적인 단계이지만 원본별 필수 구성 요소 및 검사 지침은 원본 페이지를 참조해야 합니다.

  1. 다음을 통해 Microsoft Purview 거버넌스 포털을 엽니다.

    Microsoft Purview 거버넌스 포털 단추가 강조 표시된 Azure Portal Microsoft Purview 창의 스크린샷

  2. 데이터 맵 ->원본으로 이동하여 맵 또는 테이블 보기에서 등록된 원본을 봅니다.

  3. 원본을 찾고 새 검사 아이콘을 선택합니다.

    등록된 원본 및 새 검사 창에서 강조 표시된 새 검사 단추 스크린샷

  4. 검사의 이름을 입력합니다.

  5. 인증 방법을 선택합니다. 여기서 Purview MSI(관리 ID)를 선택했습니다.

    검사를 실행하는 관리 ID 옵션을 보여 주는 스크린샷.

  6. 현재 컬렉션 또는 검사에 대한 하위 컬렉션을 선택합니다. 선택한 컬렉션에는 검사 중에 검색된 메타데이터가 보관됩니다.

  7. 연결 테스트를 선택합니다. 성공하지 못한 경우 [문제 해결] 섹션을 참조하세요. 연결이 성공하면 계속을 선택합니다.

  8. 원본에 따라 특정 데이터 하위 집합에 검사를 scope 수 있습니다. Azure Blob Storage 경우 목록에서 적절한 항목을 선택하여 폴더 및 하위 폴더를 선택할 수 있습니다.

    파일 및 폴더가 선택된 검사 창 scope 보여 주는 스크린샷

  9. 검사 규칙 집합을 선택합니다. 검사 규칙 집합에는 검사가 검사 데이터 분류의 종류가 포함됩니다. 시스템 기본값(원본에 사용할 수 있는 모든 분류 포함), organization 다른 사용자가 만든 기존 사용자 지정 규칙 집합 중에서 선택하거나 인라인으로 새 규칙 집합을 만들 수 있습니다.

    기본 집합이 선택된 검사 규칙 집합 선택 페이지의 스크린샷.

  10. 검사 트리거를 선택합니다. 일정을 설정하거나(매월 또는 매주) 검사를 한 번 실행할 수 있습니다.

    참고

    에서의 시작 되풀이일정 검사 시간보다 1분 이상 낮아야 합니다. 그렇지 않으면 다음 되풀이에서 검사가 트리거됩니다.

    되풀이 월별 일정을 보여 주는 검사 트리거 설정 페이지의 스크린샷

  11. 검사를 검토하고 저장 및 실행을 선택합니다.

    저장 및 실행 단추가 강조 표시된 검사 검토 페이지의 스크린샷.

검사 보기

데이터 원본의 데이터 양에 따라 검사를 실행하는 데 다소 시간이 걸릴 수 있으므로 진행 상황을 검사 검사가 완료되면 결과를 확인하는 방법은 다음과 같습니다.

  1. 컬렉션 또는 원본 자체에서 스캔을 볼 수 있습니다.

  2. 컬렉션에서 보려면 데이터 맵에서 컬렉션 으로 이동하고 스캔 단추를 선택합니다.

    검색 단추가 강조 표시된 컬렉션 페이지의 스크린샷.

  3. 검색 이름을 선택하여 세부 정보를 확인합니다.

    가장 최근 검사 이름이 강조 표시된 컬렉션 목록의 검사 스크린샷

  4. 또는 컬렉션데이터 원본으로 직접 이동하여 세부 정보 보기를 선택하여 검사 상태 검사 수 있습니다.

    원본의 보기 세부 정보 단추가 강조 표시된 데이터 맵의 스크린샷

  5. 검사 세부 정보는 마지막 실행 상태 검사 진행률과 검사 및 분류 자산 수를 나타냅니다.

    자산 및 검사가 강조 표시된 원본 세부 정보 페이지의 스크린샷

  6. 마지막 실행 상태진행 중으로 업데이트된 다음 전체 검사가 성공적으로 실행되면 완료됨으로 업데이트됩니다.

    진행 중인 상태 보여 주는 검사가 있는 원본 세부 정보 페이지의 스크린샷

    완료된 상태 보여 주는 검사가 있는 원본 세부 정보 페이지의 스크린샷.

검사 관리

검사가 완료되면 관리하거나 다시 실행할 수 있습니다.

  1. 컬렉션 목록 또는 원본 페이지에서 검사 이름을 선택하여 검사를 관리합니다.

    검색 이름 링크가 강조 표시된 원본 세부 정보 페이지의 스크린샷

  2. 검사를 다시 실행하고, 검사를편집하고, 검사를 삭제할 수 있습니다.

    실행, 편집 및 삭제 단추가 강조 표시된 검사 관리 페이지의 스크린샷

  3. 전체 검사를 실행하여 scope 모든 콘텐츠를 검사할 수 있지만 일부 원본에는 증분 검사도 사용할 수 있습니다. 증분 검사는 마지막 검사 이후 업데이트된 리소스만 검사합니다. 원본 페이지에서 지원되는 기능 테이블을 확인하여 첫 번째 검사 후 원본에 증분 검사를 사용할 수 있는지 확인합니다.

    전체 및 증분 검사 옵션을 보여 주는 지금 실행 검사 단추의 스크린샷

문제 해결

네트워크 및 자격 증명에 대한 사용자 지정 설정이므로 검사에 대한 연결을 설정하는 것이 복잡할 수 있습니다.

원본에 연결할 수 없는 경우 다음 단계를 수행합니다.

  1. 원본 페이지 필수 구성 요소를 검토하여 누락된 항목이 없는지 확인합니다.
  2. 원본 페이지의 검사 섹션에서 인증 옵션을 검토하여 인증 방법을 올바르게 설정했는지 확인합니다.
  3. 연결 문제 해결 페이지를 검토합니다.
  4. 지원 요청을 만들어 지원 팀이 특정 환경 문제를 해결하는 데 도움을 줄 수 있습니다.

다음 단계