영어로 읽기

다음을 통해 공유


Microsoft Purview에서 데이터 원본 검사

Microsoft Purview에서 데이터 원본을 등록한 후 원본을 검사하여 기술 메타데이터를 캡처하고, 스키마를 추출하고, 데이터에 분류를 적용할 수 있습니다.

이 문서에서는 데이터 원본을 검사하기 위한 기본 단계를 알아봅니다.

각 원본에는 검사에 대한 고유한 지침과 필수 구성 요소가 있습니다. 가장 완전한 검사 지침은 지원되는 원본 목록에서 원본을 선택하고 해당 검사 지침을 검토합니다.

필수 구성 요소

다음은 현재 Microsoft Purview에서 등록 및 검사할 수 있는 모든 원본 목록입니다.

데이터 원본을 검사하려면 먼저 다음 단계를 수행해야 합니다.

  1. 데이터 원본 등록 - 기본적으로 Microsoft Purview에 데이터 원본의 주소를 제공하고 Microsoft Purview 데이터 맵 컬렉션 또는 도메인에 매핑합니다.
  2. 네트워크를 고려하고 시나리오에 적합한 통합 런타임 구성을 선택합니다.
  3. 원본에 연결하는 데 사용할 자격 증명을 고려합니다. 모든 원본 페이지에 는 사용 가능한 인증 유형에 대한 세부 정보가 포함된 검사 섹션이 있습니다.

검사 만들기

아래 단계에서는 Azure Blob Storage 예로 사용하고 Microsoft Purview 관리 ID를 사용하여 인증합니다.

중요

이는 검사를 만들기 위한 일반적인 단계이지만 원본별 필수 구성 요소 및 검사 지침은 원본 페이지를 참조해야 합니다.

  1. Microsoft Purview 포털을 열고 데이터 맵 ->데이터 원본 으로 이동하여 맵 또는 테이블 보기에서 등록된 원본을 봅니다.

    데이터 맵에 등록된 원본이 많은 경우 테이블 뷰의 성능이 더 높아질 수 있습니다.

  2. 원본을 찾고 새 검사 아이콘을 선택합니다.

    등록된 원본 및 새 검사 창에서 강조 표시된 새 검사 단추 스크린샷

  3. 검사의 이름을 입력합니다.

  4. 인증 방법을 선택합니다. 여기서 Purview MSI(관리 ID)를 선택했습니다.

    검사를 실행하는 관리 ID 옵션을 보여 주는 스크린샷.

  5. 검사에 대한 현재 도메인, 컬렉션 또는 하위 컬렉션을 선택합니다. 선택한 컬렉션 또는 도메인에는 검색 중에 검색된 메타데이터가 보관됩니다.

    참고

    검사는 항상 등록된 원본과 동일한 도메인에 있지만 하위 데이터 정렬을 선택할 수 있습니다.

  6. 연결 테스트를 선택합니다. 성공하지 못한 경우 [문제 해결] 섹션을 참조하세요. 연결이 성공하면 계속을 선택합니다.

  7. 원본에 따라 특정 데이터 하위 집합에 검사를 scope 수 있습니다. Azure Blob Storage 경우 목록에서 적절한 항목을 선택하여 폴더 및 하위 폴더를 선택할 수 있습니다.

    파일 및 폴더가 선택된 검사 창 scope 보여 주는 스크린샷

  8. 검사 규칙 집합을 선택합니다. 검사 규칙 집합에는 검사가 검사 데이터 분류의 종류가 포함됩니다. 시스템 기본값(원본에 사용할 수 있는 모든 분류 포함), organization 다른 사용자가 만든 기존 사용자 지정 규칙 집합 중에서 선택하거나 인라인으로 새 규칙 집합을 만들 수 있습니다.

    참고

    원본이 등록된 도메인과 연결된 자격 증명 및 검사 규칙 집합만 선택할 수 있습니다.

    기본 집합이 선택된 검사 규칙 집합 선택 페이지의 스크린샷.

  9. 검사 트리거를 선택합니다. 일정을 설정하거나 검사를 한 번 실행할 수 있습니다. 지원되는 일정 옵션에 대해 자세히 알아봅니다.

    되풀이 월별 일정을 보여 주는 검사 트리거 설정 페이지의 스크린샷

  10. 검사를 검토하고 저장 및 실행을 선택합니다.

    저장 및 실행 단추가 강조 표시된 검사 검토 페이지의 스크린샷.

검사 예약

검사를 설정할 때 요청 시 또는 되풀이 일정에 따라 한 번 실행하도록 선택할 수 있습니다. 다음 일정 옵션을 구성할 수 있습니다.

  • 표준 시간대: 검사 일정을 맞추려는 표준 시간대를 선택합니다. 선택한 표준 시간대에서 일광 절약 시간이 관찰되면 트리거가 차이에 대해 자동 조정됩니다.
  • 되풀이: 매일, 매주 또는 매월 검사 되풀이를 선택할 수 있습니다.
    • 일별 되풀이: 되풀이를 매 X일로 설정하고 검사 시작 시간을 지정합니다.
    • 매주 되풀이: 매주 X주로 되풀이를 설정하고, 요일을 하나 또는 여러 번 선택하고, 하루의 검사 시작 시간을 지정합니다.
    • 월별 되풀이: 매월 되풀이를 X개월로 설정하고, 월 단위 또는 평일로 선택하고, 월의 하루 또는 여러 일/평일을 선택하고, 하루의 검사 시작 시간을 지정합니다.
  • 에서 되풀이 시작: 검사 일정이 시작되는 시기를 설정합니다.
  • 되풀이 종료 날짜 지정(선택 사항): 일정 시간 후에 검사를 중지하려면 검사 상자를 선택하여 이 옵션을 사용하도록 설정하고 종료 날짜를 제공할 수 있습니다.

검사 트리거 설정 페이지의 스크린샷.

검사 보기

데이터 원본의 데이터 양에 따라 검사를 실행하는 데 다소 시간이 걸릴 수 있으므로 진행 상황을 검사 검사가 완료되면 결과를 확인하는 방법은 다음과 같습니다.

  1. 컬렉션, 도메인 또는 원본 자체에서 스캔을 볼 수 있습니다.

  2. 컬렉션 또는 도메인에서 보려면 데이터 맵에서 컬렉션 또는 도메인 으로 이동하고 검사 단추를 선택합니다.

    검색 단추가 강조 표시된 컬렉션 페이지의 스크린샷.

  3. 검색 이름을 선택하여 세부 정보를 확인합니다.

    가장 최근 검사 이름이 강조 표시된 컬렉션 목록의 검사 스크린샷

  4. 또는 컬렉션 또는 도메인데이터 원본으로 직접 이동하여 세부 정보 보기를 선택하여 검사 상태 검사 수 있습니다.

    원본의 보기 세부 정보 단추가 강조 표시된 데이터 맵의 스크린샷

  5. 검사 세부 정보는 마지막 실행 상태 검사 진행률과 검사 및 분류 자산 수를 나타냅니다.

    자산 및 검사가 강조 표시된 원본 세부 정보 페이지의 스크린샷

  6. 마지막 실행 상태진행 중으로 업데이트된 다음 전체 검사가 성공적으로 실행되면 완료됨으로 업데이트됩니다.

    진행 중인 상태 보여 주는 검사가 있는 원본 세부 정보 페이지의 스크린샷

    완료된 상태 보여 주는 검사가 있는 원본 세부 정보 페이지의 스크린샷.

검사 관리

검사가 완료되면 관리하거나 다시 실행할 수 있습니다.

  1. 컬렉션 목록 또는 원본 페이지에서 검사 이름을 선택하여 검사를 관리합니다.

    검색 이름 링크가 강조 표시된 원본 세부 정보 페이지의 스크린샷

  2. 검사를 다시 실행하고, 검사를편집하고, 검사를 삭제할 수 있습니다.

    실행, 편집 및 삭제 단추가 강조 표시된 검사 관리 페이지의 스크린샷

  3. 전체 검사를 실행하여 scope 모든 콘텐츠를 검사할 수 있지만 일부 원본에는 증분 검사도 사용할 수 있습니다. 증분 검사는 마지막 검사 이후 업데이트된 리소스만 검사합니다. 원본 페이지에서 지원되는 기능 테이블을 확인하여 첫 번째 검사 후 원본에 증분 검사를 사용할 수 있는지 확인합니다.

    전체 및 증분 검사 옵션을 보여 주는 지금 실행 검사 단추의 스크린샷

문제 해결

네트워크 및 자격 증명에 대한 사용자 지정 설정이므로 검사에 대한 연결을 설정하는 것이 복잡할 수 있습니다.

원본에 연결할 수 없는 경우 다음 단계를 수행합니다.

  1. 원본 페이지 필수 구성 요소를 검토하여 누락된 항목이 없는지 확인합니다.
  2. 원본 페이지의 검사 섹션에서 인증 옵션을 검토하여 인증 방법을 올바르게 설정했는지 확인합니다.
  3. 연결 문제 해결 페이지를 검토합니다.
  4. 지원 요청을 만들어 지원 팀이 특정 환경 문제를 해결하는 데 도움을 줄 수 있습니다.

다음 단계