Microsoft Purview에서 Azure Data Lake Gen1에 연결
이 문서에서는 Azure Data Lake Storage Gen1 원본을 인증하고 상호 작용하는 지침을 포함하여 Microsoft Purview에서 Azure Data Lake Storage Gen1 데이터 원본을 등록하는 프로세스를 간략하게 설명합니다.
참고
이제 Azure Data Lake Storage Gen2 일반 공급됩니다. 지금부터 사용을 시작하는 것이 좋습니다. 자세한 내용은 제품 페이지를 참조하세요.
지원되는 기능
메타데이터 추출 | 전체 검사 | 증분 검사 | 범위가 지정된 검사 | 분류 | 레이블 지정 | 액세스 정책 | 계보 | 데이터 공유 | 라이브 보기 |
---|---|---|---|---|---|---|---|---|---|
예 | 예 | 예 | 예 | 예 | 예 | 아니요 | 제한** | 아니요 | 아니요 |
데이터 세트가 Data Factory 복사 작업 원본/싱크로 사용되는 경우 ** 계보가 지원됩니다.
필수 구성 요소
활성 구독이 있는 Azure 계정입니다. 무료로 계정을 만듭니다.
활성 Microsoft Purview 계정입니다.
원본을 등록하고 Microsoft Purview 거버넌스 포털에서 관리하려면 데이터 원본 관리자 및 데이터 읽기 권한자여야 합니다. 자세한 내용은 Microsoft Purview 권한 페이지를 참조하세요.
등록
이 섹션에서는 ADLS Gen1 데이터 원본을 등록하고 데이터 원본을 성공적으로 검사할 수 있도록 적절한 인증 메커니즘을 설정할 수 있습니다.
등록 단계
데이터 원본에 대한 검사를 설정하기 전에 Microsoft Purview에 데이터 원본을 등록하는 것이 중요합니다.
다음을 통해 Microsoft Purview 거버넌스 포털을 엽니다.
- Microsoft Purview 계정을 직접 https://web.purview.azure.com 탐색하고 선택합니다.
- Azure Portal 열고 Microsoft Purview 계정을 검색하고 선택합니다. Microsoft Purview 거버넌스 포털 단추를 선택합니다.
데이터 맵 -> 원본으로 이동합니다.
컬렉션 메뉴를 사용하여 컬렉션 계층 구조를 만들고 필요에 따라 개별 하위 컬렉션에 권한을 할당합니다.
원본 메뉴에서 적절한 컬렉션으로 이동하고 등록 아이콘을 선택하여 새 ADLS Gen1 데이터 원본을 등록합니다.
Azure Data Lake Storage Gen1 데이터 원본을 선택하고 계속을 선택합니다.
데이터 원본에 적합한 이름을 제공하고 관련 Azure 구독, 기존 Data Lake Store 계정 이름 및 컬렉션을 선택하고 적용을 선택합니다.
선택한 컬렉션 아래에 ADLS Gen1 스토리지 계정이 표시됩니다.
검사
검사를 위한 필수 구성 요소
데이터 원본을 검사할 수 있는 액세스 권한을 갖기 위해서는 ADLS Gen1 Storage 계정의 인증 방법을 구성해야 합니다. 지원되는 옵션은 다음과 같습니다.
참고
스토리지 계정에 대해 방화벽을 사용하도록 설정한 경우 검사를 설정할 때 관리 ID 인증 방법을 사용해야 합니다.
시스템 할당 관리 ID(권장) - Microsoft Purview 계정을 만드는 즉시 시스템 관리 ID가 Azure AD 테넌트에서 자동으로 만들어집니다. Microsoft Purview SAMI가 검사를 수행하려면 리소스 유형에 따라 특정 RBAC 역할 할당이 필요합니다.
사용자 할당 관리 ID (미리 보기) - 시스템 관리 ID와 유사하게 사용자 할당 관리 ID는 Microsoft Purview가 Azure Active Directory에 대해 인증할 수 있도록 하는 데 사용할 수 있는 자격 증명 리소스입니다. 자세한 내용은 사용자 할당 관리 ID 가이드를 참조하세요.
서비스 주체 - 이 메서드에서는 Azure Active Directory 테넌트에서 새 서비스 주체를 만들거나 기존 서비스 주체를 사용할 수 있습니다.
검사에 대한 인증
검사에 시스템 또는 사용자 할당 관리 ID 사용
Microsoft Purview 계정에 ADLS Gen1 데이터 원본을 검사할 수 있는 권한을 부여하는 것이 중요합니다. 검사 권한을 부여하려는 항목에 따라 구독, 리소스 그룹 또는 리소스 수준에서 시스템 관리 ID 또는 사용자 할당 관리 ID를 추가할 수 있습니다.
참고
Azure 리소스에 관리 ID를 추가하려면 구독의 소유자여야 합니다.
Azure Portal 카탈로그에서 검색할 수 있도록 허용할 구독, 리소스 그룹 또는 리소스(예: Azure Data Lake Storage Gen1 스토리지 계정)를 찾습니다.
개요를 선택한 다음, 데이터 탐색기를 선택합니다.
위쪽 탐색 영역에서 액세스 선택
선택 을 선택하고 사용자 또는 그룹 선택 메뉴에서 Microsoft Purview에 이미 등록된 Microsoft Purview 이름(시스템 관리 ID) 또는 사용자 할당 관리 ID(미리 보기)를 추가합니다.
읽기 및 실행 권한을 선택합니다. 아래 스크린샷과 같이 추가 옵션에서 이 폴더와 모든 자식 및 액세스 권한 항목 및 기본 권한 항목을 선택해야 합니다. 확인을 선택합니다.
팁
액세스 권한 항목은 현재 파일 및 폴더에 대한 권한 항목입니다. 기본 권한 항목은 새 파일 및 폴더에서 상속되는 권한 항목입니다. 현재 기존 파일에만 권한을 부여하려면 액세스 권한 항목을 선택합니다. 나중에 추가될 파일 및 폴더를 검사할 수 있는 권한을 부여하려면 기본 사용 권한 항목을 포함합니다.
검사에 서비스 주체 사용
새 서비스 주체 만들기
새 서비스 주체를 만들어야 하는 경우 Azure AD 테넌트에서 애플리케이션을 등록하고 데이터 원본의 서비스 주체에 대한 액세스를 제공해야 합니다. Azure AD 전역 관리자 또는 애플리케이션 관리자와 같은 다른 역할이 이 작업을 수행할 수 있습니다.
서비스 주체의 애플리케이션 ID 가져오기
이미 만든 서비스 주체개요에 있는 애플리케이션(클라이언트) ID 복사
ADLS Gen1 계정에 대한 서비스 주체 액세스 권한 부여
서비스 주체에게 ADLS Gen2 데이터 원본을 검사할 수 있는 권한을 부여하는 것이 중요합니다. 필요한 권한에 따라 구독, 리소스 그룹 또는 리소스 수준에서 서비스 주체에 대한 액세스를 추가할 수 있습니다.
참고
Azure 리소스에 서비스 주체를 추가할 수 있도록 하려면 구독의 소유자여야 합니다.
스토리지 계정을 열고 개요 -->Data Explorer 선택하여 스토리지 계정에 대한 서비스 주체 액세스를 제공합니다.
위쪽 탐색 영역에서 액세스 선택
사용자 또는 그룹 선택 선택에서 서비스 주체 선택 및 추가를 선택합니다.
읽기 및 실행 권한을 선택합니다. 추가 옵션에서 이 폴더와 모든 자식 및 액세스 권한 항목 및 기본 권한 항목을 선택해야 합니다. 확인을 선택합니다.
검사 만들기
Microsoft Purview 계정을 열고 Microsoft Purview 거버넌스 포털 열기를 선택합니다.
데이터 맵 -->원본으로 이동하여 컬렉션 계층 구조를 확인합니다.
이전에 등록된 ADLS Gen1 데이터 원본 아래에서 새 검사 아이콘을 선택합니다.
시스템 또는 사용자 할당 관리 ID를 사용하는 경우
검사에 대한 이름을 제공하고, 자격 증명에서 시스템 또는 사용자 할당 관리 ID를 선택하고, 검사에 적합한 컬렉션을 선택하고, 연결 테스트를 선택합니다. 연결이 성공하면 계속을 선택합니다.
서비스 주체를 사용하는 경우
검사에 대한 이름을 제공하고, 검사에 적합한 컬렉션을 선택하고, 자격 증명 아래에서 + 새로 만들기를 선택합니다.
서비스 주체를 만드는 동안 사용된 적절한 키 자격 증명 모음 연결 및 비밀 이름을 선택합니다. 서비스 주체 ID는 앞에서 설명한 대로 복사된 애플리케이션(클라이언트) ID입니다.
연결 테스트를 선택합니다. 연결이 성공하면 계속을 선택합니다.
검사 범위 지정 및 실행
목록에서 적절한 항목을 선택하여 특정 폴더 및 하위 폴더에 검사를 scope 수 있습니다.
그런 다음, 검사 규칙 집합을 선택합니다. 시스템 기본값, 기존 사용자 지정 규칙 집합 중에서 선택하거나 인라인으로 새 규칙 집합을 만들 수 있습니다.
새 검사 규칙 집합을 만드는 경우 검사 규칙에 포함할 파일 형식 을 선택합니다.
검사 규칙에 포함할 분류 규칙을 선택할 수 있습니다.
검사 트리거를 선택합니다. 일정을 설정하거나 검사를 한 번 실행할 수 있습니다.
검사를 검토하고 저장 및 실행을 선택합니다.
검사 보기
컬렉션에서 데이터 원본으로 이동하고 세부 정보 보기를 선택하여 검사 상태 검사.
검사 세부 정보는 마지막 실행 상태 검사 진행률과 검사 및 분류된 자산 수를 나타냅니다.
마지막 실행 상태진행 중으로 업데이트된 다음 전체 검사가 성공적으로 실행되면 완료됨으로 업데이트됩니다.
검사 관리
검사를 관리하거나 완료 시 다시 실행할 수 있습니다.
검사 이름을 선택하여 검사 관리
검사를 다시 실행하고, 검사를편집하고, 검사를 삭제할 수 있습니다.
참고
- 검사를 삭제해도 이전 검사에서 만든 카탈로그 자산은 삭제되지 않습니다.
- 원본 테이블이 변경되고 Microsoft Purview의 스키마 탭에서 설명을 편집한 후 원본 테이블을 다시 검사하면 자산이 더 이상 스키마 변경으로 업데이트되지 않습니다.
증분 검사 또는 전체 검사를 다시 실행할 수 있습니다.
다음 단계
이제 원본을 등록했으므로 아래 가이드에 따라 Microsoft Purview 및 데이터에 대해 자세히 알아보세요.