Microsoft Purview에서 MongoDB에 연결 및 관리
이 문서에서는 MongoDB를 등록하는 방법과 Microsoft Purview에서 MongoDB를 인증하고 상호 작용하는 방법을 간략하게 설명합니다. Microsoft Purview에 대한 자세한 내용은 소개 문서를 참조하세요.
지원되는 기능
메타데이터 추출 | 전체 검사 | 증분 검사 | 범위가 지정된 검사 | 분류 | 레이블 지정 | 액세스 정책 | 계보 | 데이터 공유 | 라이브 보기 |
---|---|---|---|---|---|---|---|---|---|
예 | 예 | 아니요 | 예 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 | 아니요 |
지원되는 MongoDB 버전은 2.6~5.1입니다.
MongoDB 원본을 검사할 때 Microsoft Purview는 다음을 비롯한 기술 메타데이터 추출을 지원합니다.
- 서버
- 데이터베이스
- 스키마를 포함한 컬렉션
- 스키마를 포함한 뷰
검사하는 동안 Microsoft Purview는 샘플 문서를 검색하고 분석하여 컬렉션/뷰 스키마를 유추합니다. 샘플 크기는 구성할 수 있습니다.
검사를 설정할 때 하나 이상의 MongoDB 데이터베이스를 완전히 검색하거나 지정된 이름 또는 이름 패턴과 일치하는 컬렉션의 하위 집합에 검사를 추가로 scope 수 있습니다.
알려진 제한
개체가 데이터 원본에서 삭제되면 현재 후속 검사에서 Microsoft Purview에서 해당 자산을 자동으로 제거하지 않습니다.
필수 구성 요소
활성 구독이 있는 Azure 계정입니다. 무료로 계정을 만듭니다.
활성 Microsoft Purview 계정입니다.
원본을 등록하고 Microsoft Purview 거버넌스 포털에서 관리하려면 데이터 원본 관리자 및 데이터 읽기 권한자 권한이 필요합니다. 권한에 대한 자세한 내용은 Microsoft Purview의 액세스 제어를 참조하세요.
최신 자체 호스팅 통합 런타임을 설정합니다. 자세한 내용은 자체 호스팅 통합 런타임 만들기 및 구성 가이드를 참조하세요. 지원되는 최소 자체 호스팅 Integration Runtime 버전은 5.16.8093.1입니다.
자체 호스팅 통합 런타임이 설치된 컴퓨터에 JDK 11 이 설치되어 있는지 확인합니다. JDK를 새로 설치한 후 컴퓨터를 다시 시작하여 적용합니다.
자체 호스팅 통합 런타임 머신에 Visual C++ 재배포 가능 패키지(Visual Studio 2012 업데이트 4 이상 버전)가 설치되어 있는지 확인합니다. 이 업데이트가 설치되어 있지 않으면 여기에서 다운로드할 수 있습니다.
등록
이 섹션에서는 Microsoft Purview 거버넌스 포털을 사용하여 Microsoft Purview에 MongoDB를 등록하는 방법을 설명합니다.
등록 단계
데이터 카탈로그에 새 MongoDB 원본을 등록하려면 다음을 수행합니다.
- Microsoft Purview 거버넌스 포털에서 Microsoft Purview 계정으로 이동합니다.
- 왼쪽 탐색 영역에서 데이터 맵 을 선택합니다.
- 등록 선택
- 원본 등록에서 MongoDB를 선택합니다. 계속을 선택합니다.
원본 등록(MongoDB) 화면에서 다음을 수행합니다.
데이터 원본이 카탈로그 내에 나열될 이름을 입력합니다.
서버 이름을 입력합니다. 회사에서 MongoDB instance 고유하게 식별할 이름을 지정합니다. 예를 들어
host
독립 실행형 배포의MyReplicaSetName
경우 복제본(replica) 집합MyClusterName
의 경우 분할된 클러스터의 경우 입니다. 이 값은 자산 정규화된 이름에 사용되며 변경할 수 없습니다.컬렉션을 선택하거나 새 컬렉션을 만듭니다(선택 사항).
완료하여 데이터 원본을 등록합니다.
검사
아래 단계에 따라 MongoDB를 검사하여 자산을 자동으로 식별합니다. 일반적인 검사에 대한 자세한 내용은 검사 및 수집 소개를 참조하세요.
검사에 대한 인증
MongoDB 원본에 대해 지원되는 인증 유형은 기본 인증입니다.
검사 만들기 및 실행
새 검사를 만들고 실행하려면 다음을 수행합니다.
관리 센터에서 통합 런타임을 선택합니다. 자체 호스팅 통합 런타임이 설정되어 있는지 확인합니다. 설정되지 않은 경우 여기에 설명된 단계를 사용하여 자체 호스팅 통합 런타임을 만듭니다.
원본으로 이동합니다.
등록된 MongoDB 원본을 선택합니다.
+ 새 검사를 선택합니다.
아래 세부 정보를 제공합니다.
이름: 검사의 이름
통합 런타임을 통해 연결: 검사를 수행하는 데 사용되는 자체 호스팅 통합 런타임을 선택합니다.
자격 증명: 자격 증명을 선택하여 데이터 원본에 연결합니다. 다음을 수행해야 합니다.
- 자격 증명을 만드는 동안 기본 인증 을 선택합니다.
- 사용자 이름 입력 필드에서 MongoDB에 연결하는 데 사용되는 사용자 이름을 제공합니다.
- MongoDB에 연결하는 데 사용되는 사용자 암호를 비밀 키에 저장합니다.
연결 문자열: 사용자 이름과 암호를 제외하고 MongoDB에 연결하는 데 사용되는 MongoDB 연결 문자열을 지정합니다. 예를 들면
mongodb://mongodb0.example.com:27017,mongodb1.example.com:27017/?replicaSet=myRepl
와 같습니다.데이터베이스: 가져올 MongoDB 데이터베이스 목록을 지정합니다. 목록에는 세미콜론(;)(예: )으로 구분된 데이터베이스 이름이 하나 이상 있을 수 있습니다.
database1; database2
컬렉션: 가져올 컬렉션의 하위 집합은 세미콜론으로 구분된 컬렉션 목록(예: )으로 표현됩니다.
collection1; collection2
목록이 비어 있으면 모든 컬렉션을 가져옵니다.SQL LIKE 식 구문을 사용하는 허용 가능한 컬렉션 이름 패턴에는 %를 사용하는 것이 포함됩니다. 예: :
A%; %B; %C%; D
- A 또는 로 시작
- B 또는 로 종료
- C 또는 포함
- 같음 D
NOT 및 특수 문자의 사용은 허용되지 않습니다.
샘플 문서 수: 스키마 추출을 위해 분석할 샘플 문서 수입니다. 기본값은 10입니다.
사용 가능한 최대 메모리 (자체 호스팅 통합 런타임 사용 시 적용): 검사 프로세스에서 사용할 고객의 VM에서 사용할 수 있는 최대 메모리(GB)입니다. 검사할 MongoDB 원본의 크기에 따라 달라집니다.
연결 테스트를 선택하여 구성의 유효성을 검사합니다.
계속을 선택합니다.
검사 트리거를 선택합니다. 일정을 설정하거나 검사를 한 번 실행할 수 있습니다.
검사를 검토하고 저장 및 실행을 선택합니다.
검사 및 검사 실행 보기
기존 검사를 보려면 다음을 수행합니다.
- Microsoft Purview 거버넌스 포털로 이동합니다. 왼쪽 창에서 데이터 맵을 선택합니다.
- 데이터 원본을 선택합니다. 최근 검사에서 해당 데이터 원본에 대한 기존 검사 목록을 보거나 검사 탭에서 모든 검사를 볼 수 있습니다.
- 보려는 결과가 있는 검사를 선택합니다. 창에는 이전의 모든 검사 실행과 각 검사 실행에 대한 상태 및 메트릭이 표시됩니다.
- 실행 ID를 선택하여 검사 실행 세부 정보를 검사.
검사 관리
검사를 편집, 취소 또는 삭제하려면 다음을 수행합니다.
Microsoft Purview 거버넌스 포털로 이동합니다. 왼쪽 창에서 데이터 맵을 선택합니다.
데이터 원본을 선택합니다. 최근 검사에서 해당 데이터 원본에 대한 기존 검사 목록을 보거나 검사 탭에서 모든 검사를 볼 수 있습니다.
관리하려는 검사를 선택합니다. 그 후에, 다음 작업을 수행할 수 있습니다.
- 검사 편집을 선택하여 검사를 편집합니다.
- 검사 실행 취소를 선택하여 진행 중인 검사를 취소합니다.
- 검사 삭제를 선택하여 검사를 삭제합니다.
참고
- 검사를 삭제해도 이전 검사에서 만든 카탈로그 자산은 삭제되지 않습니다.
- 원본 테이블이 변경되고 Microsoft Purview의 스키마 탭에서 설명을 편집한 후 원본 테이블을 다시 검사하면 자산이 더 이상 스키마 변경으로 업데이트되지 않습니다.
다음 단계
원본을 등록했으므로 아래 가이드에 따라 Microsoft Purview 및 데이터에 대해 자세히 알아보세요.