이 문서에서는 Microsoft Purview에서 데이터 거버넌스 솔루션을 빌드하고 데이터 거버넌스를 일상적인 비즈니스 운영과 통합하기 위한 기술 단계를 안내합니다.
아래 자료에 대한 방향으로 통합 카탈로그 계획을 검토하는 것이 유용할 수 있습니다. 환경을 설정하는 방법에 대한 단계별 일러스트레이션은 샘플 설정 연습을 참조하세요.
필수 구성 요소
- 다음 중 하나를 수행하려면 Microsoft Purview Enterprise instance 필요합니다.
- Microsoft Purview에서 데이터 원본을 등록 하고 검사 합니다. 지원되는 데이터 원본 목록을 봅니다.
데이터 거버넌스 관리자 역할
데이터 거버넌스 관리자 역할은 Microsoft Purview 통합 카탈로그 사용자에 대한 첫 번째 액세스 수준을 위임합니다. organization 사용자에게 이 역할을 부여하는 것은 시작하는 첫 번째 단계입니다. 데이터 거버넌스에 대한 역할을 할당하는 방법에 대한 세부 정보를 찾습니다.
비즈니스 개념
비즈니스 개념은 통합 카탈로그 요소로, organization 데이터 소비자와 큐레이터에게 적합한 방식으로 데이터를 구성하고 이해하는 데 도움이 됩니다. 통합 카탈로그 비즈니스 개념을 참조할 때 다음 5가지 요소에 대해 설명합니다.
통합 카탈로그 계획 문서에는 이러한 개념과 작업을 시작하는 방법을 이해하는 데 도움이 되는 자세한 지침이 있습니다. 시작점으로 거버넌스 도메인 및 데이터 제품을 잘 이해하는 것이 좋습니다.
거버넌스 도메인: 데이터 제품 및 기타 비즈니스 개념의 공통 거버넌스, 소유권 및 검색을 가능하게 하는 경계입니다. 목표는 거버넌스 도메인 소유자가 데이터 제품을 관리하고 액세스, 사용 및 배포에 대한 규칙을 설정할 수 있도록 하는 것입니다. 거버넌스 도메인을 설정하는 방법의 몇 가지 예는 다음과 같습니다.
- 인적 자원, 판매 및 재무와 같은 기업 또는 비즈니스 영역
- 가장 중요한 주제는 제품 또는 당사자와 같습니다.
- SOX, PCI 또는 자금 세탁 방지와 같은 규제 도메인.
- 고객 환경, 클라우드 공급망 또는 비즈니스 인텔리전스와 같은 조직 기능을 기반으로 하는 경계입니다.
데이터 제품: 테이블, 파일 또는 Power BI 보고서와 같은 데이터 자산 그룹은 organization 데이터 소비자에게 공유할 적절한 사용 사례와 함께 패키지됩니다. 거버넌스 도메인은 많은 데이터 제품을 보관할 수 있지만 데이터 제품은 단일 거버넌스 도메인에서 관리되며 여러 거버넌스 도메인에서 검색할 수 있습니다.
거버넌스 도메인 및 데이터 제품을 설정하면 다른 비즈니스 개념에 연결하여 데이터를 추가로 큐레이팅할 수 있습니다.
기본 설정 단계
- 데이터 거버넌스 관리자 역할에 사용자 할당 - 거버넌스 도메인 만들기와 같은 애플리케이션 수준 권한을 사용자에게 부여할 수 있는 권한을 관리자에게 부여합니다.
- 거버넌스 도메인 빌드:
- 사용자에게 거버넌스 도메인 작성자 역할 할당
-
하나 이상의 거버넌스 도메인 만들기
팁
가이드를 사용하여 거버넌스 도메인 구조를 전략화합니다.
- 각 거버넌스 도메인에 하나 이상의 거버넌스 도메인 소유자를 할당합니다. 이 사용자는 이 거버넌스 도메인에서 사용되는 데이터에 대한 지원 및 의사 결정 기관입니다.
- Microsoft Purview 데이터 맵 데이터 원본을 등록한 다음 데이터 원본을 검사하여 메타데이터를 캡처합니다.
- 데이터 제품 빌드:
- 데이터 제품 소유자를 할당 하여 거버넌스 도메인에서 데이터 제품을 만듭니다. 거버넌스 도메인의 일상적인 시나리오와 데이터를 페어링할 수 있는 비즈니스 및 데이터 전문가여야 합니다.
-
거버넌스 도메인에 하나 이상의 데이터 제품을 만듭니다.
팁
좋은 데이터 제품을 빌드하는 방법에 대한 팁은 가이드 를 사용합니다.
- 거버넌스 도메인에서 사용자 카탈로그 판독기 권한을 할당하여 통합 카탈로그 데이터 제품을 보고 탐색할 수 있습니다.
비즈니스 개념과 데이터 연결
용어집 용어는 비즈니스 사용자를 위한 어휘를 제공합니다. 이러한 용어를 사용하면 실제 데이터 원본에서 상속된 추상 기술 용어를 사용하는 것과 비교했을 때 익숙한 어휘에서 데이터를 검색하고 작업할 수 있습니다.
OKR(목표 및 주요 결과) 은 거버넌스 도메인의 목표 또는 원하는 결과입니다(예: 매출 10% 증가 또는 지원 사례 3% 감소). 목표는 organization 수행하는 모든 것과 관련이 있어야 하며 결과를 달성하는 방법을 정의해야 합니다.
상태 관리 작업을 통해 사용자와 사용자는 데이터 자산 전체에서 데이터 상태 및 거버넌스를 개선하는 단계를 수행할 수 있습니다. 이러한 작업은 데이터 제품의 데이터 거버넌스 상태 제어 점수를 계산하기 위해 수행된 검사에 해당합니다. 이러한 작업을 해결하면 상태 점수가 높아지고 전체적으로 더 사용 가능하고 검색 가능한 통합 카탈로그 승격됩니다. 데이터 제품의 가치를 이해하면 다른 사용자가 해당 데이터에 대한 신뢰를 높이고 먼저 개선하는 데 집중할 데이터의 우선 순위를 지정하는 데 도움이 됩니다.
연결 작업 단계
- 거버넌스 도메인에서 사용자 데이터 관리자 권한을 할당하여 용어집 용어를 만들고 관리합니다. 이러한 사용자는 데이터 및 비즈니스 전문가여야 합니다. 정보를 큐레이팅하고 용어집 용어를 첨부하여 데이터를 이해할 수 있도록 하여 데이터 제품의 가치를 높입니다.
- 거버넌스 도메인에 하나 이상의 OKR을 만듭니다.
- 통합 카탈로그 사용자 데이터 상태 판독기 권한을 할당합니다. 이러한 사용자는 통합 카탈로그 사용 및 현재 거버넌스 점수를 모니터링하고 데이터 제품에 대한 신뢰를 구축하기 위한 조치를 취합니다.
- 거버넌스 도메인에 몇 가지 용어집 용어를 게시합니다.
- 거버넌스 도메인에서 사용자 데이터 관리자 권한을 할당하여 OKR을 만들고 관리합니다. 이러한 사용자는 비즈니스 리더가 데이터의 가치와 데이터 거버넌스의 중요성을 인식할 수 있도록 비즈니스 전략 전문가여야 합니다. 우선 순위를 지정하고 팀이 데이터를 빌드, 유지 관리 및 관리하는 방법을 전략화하여 인사이트를 만듭니다.
- 상태 제어를 검토 하여 현재 상태 관리에 대한 기준을 가져옵니다.
- 상태 작업을 검토 하여 데이터 거버넌스 여정에 대한 다음 단계를 고려합니다.
데이터 품질 개선 및 데이터 문제 제거
데이터 품질은 통합 카탈로그 구성되고 정의된 데이터 품질 규칙에 따라 organization 데이터 품질을 측정하는 것입니다.
데이터 품질 규칙은 정확도, 완전성, 적합성, 일관성, 타임라인 및 고유성과 같은 차원으로 데이터의 상태에 대한 설명을 제공합니다. 각 규칙이 실행되면 데이터가 원하는 상태에 얼마나 가까운지 설명하는 점수를 생성합니다.
데이터 프로파일링은 데이터 원본에서 사용할 수 있는 데이터를 검사하고 통계 및 정보를 수집하고 정의된 목표 집합에 따라 데이터의 품질 수준을 평가하는 프로세스입니다. 데이터가 품질이 좋지 않거나 organization 요구 사항을 충족하기 위해 통합할 수 없는 구조에서 관리되는 경우 비즈니스 프로세스 및 의사 결정에 영향을 줄 수 있습니다.
품질 작업 단계
- 모든 데이터 품질 기능을 사용하도록 사용자 데이터 품질 관리자 권한을 할당합니다 .
- 데이터 품질 평가를 위해 원본을 준비하도록 데이터 원본 연결을 설정합니다.
-
데이터 원본의 자산에 대한 데이터 프로파일링을 구성하고 실행합니다.
- 프로파일링이 완료되면 데이터 자산의 각 열에 대한 결과를 찾아 데이터의 현재 구조와 상태를 이해합니다.
- 프로파일링 결과에 따라 데이터 품질 규칙을 설정하고 데이터 자산에 적용합니다.
- 데이터 제품에서 데이터 품질 검사를 구성하고 실행 하여 데이터 제품의 지원되는 모든 자산의 품질을 평가합니다.
- 검사 결과를 검토 하여 데이터 제품의 현재 데이터 품질을 평가합니다.
주간 계획
다음은 주요 관련자와 함께 새 Microsoft Purview 데이터 거버넌스 솔루션 영역, 시나리오, 작업 및 가상 사용자를 계획하는 데 도움이 되는 참조 예제입니다.
주 1-2
영역 | 시나리오 | 작업 | 설명/결과 | 가상 사용자 |
---|---|---|---|---|
데이터 관리 | 카탈로그 설정 | 첫 번째 거버넌스 도메인 설정 | 거버넌스 도메인 scope, 사용량 및 소유자를 식별합니다. 거버넌스 도메인 소유자에게 책임을 할당하고, 첫 번째 거버넌스 도메인을 정의/만들고, 설명을 지정하고, 데이터 소유자를 할당합니다. 거버넌스 도메인을 설정하는 피드백을 캡처합니다. | 거버넌스 도메인 소유자 |
카탈로그 큐레이션 | 거버넌스 도메인에서 데이터 제품 만들기 | 관리, 게시 및 소유자를 위한 데이터의 scope 식별합니다. 데이터 제품, 설명, 사용 사례를 만들고, 소유권을 할당하고, 용어집 용어를 만들고 할당하여 데이터 소비자의 유용성을 높입니다. 데이터 제품에 데이터 자산을 매핑하고, 액세스 요청 시 데이터 소비자가 증명할 수 있는 액세스 정책을 만들고, 피드백을 캡처합니다(사업부에서 큐레이션을 관리/이해/소유하는 데 사용하기 용이함) | 데이터 제품 소유자/데이터 관리자 | |
Publication | 거버넌스 도메인 및 데이터 제품 게시 | 거버넌스 도메인 및 관련 데이터 제품을 게시하여 통합 카탈로그 환경을 통해 검색, 이해 및 액세스에 사용할 수 있도록 합니다. 데이터 소비자에게 글로벌 카탈로그 판독기 역할에 추가하여 첫 번째 거버넌스 도메인에 액세스하고 볼 수 있는 권한을 할당하고 게시를 사용하여 피드백을 캡처합니다. | 거버넌스 도메인 소유자 및 데이터 제품 소유자 | |
운영 | 데이터 거버넌스 및 관리 작업 | 운영 작업, 이해 관계자, 프로세스 및 절차를 평가하여 데이터 거버넌스 및 관리를 가능하게 하고, 현재 상태 데이터 거버넌스 정책, 사례 및 문화권에 대해 평가하여 개선/변경을 위한 잠재적 영역을 식별합니다. | 데이터 거버넌스 사무실 |
주 2-3
영역 | 시나리오 | 작업 | 설명/결과 | 가상 사용자 |
---|---|---|---|---|
데이터 검색, 이해 및 액세스 | 검색 및 액세스 | 제품 검색 통합 카탈로그 | 데이터 소비자와 사용자가 특정 비즈니스 목적으로 큐레이팅되고 개발된 데이터 제품을 검색하고 이해할 수 있도록 통합 카탈로그 제품 검색 환경을 연습합니다. 데이터 제품 메타데이터를 평가하여 데이터 소비자 비즈니스 결과에 대한 적절한 사용량, 데이터 품질 및 적용 가능성을 확인한 다음 액세스를 요청합니다. 사용자가 최근에 검토한 데이터 제품 및 구독한 데이터 제품에 대한 사용 편의성을 평가하여 전체 데이터 소비자 환경에 대한 피드백을 캡처합니다. | 데이터 소비자 |
데이터 관리 | 액세스 관리 | 액세스 요청 관리 | 첫 번째 거버넌스 도메인에서 데이터 제품에 대한 액세스 요청을 검토하고 승인하거나 거부합니다. 데이터 자산에 대한 승인을 위해 IT 소유자와 Engage. | 데이터 제품 소유자 |
카탈로그 큐레이션 | 데이터 제품 검색 가능성 검토 | 데이터 소비자 피드백과 함께 게시된 데이터 제품의 검색 가능성 및 유용성을 검토하여 의미 체계 지식 개선 기회(예: 용어집 용어, 알림 센터의 주의 항목에 대한 주의 등)를 알립니다. | 데이터 제품 소유자/데이터 관리자 |
주 3-4
영역 | 시나리오 | 작업 | 설명/결과 | 가상 사용자 |
---|---|---|---|---|
데이터 관리 | 데이터 품질 | 데이터 품질 개선 및 데이터 문제 줄이기 | 첫 번째 거버넌스 도메인별로 최상위 데이터 품질을 평가하고 연결(연결을 통해) 데이터 제품별 관련 데이터 자산에 대한 데이터 품질을 평가/설정합니다. 데이터 품질 프로파일링 데이터를 사용하여 품질 규칙 및 차원을 알리고 데이터 제품에 주요 데이터 자산을 설정합니다. 데이터 품질 검사(임시 또는 예약됨)를 실행하고, 데이터 품질 활동 및 검색을 모니터링하고, 대상 임계값을 통해 데이터 자산 상태를 사용하여 변경 내용을 알 수 있도록 경고를 설정합니다. 전반적인 데이터 품질 환경에 대한 피드백을 캡처합니다. | 데이터 품질 관리자 |
운영 | 데이터 거버넌스 및 관리 작업 | 운영 작업, 관련자, 프로세스 및 절차를 평가하여 데이터 거버넌스 및 관리 컨텍스트에서 데이터 품질을 사용하도록 설정합니다. 현재 상태 데이터 거버넌스 정책, 사례 및 문화권에 대해 평가하여 개선 또는 변경을 위한 잠재적 영역을 식별합니다. | 데이터 거버넌스 사무실 |
주 4-5
영역 | 시나리오 | 작업 | 설명/결과 | 가상 사용자 |
---|---|---|---|---|
상태 관리 | 보고서 | 데이터 거버넌스 관리 | 비즈니스 데이터 도메인 소유자와 함께 컨트롤을 검토하고 해당 컨트롤에 대한 보고를 정기적으로 검토합니다. 모임의 목표는 문제를 검토하고 비즈니스 요구 사항을 충족하는 데 필요한 솔루션 또는 데이터 제품의 우선 순위를 지정하는 것입니다. | 데이터 거버넌스 사무실 |
상태 작업 | 데이터 거버넌스 개선 | 컨트롤에 따라 작업을 수행하여 데이터 거버넌스를 개선하고 표준이 충족되는지 확인합니다. | 데이터 관리자/데이터 제품 소유자 |
통합 카탈로그 개요 페이지
통합 카탈로그 개요 페이지는 organization 사용자가 단계별 지침 및 비디오 데모를 사용하여 데이터 거버넌스 과정을 시작하고, 이 문서에 설명된 다양한 단계를 이해하고 탐색하는 데 도움이 됩니다.