Microsoft Purview(이전의 Azure Purview) 배포 모범 사례

이 문서는 Microsoft Purview(이전의 Azure Purview)를 데이터 자산의 프로덕션에 성공적으로 배포하기 위한 가이드입니다. 연구에서 프로덕션 환경 강화로 배포를 전략화하고 단계화하는 데 도움이 되며 배포 검사 목록과 함께 가장 잘 사용됩니다.

참고

이러한 모범 사례는 Microsoft Purview 통합 데이터 거버넌스 솔루션에 대한 배포를 다룹니다. Microsoft Purview 위험 및 규정 준수 솔루션에 대한 자세한 내용은 여기를 참조하세요. 일반적으로 Microsoft Purview에 대한 자세한 내용은 여기를 참조하세요.

엄격하게 기술적인 배포 가이드를 찾으려면 배포 검사 목록을 사용합니다.

Microsoft Purview를 배포하는 계획을 만들고 배포 전략을 개발할 때 모범 사례를 고려하려는 경우 아래 문서를 따릅니다. 이 가이드에서는 Microsoft Purview에 대한 배포 프로세스를 개발하기 위해 한 달 이상의 과정을 통해 단계적으로 작업을 완료할 수 있는 작업을 간략하게 설명합니다. Microsoft Purview를 이미 배포한 조직도 이 가이드를 사용하여 투자를 최대한 활용할 수 있습니다.

데이터 거버넌스 플랫폼의 잘 계획된 배포는 다음과 같은 이점을 제공할 수 있습니다.

  • 더 나은 데이터 검색
  • 향상된 분석 협업
  • 투자 수익률 최대화

이 가이드에서는 다음 단계에 따라 초기 계획부터 완성도 높은 환경에 이르기까지 전체 배포 수명 주기에 대한 인사이트를 제공합니다.

단계 설명
목표 및 목표 식별 전체 organization 데이터 거버넌스에서 원하는 것과 요구 사항을 고려합니다.
질문 수집 시작할 때 귀하와 팀이 어떤 질문을 할 수 있으며, 어디에서 문제를 해결할 수 있을까요?
프로덕션으로 이동하는 프로세스 만들기 organization 맞게 조정된 단계적 배포 전략을 만듭니다.
플랫폼 강화 배포를 성숙도로 계속 확장합니다.

Microsoft Purview의 많은 애플리케이션 및 기능에는 고유한 개별 모범 사례 페이지도 있습니다. 이 배포 가이드 전체에서 자주 참조되지만 개념모범 사례 및 지침의 목차에서 모두 찾을 수 있습니다.

목표 및 목표 식별

많은 조직에서 organization 격리된 그룹 및 데이터 도메인의 특정 요구 사항을 충족하는 개별 솔루션을 개발하여 데이터 거버넌스 여정을 시작했습니다. 환경은 업계, 제품 및 문화에 따라 달라질 수 있지만 대부분의 조직에서는 이러한 유형의 솔루션에 대한 일관된 제어 및 정책을 유지하기가 어렵습니다.

포괄적인 데이터 거버넌스 환경을 만들기 위해 초기 단계에서 식별할 수 있는 일반적인 데이터 거버넌스 목표 중 일부는 다음과 같습니다.

  • 데이터의 비즈니스 가치 최대화
  • 데이터 소비자가 데이터를 쉽게 찾고 해석하고 신뢰할 수 있는 데이터 문화권 사용
  • 일관된 데이터 환경을 제공하기 위해 다양한 사업부 간의 협업을 강화합니다.
  • 클라우드의 이점을 누릴 수 있도록 데이터 분석을 가속화하여 혁신 촉진
  • 다양한 기술 그룹에 대한 셀프 서비스 옵션을 통해 데이터를 검색하는 시간 감소
  • 고객에게 서비스를 개선하는 분석 솔루션 제공을 위한 출시 시간 단축
  • 도메인별 도구 및 지원되지 않는 기술의 사용으로 인한 운영 위험 감소

일반적인 접근 방식은 이러한 가장 중요한 목표를 다양한 범주와 목표로 분류하는 것입니다. 예를 들면 다음과 같습니다.

범주 목표
검색 관리 사용자는 Azure 및 비 Azure 데이터 원본(온-프레미스 원본 포함)을 검색하여 데이터 자산에 대한 정보를 자동으로 수집할 수 있어야 합니다.
분류 플랫폼은 데이터 샘플링에 따라 데이터를 자동으로 분류하고 사용자 지정 분류를 사용하여 수동 재정의를 허용해야 합니다.
소비 비즈니스 사용자는 비즈니스 및 기술 메타데이터 모두에 대한 각 자산에 대한 정보를 찾을 수 있어야 합니다.
계보 각 자산은 사용자가 원래 원본과 변경된 내용을 이해할 수 있도록 기본 데이터 세트의 그래픽 보기를 표시해야 합니다.
공동 작업 플랫폼은 사용자가 각 데이터 자산에 대한 추가 정보를 제공하여 공동 작업할 수 있도록 허용해야 합니다.
보고 사용자는 추가 보강이 필요한 중요한 데이터 및 데이터를 포함하여 데이터 자산에 대한 보고를 볼 수 있어야 합니다.
데이터 거버넌스 플랫폼은 관리자가 액세스 제어에 대한 정책을 정의하고 각 사용자에 따라 데이터 액세스를 자동으로 적용하도록 허용해야 합니다.
워크플로 플랫폼에는 플랫폼 내에서 다양한 작업을 쉽게 확장하고 자동화할 수 있도록 워크플로를 만들고 수정할 수 있는 기능이 있어야 합니다.
통합 티켓팅 또는 오케스트레이션과 같은 기타 타사 기술은 스크립트 또는 REST API를 통해 플랫폼에 통합할 수 있어야 합니다.

주요 시나리오 식별

Microsoft Purview 거버넌스 서비스는 클라우드 및 온-프레미스 환경에 걸쳐 있는 organization 데이터 자산에서 데이터 거버넌스를 중앙에서 관리하는 데 사용할 수 있습니다. 성공적인 구현을 위해서는 비즈니스에 중요한 주요 시나리오를 식별해야 합니다. 이러한 시나리오는 사업부 경계를 넘거나 업스트림 또는 다운스트림의 여러 사용자 가상 사용자에 영향을 줄 수 있습니다.

이러한 시나리오는 다양한 방법으로 작성할 수 있지만 다음 5개 차원 이상을 포함해야 합니다.

  1. 페르소나 – 사용자는 누구인가요?
  2. 원본 시스템 – Azure Data Lake Storage Gen2 또는 Azure SQL Database와 같은 데이터 원본은 무엇인가요?
  3. 영향 영역 – 이 시나리오의 범주는 무엇인가요?
  4. 세부 시나리오 – 사용자가 Microsoft Purview를 사용하여 문제를 해결하는 방법
  5. 예상 결과 – 성공 기준은 무엇인가요?

시나리오는 측정 가능한 결과가 있는 구체적이고 실행 가능하며 실행 가능해야 합니다. 사용할 수 있는 몇 가지 예제 시나리오:

시나리오 자세한 정보 가상 사용자
중요 비즈니스용 자산 카탈로그 그것이 무엇인지 잘 이해하려면 각 데이터 세트에 대한 정보가 있어야 합니다. 이 시나리오에는 카탈로그의 데이터 집합에 대한 비즈니스 및 기술 메타데이터 데이터가 모두 포함됩니다. 데이터 원본에는 Azure Data Lake Storage Gen2, Azure Synapse DW 및/또는 Power BI가 포함됩니다. 이 시나리오에는 SQL Server 같은 온-프레미스 리소스도 포함됩니다. 비즈니스 분석가, 데이터 과학자, 데이터 엔지니어
중요 비즈니스용 자산 검색 카탈로그의 모든 메타데이터를 검색할 수 있는 검색 엔진이 있어야 합니다. 와일드카드를 사용하여 단순하거나 복잡한 검색으로 기술 용어, 비즈니스 용어를 사용하여 검색할 수 있어야 합니다. 비즈니스 분석가, 데이터 과학자, 데이터 엔지니어, 데이터 관리
데이터를 추적하여 원본을 이해하고 데이터 문제 해결 보고서, 예측 또는 모델의 데이터를 원래 원본으로 다시 추적하려면 데이터 계보가 있어야 합니다. 또한 데이터에 대한 변경 내용과 데이터 수명 주기 전반에 걸쳐 데이터가 상주한 위치를 이해해야 합니다. 이 시나리오는 우선 순위가 지정된 데이터 파이프라인 Azure Data Factory 및 Databricks를 지원해야 합니다. 데이터 엔지니어, 데이터 과학자
중요한 데이터 자산에 대한 메타데이터 보강 자동으로 생성되는 기술 메타데이터를 사용하여 카탈로그의 데이터 집합을 보강해야 합니다. 분류 및 레이블 지정이 몇 가지 예입니다. 데이터 엔지니어, 도메인/비즈니스 소유자
친숙한 사용자 환경을 사용하여 데이터 자산 관리 비즈니스별 메타데이터에 대한 비즈니스 용어집이 있어야 합니다. 비즈니스 사용자는 셀프 서비스 시나리오에 Microsoft Purview를 사용하여 데이터에 주석을 달고 검색을 통해 데이터를 쉽게 검색할 수 있습니다. 도메인/비즈니스 소유자, 비즈니스 분석가, 데이터 과학자, 데이터 엔지니어

Microsoft Purview와 통합 지점

성숙한 organization 이미 기존 데이터 카탈로그를 가지고 있을 수 있습니다. 핵심 질문은 기존 기술을 계속 사용하고 Microsoft Purview 데이터 맵 동기화하고 Data Catalog 여부입니다. Microsoft Purview는 organization 기존 제품과의 동기화를 처리하기 위해 Atlas REST API를 제공합니다. Atlas API는 푸시 및 끌어오기 시나리오를 모두 처리하는 강력하고 유연한 메커니즘을 제공합니다. 정보는 부트스트랩을 위해 Atlas API를 사용하거나 다른 시스템에서 Microsoft Purview로 최신 업데이트를 푸시하기 위해 Microsoft Purview에 게시할 수 있습니다. Microsoft Purview에서 사용할 수 있는 정보는 Atlas API를 사용하여 읽은 다음 기존 제품으로 다시 동기화할 수도 있습니다.

티켓팅, 사용자 지정 사용자 인터페이스 및 오케스트레이션과 같은 다른 통합 시나리오의 경우 Atlas API 및 Kafka 엔드포인트를 사용할 수 있습니다. 일반적으로 Microsoft Purview와 네 가지 통합 지점이 있습니다.

  • 데이터 자산 – 이를 통해 Microsoft Purview는 해당 자산이 무엇인지 열거하고 해당 자산에 대해 쉽게 사용할 수 있는 메타데이터를 수집하기 위해 저장소의 자산을 검색할 수 있습니다. 따라서 SQL의 경우 DB, 테이블, 저장 프로시저, 뷰 및 구성 데이터가 과 같은 sys.tables위치에 보관된 목록일 수 있습니다. ADF(Azure Data Factory)와 같은 경우 모든 파이프라인을 열거하고 생성될 때 데이터를 가져오는 것, 마지막 실행, 현재 상태일 수 있습니다.
  • 계보 – 이를 통해 Microsoft Purview는 분석/데이터 변형 시스템에서 데이터가 이동하는 방식에 대한 정보를 수집할 수 있습니다. Spark와 같은 경우 Notebook 실행에서 정보를 수집하여 Notebook이 수집한 데이터, 전자 필기장을 변환하는 방법 및 출력 위치를 확인할 수 있습니다. SQL과 같은 경우 쿼리 로그를 분석하여 실행된 변형 작업과 실행된 작업을 리버스 엔지니어링할 수 있습니다. 필요에 따라 푸시 및 끌어오기 기반 계보를 모두 지원합니다.
  • 분류 – 이를 통해 Microsoft Purview는 데이터 원본에서 물리적 샘플을 가져와 분류 시스템을 통해 실행할 수 있습니다. 분류 시스템은 데이터 조각의 의미 체계를 파악합니다. 예를 들어 파일이 Parquet 파일이며 세 개의 열이 있고 세 번째 열이 문자열임을 알 수 있습니다. 그러나 샘플에서 실행하는 분류자는 문자열이 이름, 주소 또는 전화 번호임을 알려줍니다. 이 통합 지점을 조명한다는 것은 Microsoft Purview가 Notebook, 파이프라인, parquet 파일, 테이블 및 컨테이너와 같은 개체를 여는 방법을 정의했음을 의미합니다.
  • 포함된 환경 – 환경(예: ADF, Synapse, SQL Studio, PBI 및 Dynamics)과 같은 "스튜디오"가 있는 제품은 일반적으로 사용자가 상호 작용하려는 데이터를 검색하고 데이터를 출력할 위치를 찾을 수 있도록 합니다. Microsoft Purview의 카탈로그는 포함 환경을 제공하여 이러한 환경을 가속화하는 데 도움이 될 수 있습니다. 이 환경은 파트너의 옵션에서 API 또는 UX 수준에서 발생할 수 있습니다. Microsoft Purview에 대한 호출을 포함하면 organization Microsoft Purview의 데이터 자산 맵을 활용하여 데이터 자산을 찾고 계보, 검사 스키마, 등급, 연락처 등을 확인할 수 있습니다.

질문 수집

organization 높은 수준의 목표와 목표에 동의하면 여러 그룹에서 많은 질문이 있을 것입니다. 모든 문제를 해결하기 위한 계획을 세우기 위해 이러한 질문을 수집하는 것이 중요합니다. 이러한 질문을 수집할 때 관련 그룹을 포함 해야 합니다. 설명서를 사용하여 답변을 시작할 수 있습니다.

초기 단계에서 발생할 수 있는 몇 가지 예제 질문:

이러한 질문의 대부분에 대한 답변이 즉시 제공되지 않더라도 질문을 수집하면 organization 이 프로젝트를 구성하고 모든 "필수" 요구 사항을 충족할 수 있도록 할 수 있습니다.

올바른 관련자 포함

전체 organization Microsoft Purview를 구현하는 데 성공하려면 올바른 관련자를 참여시키는 것이 중요합니다. 초기 단계에는 소수의 사용자만 참여합니다. 그러나 scope 확장되면 프로젝트에 기여하고 피드백을 제공하기 위해 더 많은 가상 사용자가 필요합니다.

포함할 수 있는 몇 가지 주요 관련자:

가상 사용자 역할
최고 데이터 책임자 CDO는 데이터 관리, 데이터 품질, master 데이터 관리, 데이터 과학, 비즈니스 인텔리전스 및 데이터 전략 생성을 포함할 수 있는 다양한 기능을 감독합니다. Microsoft Purview 구현 프로젝트의 후원자가 될 수 있습니다.
도메인/비즈니스 소유자 도구 사용에 영향을 미치고 예산을 제어할 수 있는 비즈니스 담당자
데이터 분석가 비즈니스 문제를 해결하고 데이터를 분석하여 리더가 비즈니스 의사 결정을 내릴 수 있도록 지원
데이터 설계자 데이터 보안 설계 및 구현과 함께 중요 업무용 기간 업무 앱용 데이터베이스 디자인
데이터 엔지니어 데이터 스택 작동 및 유지 관리, 다른 원본에서 데이터 끌어오기, 데이터 통합 및 준비, 데이터 파이프라인 설정
데이터 과학자 분석 모델 빌드 및 API에서 액세스할 데이터 제품 설정
DB 관리 SLA(서비스 수준 계약) 내에서 데이터베이스 관련 인시던트 및 요청을 소유, 추적 및 resolve. 데이터 파이프라인을 설정할 수 있음
DevOps 기간 업무 애플리케이션 개발 및 구현; 스크립트 작성 및 오케스트레이션 기능이 포함될 수 있습니다.
데이터 보안 전문가 Microsoft Purview에서 들어오고 나가는 데이터가 포함된 전체 네트워크 및 데이터 보안 평가

프로덕션으로 이동하는 프로세스 만들기

아래에서는 각 단계에 대한 작업, 유용한 링크 및 수용 조건을 포함하는 잠재적인 4단계 배포 계획을 제공했습니다.

  1. 1단계: 파일럿
  2. 2단계: 실행 가능한 최소 제품
  3. 3단계: 사전 프로덕션
  4. 4단계: 프로덕션

1단계: 파일럿

이 단계에서는 소규모 사용자 집합에 대해 Microsoft Purview를 만들고 구성해야 합니다. 일반적으로 엔드투엔드 시나리오를 실행하기 위해 함께 작업하는 2~3명의 사용자 그룹일 뿐입니다. 그들은 organization Microsoft Purview의 옹호자로 간주됩니다. 이 단계의 기본 목표는 주요 기능을 충족하고 올바른 이해 관계자가 프로젝트를 인식할 수 있도록 하는 것입니다.

완료할 작업

작업 자세한 정보 기간
요구 사항에 대한 동의 수집 & 모든 관련자와 논의하여 전체 요구 사항 집합을 수집합니다. 프로젝트의 각 단계에 대해 완료해야 하는 요구 사항의 하위 집합에 동의하려면 다른 가상 사용자가 참여해야 합니다. 1주일
Microsoft Purview 거버넌스 포털 탐색 홈페이지에서 Microsoft Purview를 사용하는 방법을 이해합니다. 1일
계보에 대한 ADF 구성 주요 파이프라인 및 데이터 자산을 식별합니다. 내부 ADF 계정에 연결하는 데 필요한 모든 정보를 수집합니다. 1일
Azure Data Lake Storage Gen2 또는 SQL 서버와 같은 데이터 원본을 검사합니다. 데이터 원본을 추가하고 검사를 설정합니다. 검사가 모든 자산을 성공적으로 검색하는지 확인합니다. 2일
검색찾아보기 최종 사용자가 Microsoft Purview에 액세스하고 엔드 투 엔드 검색 및 찾아보기 시나리오를 수행할 수 있도록 허용합니다. 1일

수용 기준

  • Microsoft Purview 계정은 organization 테넌트 아래의 organization 구독에서 성공적으로 생성됩니다.
  • 여러 역할이 있는 소규모 사용자 그룹은 Microsoft Purview에 액세스할 수 있습니다.
  • Microsoft Purview는 하나 이상의 데이터 원본을 검사하도록 구성됩니다.
  • 사용자는 다음과 같은 Microsoft Purview의 키 값을 추출할 수 있어야 합니다.
    • 검색 및 찾아보기
    • 계보
  • 사용자는 자산 페이지에서 자산 소유권을 할당할 수 있어야 합니다.
  • 주요 이해 관계자에 대한 인식을 높이기 위한 프레젠테이션 및 데모.
  • MVP 단계에 대한 더 많은 리소스를 승인하기 위해 관리에서 구매합니다.

2단계: 실행 가능한 최소 제품

Microsoft Purview를 온보딩하기 위해 합의된 요구 사항 및 참여 사업부가 있는 경우 다음 단계는 MVP(최소 실행 가능한 제품) 릴리스에서 작업하는 것입니다. 이 단계에서는 Microsoft Purview의 사용을 수평 및 세로로 더 많은 요구 사항이 있는 더 많은 사용자로 확장합니다. 용어집 용어, 검색 및 찾아보기와 같은 모든 사용자에 대해 수평적으로 충족해야 하는 주요 시나리오가 있습니다. 또한 각 사업부 또는 그룹이 Azure Data Lake Storage 계보에서 Azure Synapse DW에서 Power BI로의 계보와 같은 특정 엔드투엔드 시나리오를 다루기 위해 수직적으로 요구 사항이 있습니다.

완료할 작업

작업 자세한 정보 기간
Azure Synapse 분석 검사 데이터베이스 원본 온보딩을 시작하고 검사하여 키 자산을 채웁니다. 2일
사용자 지정 분류 및 규칙 만들기 자산을 검사하면 사용자는 Microsoft Purview의 기본 분류 외에 더 많은 분류에 대한 다른 사용 사례가 있음을 인식할 수 있습니다. 2-4주
Power BI 검사 organization Power BI를 사용하는 경우 스토리지 계층의 계보를 포함해야 하는 요구 사항이 있는 데이터 과학자 또는 데이터 분석가가 사용하는 모든 데이터 자산을 수집하기 위해 Power BI를 검색할 수 있습니다. 1-2주
용어집 용어 가져오기 대부분의 경우 organization 이미 자산에 대한 용어집 용어집 용어 및 용어 할당 컬렉션을 개발할 수 있습니다. 이렇게 하려면 .csv 파일을 통해 Microsoft Purview로 가져오기 프로세스가 필요합니다. 1주일
자산에 연락처 추가 상위 자산의 경우 다른 가상 사용자가 연락처를 할당하거나 REST API를 통해 가져올 수 있도록 프로세스를 설정할 수 있습니다. 1주일
중요한 레이블 추가 및 검사 이는 Microsoft 365의 레이블 지정 사용에 따라 일부 조직에서 선택 사항일 수 있습니다. 1-2주
분류 및 중요한 인사이트 가져오기 Microsoft Purview의 보고 및 인사이트를 위해 이 기능에 액세스하여 다양한 보고서를 얻고 경영진에게 프레젠테이션을 제공할 수 있습니다. 1일
Microsoft Purview 관리되는 사용자를 사용하여 더 많은 사용자 온보딩 이 단계에서는 Microsoft Purview 관리 Azure Active Directory 관리 협력하여 Microsoft Purview에 대한 액세스 권한을 부여할 새 보안 그룹을 설정해야 합니다. 1주일

수용 기준

  • 더 큰 사용자 그룹을 Microsoft Purview에 성공적으로 온보딩(50 이상)
  • 중요 비즈니스용 데이터 원본 검사
  • 모든 중요 용어집 용어집 용어 가져오기 및 할당
  • 주요 자산에 대한 중요한 레이블 지정을 성공적으로 테스트했습니다.
  • 참여 사업부 사용자에 대한 최소 시나리오를 충족했습니다.

3단계: 사전 프로덕션

MVP 단계가 지나면 사전 프로덕션 마일스톤을 계획해야 합니다. SQL Server 같은 온-프레미스 데이터 원본에 대한 검사를 포함할 수 있습니다. Microsoft Purview에서 지원하지 않는 데이터 원본에 차이가 있는 경우 Atlas API를 탐색하여 다른 옵션을 이해해야 합니다.

완료할 작업

작업 자세한 정보 기간
검사 규칙 집합을 사용하여 검사 구체화 organization 사전 프로덕션을 위한 많은 데이터 원본이 있습니다. 분류 및 파일 확장자를 전반적으로 일관되게 적용할 수 있도록 검사에 대한 주요 기준을 미리 정의하는 것이 중요합니다. 1~2일
원본 페이지를 확인하여 각 원본에 대한 검색에 대한 지역 가용성 평가 데이터 원본의 지역 및 규정 준수 및 보안에 대한 조직의 요구 사항에 따라 검사에 사용할 수 있어야 하는 지역을 고려할 수 있습니다. 1일
검사할 때 방화벽 개념 이해 이 단계에서는 organization 방화벽을 구성하는 방법과 Microsoft Purview가 검사를 위해 데이터 원본에 액세스하기 위해 자신을 인증하는 방법에 대한 몇 가지 탐색이 필요합니다. 1일
검사할 때 Private Link 개념 이해 organization Private Link 사용하는 경우 요구 사항의 일부로 Private Link 포함하도록 네트워크 보안의 기초를 마련해야 합니다. 1일
온-프레미스 SQL Server 검사 온-프레미스 SQL Server 있는 경우 선택 사항입니다. 검사를 수행하려면 자체 호스팅 Integration Runtime 설정하고 SQL Server 데이터 원본으로 추가해야 합니다. 1-2주
통합 시나리오에 Microsoft Purview REST API 사용 오케스트레이션 또는 티켓 시스템과 같은 다른 타사 기술과 Microsoft Purview를 통합해야 하는 요구 사항이 있는 경우 REST API 영역을 탐색할 수 있습니다. 1-4주
Microsoft Purview 가격 책정 이해 이 단계에서는 organization 중요한 재무 정보를 제공하여 결정을 내릴 수 있습니다. 1~5일

수용 기준

  • 모든 사용자와 함께 하나 이상의 사업부를 성공적으로 온보딩
  • SQL Server 같은 온-프레미스 데이터 원본 검사
  • REST API를 사용하는 POC 하나 이상의 통합 시나리오
  • 인프라 및 보안에 대한 주요 영역을 포함해야 하는 프로덕션으로 이동하는 계획을 완료합니다.

4단계: 프로덕션

위의 단계를 따라 효과적인 데이터 수명 주기 관리를 만들어야 하며, 이는 더 나은 거버넌스 프로그램의 기초입니다. 데이터 거버넌스는 organization AI, Hadoop, IoT 및 블록체인과 같은 증가하는 추세에 대비하는 데 도움이 됩니다. 데이터와 분석의 시작에 불과하며, 더 많은 것을 논의할 수 있습니다. 이 솔루션의 결과는 다음을 제공합니다.

  • 비즈니스 중심 - 기술 요구 사항에 대한 비즈니스 요구 사항 및 시나리오에 부합하는 솔루션입니다.
  • 미래 준비 - 솔루션은 플랫폼의 기본 기능을 최대화하고 플랫폼의 발전/발전을 지원하기 위해 구성 또는 스크립팅 활동에 표준화된 업계 사례를 사용합니다.

완료할 작업

작업 자세한 정보 기간
방화벽을 사용하도록 설정된 프로덕션 데이터 원본 검사 방화벽이 있는 경우 선택 사항이지만 인프라를 강화하는 옵션을 탐색하는 것이 중요합니다. 1~5일
Private Link 사용 Private Link 사용할 때 선택 사항인 경우 그렇지 않으면 Private을 사용할 때 필수 조건이므로 건너뛸 수 있습니다. 1~5일
자동화된 워크플로 만들기 워크플로는 승인, 에스컬레이션, 검토 및 문제 관리와 같은 프로세스를 자동화하는 데 중요합니다. 2-3주
작업 설명서 만들기 데이터 거버넌스는 일회성 프로젝트가 아닙니다. 데이터 기반 의사 결정을 촉진하고 비즈니스 기회를 창출하는 지속적인 프로그램입니다. 주요 절차 및 비즈니스 표준을 문서화하는 것이 중요합니다. 1주일

수용 기준

  • 모든 사업부 및 해당 사용자를 성공적으로 온보딩
  • 프로덕션을 위한 인프라 및 보안 요구 사항을 성공적으로 충족
  • 사용자가 요구하는 모든 사용 사례를 성공적으로 충족

플랫폼 강화

더 많은 강화 단계를 수행할 수 있습니다.

  • 방화벽 리소스에 대한 검사를 사용하도록 설정하거나 Private Link 사용하여 보안 태세를 강화합니다.
  • scope 검사를 미세 조정하여 검사 성능 향상
  • REST API를 사용하여 백업 및 복구를 위한 중요한 메타데이터 및 속성 내보내기
  • 워크플로를 사용하여 티켓팅 및 이벤트를 자동화하여 사용자 오류를 방지합니다.
  • 정책을 사용하여 Microsoft Purview 거버넌스 포털을 통해 데이터 자산에 대한 액세스를 관리합니다.

수명 주기 고려 사항

프로덕션 프로세스에 포함할 또 다른 중요한 측면은 분류 및 레이블을 마이그레이션하는 방법입니다. Microsoft Purview에는 90개 이상의 시스템 분류자를 보유하고 있습니다. 파일, 테이블 또는 열 자산에 시스템 또는 사용자 지정 분류를 적용할 수 있습니다. 분류는 주체 태그와 같으며 검사하는 동안 데이터 자산 내에 있는 특정 형식의 콘텐츠를 표시하고 식별하는 데 사용됩니다. 민감도 레이블은 조직 데이터 내에서 분류 유형의 범주를 식별한 다음 각 범주에 적용하려는 정책을 그룹화하는 데 사용됩니다. Microsoft 365와 동일한 중요한 정보 유형을 사용하여 전체 콘텐츠 및 데이터 자산에서 기존 보안 정책 및 보호를 확장할 수 있습니다. 문서를 검사하고 자동으로 분류할 수 있습니다. 예를 들어 multiple.docx 라는 파일이 있고 해당 콘텐츠에 국가 ID 번호가 있는 경우 Microsoft Purview는 자산 세부 정보 페이지에 EU 국가 식별 번호와 같은 분류를 추가합니다.

Microsoft Purview 데이터 맵 카탈로그 관리자가 수명 주기 동안 일관성 및 유지 관리 모범 사례를 보장해야 하는 몇 가지 영역이 있습니다.

  • 데이터 자산 – 데이터 원본을 환경 간에 다시 검사해야 합니다. 개발 환경에서만 검사한 다음 프로덕션에서 API를 사용하여 다시 생성하는 것은 권장되지 않습니다. 기본 이유는 Microsoft Purview 스캐너가 데이터 자산의 백그라운드에서 훨씬 더 많은 "배선"을 수행하므로 다른 Microsoft Purview instance 이동하는 것이 복잡할 수 있습니다. 프로덕션 환경에서 동일한 데이터 원본을 추가하고 원본을 다시 검사하는 것이 훨씬 쉽습니다. 일반적인 모범 사례는 사용 중인 모든 검사, 연결 및 인증 메커니즘에 대한 설명서를 사용하는 것입니다.
  • 검사 규칙 집합 – 검색할 파일 형식 및 분류와 같은 특정 검사에 할당된 규칙의 컬렉션입니다. 검사 규칙 집합이 많지 않은 경우 프로덕션을 통해 수동으로 다시 만들 수 있습니다. 이를 위해서는 내부 프로세스와 좋은 설명서가 필요합니다. 그러나 규칙 집합이 매일 또는 매주 변경되는 경우 REST API 경로를 탐색하여 해결할 수 있습니다.
  • 사용자 지정 분류 – 분류도 정기적으로 변경되지 않을 수 있습니다. 배포의 초기 단계에서는 사용자 지정 분류를 마련하기 위해 다양한 요구 사항을 이해하는 데 다소 시간이 걸릴 수 있습니다. 그러나 일단 해결되면 거의 변화가 필요하지 않습니다. 따라서 여기서는 사용자 지정 분류를 수동으로 마이그레이션하거나 REST API를 사용하는 것이 좋습니다.
  • 용어집 – UX를 통해 용어집 용어를 내보내고 가져올 수 있습니다. 자동화 시나리오의 경우 REST API를 사용할 수도 있습니다.
  • 리소스 집합 패턴 정책 – 이 기능은 모든 일반적인 조직이 적용할 수 있도록 고급입니다. 경우에 따라 Azure Data Lake Storage 폴더 명명 규칙 및 Microsoft Purview에서 리소스 집합을 생성하는 데 문제가 발생할 수 있는 특정 구조가 있습니다. 비즈니스 단위는 비즈니스 요구 사항에 맞게 더 많은 사용자 지정을 사용하여 리소스 집합 생성을 변경할 수도 있습니다. 이 시나리오에서는 REST API를 통해 모든 변경 내용을 추적하고 외부 버전 관리 플랫폼을 통해 변경 내용을 문서화하는 것이 가장 좋습니다.
  • 역할 할당 – Microsoft Purview에 대한 액세스 권한이 있는 사용자와 권한이 있는 사용자를 제어하는 위치입니다. Microsoft Purview에는 사용자 및 역할의 내보내기 및 가져오기를 지원하는 REST API도 있지만 Atlas API와 호환되지는 않습니다. 대신 Azure 보안 그룹을 할당하고 그룹 멤버 자격을 관리하는 것이 좋습니다.

테넌트 이동

테넌트 이동은 현재 Microsoft Purview에서 지원되지 않습니다.

다음 단계