다음을 통해 공유


Microsoft Purview 데이터 맵 대한 가격 책정

이 가이드에서는 Microsoft Purview 거버넌스 포털의 데이터 맵에 대한 가격 책정 지침을 설명합니다.

Microsoft Purview(이전의 Azure Purview)에 대한 전체 가격 책정 지침 세부 정보는 가격 책정 지침 개요를 참조하세요.

특정 가격 정보는 Microsoft Purview(이전의 Azure Purview) 가격 책정 페이지를 참조하세요. 이 문서에서는 Microsoft Purview 데이터 맵 가격 책정에 영향을 주는 기능 및 요소를 안내합니다.

Microsoft Purview 데이터 맵 가격 책정에 영향을 미치는 직접 비용은 다음 세 가지 차원을 기반으로 합니다.

탄력적 데이터 맵

  • 데이터 맵은 Microsoft Purview 거버넌스 포털 아키텍처의 기초이므로 지정된 시점에서 데이터 자산의 자산 정보를 최신 상태로 유지해야 합니다.

  • 데이터 맵은 CU( 용량 단위 )로 청구됩니다. 카탈로그가 최대 10GB의 메타데이터 스토리지를 저장하고 최대 25개의 데이터 맵 작업/초를 제공하는 경우 데이터 맵은 하나의 CU에서 프로비전됩니다.

  • 계정이 처음 생성될 때 데이터 맵은 항상 하나의 CU에서 프로비전됩니다.

  • 그러나 데이터 맵은 작업 처리량메타데이터 스토리지의 두 가지 주요 요소와 관련하여 데이터 맵의 변경 내용을 수용하기 위해 해당 탄력성 창의 최소 및 최대 제한 사이에서 자동으로 크기 조정됩니다.

작업 처리량

  • 데이터 맵에서 수행되는 만들기, 읽기, 업데이트, 삭제 작업을 기반으로 하는 이벤트 기반 요소
  • 데이터 맵 작업의 몇 가지 예는 다음과 같습니다.
    • 데이터 맵에서 자산 만들기
    • 소유자, 관리자, 부모, 계보와 같은 자산에 관계 추가
    • 설명, 용어집 용어와 같은 비즈니스 메타데이터를 추가하도록 자산 편집
    • 검색 결과 페이지에 대한 키워드 검색 반환 결과
    • API를 사용하여 정보 가져오기 또는 내보내기
  • 데이터 맵에서 여러 쿼리가 실행되는 경우 I/O 작업 수도 증가하여 데이터 맵이 확장됩니다.
  • 또한 동시 사용자 수는 데이터 맵 용량 단위를 제어하는 요인을 형성합니다.
  • 고려해야 할 다른 요인은 검색 쿼리 유형, API 상호 작용, 워크플로, 승인 등입니다.
  • 데이터 버스트 수준
    • 더 많은 작업/초 처리량이 필요한 경우 데이터 맵은 탄력적 창 내에서 자동 크기 조정하여 변경된 부하를 충족할 수 있습니다.
    • 이는 예측하고 계획해야 하는 버스트 특성을 구성합니다.
    • 버스트 특성은 버스트가 존재하는 버스트 수준버스트 지속 시간 으로 구성됩니다.
      • 버스트 수준은 안정적인 상태에서 예상되는 일관된 탄력성의 곱하기 인덱스입니다.
      • 버스트 기간은 메타데이터 증가 또는 데이터 맵의 작업 수 증가로 인해 이러한 버스트(탄력적)가 예상되는 월의 백분율입니다.

메타데이터 스토리지

  • 자산 수가 데이터 자산에서 감소하고 후속 증분 검사를 통해 데이터 맵에서 제거되면 스토리지 구성 요소가 자동으로 감소하여 데이터 맵이 축소됩니다.

자동화된 검사, 분류 및 수집

Microsoft Purview 데이터 맵 메타데이터 수집을 트리거할 수 있는 두 가지 주요 자동화된 프로세스가 있습니다.

  • 네이티브 커넥터를 사용하여 자동 검색 이 프로세스에는 다음 세 가지 기본 단계가 포함됩니다.

    • 메타데이터 검사
    • 자동 분류
    • Microsoft Purview 데이터 맵 메타데이터 수집
  • Azure Data Factory 및/또는 Azure Synapse 파이프라인을 사용한 자동화된 수집입니다. 이 프로세스에는 다음이 포함됩니다.

    • 계정이 Azure Data Factory 또는 Azure Synapse 파이프라인에 연결된 경우 메타데이터 및 계보를 Microsoft Purview 데이터 맵 수집합니다.

네이티브 커넥터를 사용하여 자동 검사

  • 전체 검사는 데이터 원본의 선택한 scope 내의 모든 자산을 처리하는 반면, 증분 검사는 이전의 성공적인 검사 이후 생성, 수정 또는 삭제된 자산을 검색하고 처리합니다.

  • 모든 검사(전체 또는 증분 검사)는 업데이트, 수정 또는 삭제된 자산을 선택합니다.

  • 서로 다른 부서에 속한 여러 사용자 또는 그룹이 동일한 데이터 원본에 대한 검사를 설정하여 중복 검사에 대한 가격 책정을 높일 때 시나리오를 고려하고 피하는 것이 중요합니다.

  • 데이터 자산의 변경 내용에 맞춰 초기 전체 검사를 게시하는 빈도 증분 검사를 예약합니다. 이렇게 하면 데이터 맵이 항상 최신 상태로 유지되고 증분 검사는 전체 검사에 비해 더 적은 v 코어 시간을 소비합니다.

  • 데이터 원본에 대한 "세부 정보 보기" 링크를 사용하면 사용자가 전체 검사를 실행할 수 있습니다. 그러나 검사 규칙 집합(분류/파일 형식)이 변경된 경우를 제외하고 최적화된 검사에 대한 전체 검사 후 증분 검사를 실행하는 것이 좋습니다.

  • 부모 컬렉션에 데이터 원본을 등록 하고 다른 액세스 제어를 사용하여 자식 컬렉션에서 범위 검사를 등록하여 중복 검사 비용이 수반되지 않도록 합니다.

  • 컬렉션 권한 부여를 사용하여 세분화된 액세스 제어데이터 원본 관리자 역할을 통해 검사를 위해 데이터 원본을 등록할 수 있는 사용자를 줄입니다. 이렇게 하면 유효한 데이터 원본만 등록할 수 있으며 v 코어 시간 검사를 제어하여 검사 비용이 절감됩니다.

  • 데이터 원본의 유형과 검사되는 자산 수가 검사 기간에 영향을 미친다는 점을 고려합니다.

  • 사용자 지정 검사 규칙 집합을 만들어 최적의 스캐너 사용을 보장하기 위해 비즈니스 요구 사항과 관련된 데이터 자산 및 분류에서 사용할 수 있는 파일 형식의 하위 집합만 포함합니다.

  • 데이터 원본에 대한 새 검사를 만드는 동안 실제로 검사를 실행하기 전에 권장되는 준비 순서 를 따릅니다. 여기에는 여러 검사를 방지하고 누락된 요구 사항을 통해 여러 검사에 대한 불필요한 비용을 제어하기 위해 적절한 검사 규칙 집합을 정의할 수 있도록 비즈니스별 분류파일 형식 (스토리지 계정의 경우)에 대한 요구 사항을 수집하는 것이 포함됩니다.

  • 가상 머신에 연결된 추가 비용을 방지하기 위해 검사 일정을 SHIR(Self-Hosted Integration Runtime) VM(Virtual Machines) 크기에 맞춥니다.

Azure Data Factory 및/또는 Azure Synapse 파이프라인을 사용한 자동화된 수집

  • 메타데이터 및 계보는 원본 시스템에서 파이프라인이 실행될 때마다 Azure Data Factory 또는 Azure Synapse 파이프라인에서 수집됩니다.

고급 리소스 집합

  • Microsoft Purview 데이터 맵 리소스 집합을 사용하여 데이터 레이크의 모든 파일을 검색하고 패턴(GUID, 지역화 패턴 등)을 찾아 데이터 맵에서 단일 자산으로 그룹화하는 기능을 제공하여 많은 수의 데이터 자산을 단일 논리 리소스에 매핑하는 문제를 해결합니다.

  • 고급 리소스 집합 은 고객이 총 크기, 파티션 수 등과 같이 계산된 보강된 리소스 집합 정보를 가져올 수 있도록 하고 패턴 규칙을 통해 리소스 집합 그룹화를 사용자 지정할 수 있는 선택적 기능입니다. 고급 리소스 집합 기능을 사용하도록 설정하지 않은 경우 데이터 카탈로그에는 집계된 속성이 없는 리소스 집합 자산이 계속 포함됩니다. 이 경우 고객에게 청구되는 "리소스 집합" 미터는 없습니다.

  • Microsoft Purview 데이터 맵 고급 리소스 집합을 켜기 전에 기본 리소스 집합 기능을 사용하여 요구 사항이 충족되는지 확인합니다.

  • 다음과 같은 경우 고급 리소스 집합을 켜는 것이 좋습니다.

    • 데이터 레이크 스키마는 지속적으로 변화하고 있으며, Microsoft Purview 데이터 맵 #partitions, 데이터 자산의 크기 등과 같은 매개 변수를 서비스로 계산할 수 있도록 기본 리소스 집합 기능 이외의 더 많은 가치를 찾고 있습니다.
    • 리소스 집합 자산이 그룹화되는 방법을 사용자 지정해야 합니다.
  • 고급 리소스 집합에 대한 청구는 오프라인 계층에서 리소스 집합 정보를 집계하는 데 사용하는 컴퓨팅을 기반으로 하며 카탈로그의 리소스 집합 크기/수에 따라 달라집니다.

다음 단계