Microsoft Purview データ マップの価格
このガイドでは、Microsoft Purview ガバナンス ポータルのデータ マップの価格ガイドラインについて説明します。
Microsoft Purview (旧称 Azure Purview) の完全な価格ガイドラインの詳細については、価格ガイドラインの概要に関するページを参照してください。
具体的な価格の詳細については、 Microsoft Purview (旧称 Azure Purview) の価格に関するページを参照してください。 この記事では、Microsoft Purview データ マップの価格に影響を与える機能と要因について説明します。
Microsoft Purview データ マップの価格に影響する直接コストは、次の 3 つのディメンションに基づいています。
エラスティック データ マップ
データ マップは Microsoft Purview ガバナンス ポータル アーキテクチャの基盤であるため、特定の時点でデータ資産の資産情報を最新の状態にする必要があります
データ マップは、 容量ユニット (CU) の観点から課金されます。 カタログが最大 10 GB のメタデータ ストレージを格納し、1 秒に最大 25 のデータ マップ操作を提供する場合、データ マップは 1 つの CU でプロビジョニングされます
データ マップは、アカウントが最初に作成されたときに常に 1 つの CU でプロビジョニングされます
ただし、データ マップは、操作スループットとメタデータ ストレージという 2 つの重要な要因に関するデータ マップの変更に対応するために、その弾力性ウィンドウの最小と最大の制限の間で自動的にスケーリングされます
操作スループット
- データ マップに対して実行された作成、読み取り、更新、削除の操作に基づくイベント ドリブンファクター
- データ マップ操作の例を次に示します。
- Data Map での資産の作成
- 所有者、スチュワード、親、系列などの資産へのリレーションシップの追加
- 資産を編集して、説明、用語集の用語などのビジネス メタデータを追加する
- 検索結果ページに結果を返すキーワード検索
- API を使用した情報のインポートまたはエクスポート
- データ マップで複数のクエリが実行されている場合、I/O 操作の数も増え、データ マップのスケールアップが発生します
- 同時ユーザーの数は、データ マップ容量ユニットを制御する要素も形成します
- 考慮すべきその他の要因は、検索クエリの種類、API の相互作用、ワークフロー、承認などです。
- データ バースト レベル
- より多くの操作/秒スループットが必要な場合、データ マップは弾力性ウィンドウ内で自動スケーリングして、変更された負荷に対応できます
- これは、推定して計画する必要がある バースト特性 を構成します。
- バースト特性は、 バースト レベル とバーストが存在する バースト期間 で構成されます。
- バースト レベルは、安定した状態で予想される一貫性のある弾力性の乗算インデックスです
- バースト期間は、メタデータの増加またはデータ マップに対する操作の数が多いため、このようなバースト (弾力性) が予想される月の割合です。
メタデータ ストレージ
- 資産の数がデータ資産内で減少し、その後の増分スキャンによってデータ マップ内で削除された場合、ストレージ コンポーネントは自動的に削減され、データ マップのスケールダウンが行われます
自動スキャン、分類、インジェスト
Microsoft Purview データ マップへのメタデータの取り込みをトリガーできる 2 つの主要な自動化プロセスがあります。
ネイティブ コネクタを使用した自動スキャン。 このプロセスには、次の 3 つのメイン手順が含まれます。
- メタデータ スキャン
- 自動分類
- Microsoft Purview データ マップへのメタデータの取り込み
Azure Data FactoryまたはAzure Synapse パイプラインを使用した自動インジェスト。 通常、このプロセスには次のものが含まれます。
- アカウントが任意のAzure Data FactoryまたはAzure Synapseパイプラインに接続されている場合は、Microsoft Purview データ マップへのメタデータと系列の取り込み。
ネイティブ コネクタを使用した自動スキャン
フル スキャンは、データ ソースの選択したスコープ内のすべての資産を処理しますが、増分スキャンでは、前回の正常なスキャン以降に作成、変更、または削除された資産が検出され、処理されます。
すべてのスキャン (完全スキャンまたは増分スキャン) は 、更新、変更、または削除された 資産を選択します
異なる部門に属する複数のユーザーまたはグループが同じデータ ソースのスキャンを設定し、重複スキャンの価格を高めるシナリオを考慮し、回避することが重要です
データ資産の変更に合わせて最初のフル スキャンを実行した後、 頻繁に増分 スキャンをスケジュールします。 これにより、データ マップが常に最新の状態に保たれ、インクリメンタル スキャンではフル スキャンと比較して v コア時間が短くなります
データ ソースの [詳細の表示] リンクを使用すると、ユーザーはフル スキャンを実行できます。 ただし、スキャン ルール セット (分類/ファイルの種類) に変更がある場合を除き、最適化されたスキャンの完全スキャン後に増分スキャンを実行することを検討してください。
親コレクションにデータ ソースを登録 し、 子コレクションのスコープ スキャン をさまざまなアクセス制御で登録して、重複するスキャン コストが発生しないようにします
コレクションの承認を使用して、きめ細かいアクセス制御とデータ ソース管理者ロールを使用してスキャンするためのデータ ソースの登録を許可されているユーザーを抑制します。 これにより、有効なデータ ソースのみが登録され、v コア時間のスキャンが制御され、スキャンのコストが削減されます
スキャンするデータ ソースの種類と資産の数がスキャン期間に影響することを検討してください
スキャナーの最適な使用を確保するために、ビジネス要件に関連するデータ資産と分類で使用可能なファイルの種類のサブセットのみを含むカスタム スキャン ルール セットを作成する
データ ソースの新しいスキャンを作成するときに、実際にスキャンを実行する前に推奨される 準備の順序 に従ってください。 これには、 ビジネス固有の分類 と ファイルの種類 (ストレージ アカウント) の要件の収集が含まれます。これにより、複数のスキャンを回避するための適切なスキャン ルール セットを定義し、要件を満たして複数のスキャンの不要なコストを制御できます
スキャン スケジュールを Self-Hosted Integration Runtime (SHIR) VM (Virtual Machines) サイズに合わせて調整して、仮想マシンに追加コストがリンクされないようにします
Azure Data FactoryパイプラインまたはAzure Synapse パイプラインを使用した自動インジェスト
- メタデータと系列は、ソース システムでパイプラインが実行されるたびに、Azure Data FactoryまたはAzure Synapse パイプラインから取り込まれます。
高度なリソース セット
Microsoft Purview データ マップでは、リソース セットを使用して、データ レイク内のすべてのファイルをスキャンし、パターン (GUID、ローカライズ パターンなど) を見つけてデータ マップ内の 1 つの資産としてグループ化する機能を提供することで、多数のデータ資産を 1 つの論理リソースにマッピングするという課題に対処します。
Advanced Resource Set はオプションの機能で、合計サイズ、パーティション数など、計算されたエンリッチされたリソース セット情報を取得し、パターン ルールを使用してリソース セットのグループ化をカスタマイズできます。 高度なリソース セット機能が有効になっていない場合、データ カタログには引き続きリソース セット資産が含まれますが、集計プロパティは含まれません。 この場合、顧客に対して課金される "リソース セット" メーターはありません。
Microsoft Purview データ マップの高度なリソース セットを切り替える前に、基本的なリソース セット機能を使用して、要件が満たされているかどうかを確認します
次の場合は、Advanced Resource Sets をオンにすることを検討してください。
- データ レイク スキーマは絶えず変化しており、基本的なリソース セット機能を超えて、#partitions、データ資産のサイズなどのパラメーターをMicrosoft Purview データ マップがサービスとして計算できるようにするために、より多くの価値を探しています
- リソース セット資産のグループ化方法をカスタマイズする必要があります。
Advanced Resource Sets の課金は、オフライン 層がリソース セット情報を集計するために使用するコンピューティングに基づいており、カタログ内のリソース セットのサイズ/数に依存します。