Microsoft Purview 統合カタログのデータ製品は、他のユーザーと共有することを目的とした定義済みのユース ケースを持つ一連の情報です。 たとえば、売上レポート、ML モデル、データ モデル、およびその関連テーブルなどです。 データ製品は、特定の目的のために作成された関連する物理資産の論理グループです。
単独で表示されるデータの値を見つけるのは難しい場合がありますが、目的に既に関連付けられているデータの方が検索と使用が簡単です。 統合カタログのデータ製品は、ユーザーとインテリジェンス システムの実用的なコンテキストを提供し、ユーザーが役立つデータを特定するのに役立ちます。
organizationのデータ製品を作成し、それらの製品がユーザー ベースに役立つ十分な定義を持っていることを確認するには、次の手順に従います。
前提条件
- データ製品を表示するには、 カタログ閲覧者のアクセス許可が必要です。
- データ製品を管理または編集するには、ユーザーに データ製品所有者 のアクセス許可が必要です。
データ製品を表示する
- Microsoft Purview ポータルで、統合カタログを開きます。
- [ カタログ管理] で、[*データ製品] を選択します。 アクセス許可に基づいて、アクセスできるすべてのデータ製品の一覧が表示されます。 これらのデータ製品をスクロール、並べ替え、フィルター処理、検索して、探しているものを見つけることができます。
- データ プロジェクトの詳細ページで詳細を表示するには、一覧から [データ 製品名 ] を選択します。
データ製品の詳細ページの [ 詳細 ] タブには、説明とユース ケースが表示されます。 ここでは、ガバナンス ドメイン、更新頻度、状態、所有者、サブスクライバー、使用条件、集計 データ品質 スコア、 正常性アクション、ドキュメントを確認できます。
- アクセス許可に基づいて、アクセスできるすべてのデータ製品の一覧が表示されます。
- これらのデータ製品をスクロール、並べ替え、フィルター処理、検索して、探しているものを見つけることができます。
- 特定のデータ製品の詳細については、そのデータ製品を選択してください。
- データ製品の詳細ページでは、ガバナンス ドメイン、更新頻度、状態、所有者、サブスクライバー、使用条件、集計 データ品質 スコア、 正常性アクション、ドキュメントを表示できます。
可観測性 (プレビュー)
[ 観測性 (プレビュー)] タブでは、データの正常性と系列をより詳細に表示できます。 このビューには 、簡単なセットアップ プロセスが必要です。 ガバナンス ドメインの監視可能性ビューの詳細を取得します。
データ製品の作成
重要
データ製品を管理または編集するには、少なくとも データ製品所有者 のアクセス許可が必要です。 データ製品の所有者がアクセスできるガバナンス ドメインでのみ、データ製品を作成できます。
統合カタログで[カタログ管理]、[データ製品]、[新しいデータ製品] の順に選択します。
[基本の詳細] ページで、[名前] と [説明] を入力します。 既に存在する名前を使用すると、作成プロセス中に警告が表示されます。 名前の複製は推奨されませんが、重複する名前の使用はブロックされません。 説明は、データの場所とキャプチャされた理由に関するビジネスストーリーである必要があります。 目標は、新しいユーザーが、データがいつ、何、なぜ、どのように存在したかの基本を理解し、特定のデータの意味をビジネスに明確にすることです。
ドロップダウン メニューから [ 種類] を選択します。 データ製品の種類に関する詳細を取得します。
データ製品の 1 つ以上の所有者を選択します。
[次へ] を選択します。
[ ビジネスの詳細 ] ページで、データ製品を関連付ける ガバナンス ドメイン を選択します。
ビジネス ユース ケースを入力します。 ユース ケースでは、データが現在使用されている内容と、ユーザーが自分のシナリオに効果的に適用する方法について説明します。 使用可能なフィルターやディメンション、解析が最も簡単なビューを含む資産、またはデータの使用を高速化できるその他の詳細などの情報をユース ケースに追加できます。 データが特定の目的にのみ適している場合は、これらの詳細を含めて、ユーザーが承認されないデータや目標を達成するのに役立たないデータへのアクセスを要求しないようにします。
データ製品を保証済みとしてマークする場合は、[ 保証済み としてマーク ] ボックスを選択します。 データ製品の保証の詳細については、こちらをご覧ください。
[作成] を選択します。
新しく作成された製品の詳細ページに到着します。 ここでは、現在 ドラフト 状態にあるデータ製品に対して他の編集を行うことができます。
重要
データ製品はまだ他のユーザーには表示されません。 他のユーザーに表示するには、 データ資産を追加し、 アクセス ポリシーを作成してから、 データ製品を発行する必要があります。
データ製品の種類
データ製品を作成するときに、必要に応じて、次のいずれかの種類として識別できます。 これらの型は、データ製品を使用するユーザーの種類を識別するのに役立ち、検索でデータ製品をフィルター処理するために使用できます。
分析モデル: 生データから変換され、分析の構築に役立つデータであり、個別のファクト テーブルとディメンション テーブルである可能性があります。
ビジネス システム/アプリケーション: 特定のソースからの一般的な一連のコンシューマブル テーブル、または一緒に使用される特定のアプリケーションで使用できます。
ダッシュボード/レポート: 意思決定を行い、一般的なメトリックを表示するために使用されるデータの視覚化。は、視覚化を強化するために使用されるデータを含む場合と含まれていない場合があります。
データセット: 特定のユース ケースでデータを検出できるようにするために、共通のデータ製品の種類として使用される個々の資産または資産のグループ。
マスター データと参照データ 一般的な使用とデータ資産の正常性に対する重要性が高いため、一貫して参照および高度に制御する必要がある、再利用性の高いデータ。
ML トレーニング データ: 新しいモデルのトレーニングとして使用するために承認されたデータ。は通常、運用データではなく、潜在的なリスクを防ぐために鈍感化されます。
ML テスト データ: エッジ ケース、公平性、潜在的な損害について ML モデルを具体的にテストするために構築されたデータ。
モデルの種類: 通常、AI で使用される AI モデルと分析モデルまたはセマンティック モデルに使用されます。
運用: データ品質に使用されるデータ製品、またはデータ資産の一部を運用するために使用されるが、高消費またはガバナンスのために計画されていないデータ製品。 これは、プロセスの実行に使用される一時的なデータ資産またはデータの調査データ積である可能性がありますが、分析目的でモデル化または統合されていません。
セマンティック モデル: 関連するデータ テーブルのグループと、解釈と再利用のためのリレーションシップと意味。
トランザクション データ: ユース ケースが限られている可能性があるが、エンジニアリング シナリオまたはシステム間統合に必要な、送信元ソースからのデータ。通常、ほとんどのビジネス データの使用には使用されませんが、ガバナンスと制御のシナリオでは重要になる可能性があります。
データ製品の編集と管理
データ製品の所有者は、次の手順に従って、データ製品のプロパティを表示および変更できます。
- 統合カタログで、[カタログ管理] を選択し、[データ製品] を選択します。
- データ製品を選択して詳細ページを開きます。
- [編集] を選択します。
データ製品ページから、次のことができます。
- データ製品に関する詳細を編集します。
- 更新頻度。
- データ製品の状態を変更します。
- データ製品アクセス ポリシーを管理します。
- 関連付けられているデータ資産を追加または削除します。
- 関連する用語または OKR を管理します。
- 使用条件を管理します。
- 関連するドキュメントを管理します。
- データ製品を保証します。
データ製品を編集する
データ製品を編集するには、 データ製品所有者 のアクセス許可が必要です。
- データ製品ページで、[ 編集 ] ボタンを選択します。
- [詳細] を選択します。
- 基本的な詳細ページでは、名前、説明、種類、所有者を更新できます。 名前を既に存在するものに変更すると、重複に関する警告が表示されますが、重複名の使用に進むことができます。
- ビジネスの詳細ページでは、ユース ケースと保証の状態を更新できます。
- 変更を保存するには、[保存] を選択 します。
更新の頻度
更新頻度を使用して、データ製品が管理される頻度を示すことができます。 これはインジケーターであり、現在は自動化されていません。
- 更新頻度を編集するには、ページの右側にある [更新頻度 ] 属性を選択します。
- データ製品に必要な更新頻度を選択します。
- [完了] を選択します。
発行、下書き、期限切れ
下書きデータ製品を発行するには、データ製品の詳細ページで [発行 ] を選択します。 公開する前に、 データ資産をデータ製品に追加し、ユーザーがデータ製品 へのアクセスを要求できるようにデータ アクセス ポリシーを設定 する必要があります。
注:
データ製品を発行する前に 、ガバナンス ドメインが発行 されていることを確認します。
要件を完了したら、データ製品を発行できます。これにより、データ製品を統合カタログのユーザーが使用できるようになります。
以前に発行したデータ製品を下書きに設定するには、 発行を解除 します。
- データ製品の [ 発行解除 ] ボタンを選択します。
- [ 下書きに設定] を 選択します。これにより、スチュワード、ガバナンス ドメイン所有者、およびデータ製品所有者のみが表示および管理できるようになります。
データ製品を [期限切れ] に設定することもできます。
- データ製品の [ 発行解除 ] ボタンを選択します。
- [ 期限切れに設定] を 選択すると、スチュワード、ガバナンス ドメインの所有者、およびデータ製品の所有者にのみ表示されます。
データ製品アクセス ポリシーを管理する
アクセス ポリシーを管理するには、 データ製品の所有者またはデータ スチュワード のアクセス許可が必要です。
データ製品が公開されている場合は、まずポリシーを管理するために発行を解除する必要があります。
データ製品ページで、[ポリシーの 管理] を選択します。
ポリシー構成ウィンドウから、データ製品のアクセス ポリシーを作成および管理できます。 データ製品アクセス ポリシーを設定する方法について説明します。
データ資産の追加と削除
データ製品は、データ資産をグループ化します。 このように資産をグループ化すると、より簡単に検出できます。 データ製品へのデータ資産の追加、またはデータ製品からの資産の削除については、以下の手順を参照してください。
データ資産を追加する
注:
データ資産を追加する場合、 ガバナンス ドメインのスコープが設定されている資産、または データ マップでユーザーがアクセスできる資産のみが検索に表示されます。
データ製品にデータ資産を追加するには:
統合カタログで、[カタログ管理] を選択し、[データ製品] を選択します。
資産を追加するデータ製品を選択します。
説明とユース ケース の下にある [データ資産の追加] を選択します。
キーワードを使用するか、[フィルターの追加] を選択してフィルターを使用して、データ資産を検索 します。
データ製品に追加する資産を選択します。
選択したアセットリストを編集するには、[ 選択したアセット ] ボタンを選択します。
アセットの選択が完了したら、[追加] を選択 します。
データ製品に新しく追加された資産が表示されます。
データ資産を削除する
ヒント
データ資産を削除してデータ製品を削除する前に、以下で説明するように、データ品質チームと協力して必要なクリーンアップ作業を実行することをお勧めします。
データ製品からデータ資産を削除する前に、すべてのデータ品質ルールと以前のデータ品質スキャンを資産から削除する必要があります。 データ品質履歴を削除する手順を確認します。
データ品質スチュワードはデータ製品の作成に関与しない可能性がありますが、データ品質ルールとスキャンの分野の専門家です。 データ品質スチュワードロールを持つユーザーのみがデータ品質ルールとスキャンを削除できるため、データ製品の所有者はデータ品質スチュワードと連携して、該当する資産をデータ製品から削除する前にルールとスキャンを削除する必要があります。
データ資産を削除するには、次の手順に従います。
統合カタログで、[カタログ管理] を選択し、[データ製品] を選択します。
資産を削除するデータ製品を選択します。
削除する資産がフロント ページにある場合は、データ資産のカードの省略記号 (...) を選択し、[削除] を選択します。
[メイン製品] ページに資産が表示されない場合は、[すべてのデータ資産の表示] を選択します。 これで、資産を検索してフィルター処理できます。 それらを削除するには、省略記号ボタンを選択し、[削除] を選択 します。
注:
データ資産にデータ品質ルールが実行されている場合、または失敗したデータ品質実行履歴がある場合、削除アクションは灰色表示されます。 資産を削除する前に、これらの問題を解決するには、Data Quality Steward ロールが必要です。
リンクされたリソースを管理する
用語集の用語と OKR をデータ製品に直接リンクして、理解を深め、ポリシーを適用し、データ製品をビジネスの目標に関連付けることができます。
重要なデータ要素 は、データ製品の資産が重要なデータ要素にマップされるときに自動的に追加されます。
リンクされたリソースを追加する
- [データ製品] ページで、用語または OKR を追加するデータ製品を選択します。
- [ 用語集の用語 ] または [OKR] で、それらの項目の一覧の横にある [ + ] ボタンを選択します。
- キーワード、ガバナンス ドメイン、または フィルター ボタンを 選択してフィルターを使用して、用語または ORK を検索します。
- データ製品に追加する任意のを選択します。
- [追加] ボタンを選択します。
- これで、データ製品の一覧に用語または OKR が表示されます。
リンクされたリソースを削除する
- [データ製品] ページで、用語または OKR を削除するデータ製品を選択します。
- [ 用語集の用語 ] または [OKR] で、削除する項目を見つけて、その省略記号ボタンを選択します。
- 削除を選択します。
注:
重要なデータ要素は、データ製品の資産に基づいて自動的に追加されます。 重要なデータ要素の管理の詳細については、重要なデータ要素に関する記事を参照してください。
使用条件
- [データ製品] ページで、使用条件を管理するデータ製品を選択します。
- ページの右側にある [使用条件 ] 属性を選択します。
- 使用条件をさらに追加するには:
- [ + 追加] リンクを選択します。
- 使用をリンクする特定のデータ資産を選択します (省略可能)。
- 用語のフレンドリ名を指定します。
- 使用条件へのリンクを指定します。
- [作成] を選択します。
- [完了] を選択します。
- 使用条件を削除するには:
- 削除する用語にカーソルを合わせます。
- ごみ箱の 削除 ボタンを選択します。
- 完了したら、[完了] を選択 します。
ドキュメント
- [データ製品] ページで、ドキュメントを管理するデータ製品を選択します。
- ページの右側にある [ドキュメント ] 属性を選択します。
- ドキュメントを追加するには:
- [ リンクの追加] を選択します。
- ドキュメントをリンクする特定のデータ資産を選択します (省略可能)。
- ドキュメントのフレンドリ名を指定します。
- ドキュメントへのリンクを指定します。
- [作成] を選択します。
- [完了] を選択します。
- ドキュメントを削除するには:
- 削除するドキュメントにカーソルを合わせます。
- ごみ箱の [削除] ボタンを選択 します。
- 完了したら、[完了] を選択 します。
データ製品を保証する
Microsoft Purview 統合カタログのサイズが大きくなるにつれて、データコンシューマーは信頼できるデータを理解することが重要です。 データコンシューマーは、データ製品がorganizationの品質基準を満たし、信頼性が高いとみなすことができるかどうかを把握する必要があります。
データ製品の所有者は、データ製品の "保証済み" フラグを設定して、データ製品を認定したことを示し、データ製品の品質に対する信頼を構築できるようになりました。
データ製品を承認するには、 データ製品所有者 のアクセス許可が必要です。
- データ製品ページで、[編集] を選択 します。
- [詳細] を選択します。
- [承認 済みとしてマーク する] チェック ボックスをオンにします。
- [保存] を選択します。
データ製品を削除する
データ製品の削除は、削除前に実行する必要があるいくつかの手順があるため、計画的な作業である必要があります。
まず、 データ製品の公開を解除する必要があります。
- また、関連するすべてのビジネス概念へのリンクを削除し、データ製品内のデータ資産を削除する必要もあります。
- 資産にデータ品質ルールが実行されている場合、または失敗したデータ品質実行履歴がある場合は、 データ品質履歴を削除する必要があります。
次に、今後の削除についてデータ製品のサブスクライバーに通知し、 データ製品へのアクセス要求を削除する必要があります。
すべてのタスクが完了したら、データ製品のページで [削除 ] を選択して、データ製品を正常に削除できます。