Microsoft Purview のデータ製品
データ製品は、データ資産 (テーブル、ファイル、PBI レポートなど) のグループであり、データ コンシューマーと共有するユース ケースを資産に提供する企業にパッケージ化されたオファリングです。
Microsoft Purview では、データ ガバナンスは、データが安全で準拠していることを確認する方法だけでなく、データのビジネス価値を高めるツールでもあります。 資産内のデータをカタログ化すると、適切な使用のためにデータをより適切に管理できますが、データランドスケープの全体像も提供されます。 使用可能なすべてのデータ資産の一覧が表示されたので、ユーザーは必要なものを見つけるためにネットワークやチームの知識に依存する必要がなくなりました。カタログ自体を検索できます。 しかし、すべてのユーザーに利用可能なすべてのデータの生のリストを与えることは圧倒的であり、本質的に役に立つものではありません。 適切な説明、タグ付け、用語集の用語を使用しても、探しているものを知るのは難しい場合があります。 また、完全なデータの視覚化には、1 つだけではなく、複数のデータ資産が必要な場合があります。 データ カタログが拡大するにつれて、ユーザーが必要なデータへのアクセスを簡単に見つけて要求できるように、コンテキストがそれに沿って拡大する必要があります。
スケーラブルなデータ コンテキストとアクセス管理を提供するために、Microsoft Purview ではデータ製品が導入されています。
データ製品とは
データ製品は、名前、説明、所有者、最も重要なのは関連するデータ資産のリストを持つビジネス概念です。 データ製品は、これらの資産のコンテキストを提供し、それらをデータ コンシューマーのユース ケースの下にグループ化します。 ガバナンス ドメインには多数のデータ製品を格納できますが、データ製品は 1 つの ガバナンス ドメイン によって管理され、多くのドメイン間で検出できます。
データ製品が成功すると、データコンシューマーは、日常の言語を使用して貴重なデータを簡単に認識できるようになり、同時に、それらのデータ資産の所有権の責任が合理化されます。 次に、その外観を調べてみましょう。
スケーラブルなデータ コンテキスト
たとえば、データ サイエンティストは、使用するデータ モデルのデータ資産のセットを作成し、他のユーザーが同じデータセットを使用できるようにする必要があります。
データ製品がないと、データ サイエンティストはデータ カタログを使用して、関連するすべてのデータ資産に用語集の用語を追加できます。 ユーザーが検索する用語集の用語がわからない場合があるため、類似の情報を検索する際に関連性を高めるために、各データ資産に説明を追加することをお勧めする場合があります。 ただし、どちらの追加も、他のユーザーに関連付けられているすべてのデータ資産が表示されることを保証するものではありません。 関連性の低い他の資産にグループ化したり、重要なデータピースを見逃したり、元のデータ サイエンティストが既に実行した調査を繰り返す時間を費やしたりする場合があります。
データ製品を使用すると、データ サイエンティストは、データ モデルの作成に使用されるすべての資産を一覧表示するデータ製品を作成できます。 この説明では、完全なユース ケースと、データの使用方法に関する例や提案を示します。 データ サイエンティストは現在、データ製品の所有者となり、この 1 つのデータ製品で必要なすべてのものを取得できるように支援することで、データ コンシューマーの検索エクスペリエンスを向上させています。
スケーラブルなデータ ガバナンス
データ製品は、データ資産のガバナンスも合理化します。 データ資産のセットを作成するデータ サイエンティストの同じ例を使用します。
データ製品がない場合、ユーザーがデータ セットのデータ資産にアクセスする必要がある場合は、各データ資産へのアクセスを個別に要求する必要があります。 データ所有者は、これらの資産が機械学習モデルに使用されていることを知っている可能性がありますが、セキュリティとユース ケースに関するポリシーに変更が加えられた場合、データ所有者は各資産に個別に移動してそれらの更新を行う必要があります。
データ製品を使用すると、ユーザーはデータ製品を見つけ、データ製品へのアクセスを要求できます。これにより、関連付けられているすべてのデータ資産へのアクセス (承認後) が提供されます。 機械学習用のデータセットに関してより多くの承認またはデータ使用ポリシーが設定されている場合、データ所有者は新しいポリシーをデータ製品に適用するだけで済み、資産に自動的にトリクルダウンされます。
データ製品は、ビジネス正常性コントロールと OKR にも関連付けられています。 これらの制御により、データ所有者はデータの正常性を評価し、注意が必要な資産に優先順位を付け、ビジネス価値を提供しているデータ資産を評価できます。 これにより、資産の完全なデータ ガバナンスに向けた進行状況がサポートされるだけでなく、データからのビジネス価値の開発も促進されます。 資産は抽象的ではなくなりましたが、実際のユース ケースやチームが重点を置くことができるビジネス目標に関連付けられています。
データ アクセス ポリシー
データのセキュリティとアクセスは、成功したデータ ガバナンスのコア テナントです。 ただし、データ ガバナンスを実装し、データの使用 (したがって価値) を正常に推進するには、データ アクセス プロセスをセキュリティで保護し、便利で、データ資産全体のすべてのシナリオに合わせてカスタマイズできる必要があります。 一部のデータは広く使用でき、アクセス可能である必要があり、適切な使用を確保するために厳格な承認と監視を受ける必要があります。
各データ製品には、ユーザーがアクセスを要求する方法、データの使用条件、データへのアクセスを承認する必要があるユーザーを決定するアクセス ポリシーがあります。 これらの各アクセス ポリシーは、適切な使用のためにカスタマイズ可能であり、今後、より多くのユース ケースに対応できるように進化する予定です。 すべてのユーザーが行う必要がある操作は、データ製品内の [アクセスの要求 ] を選択することであり、使用条件に同意し、正しい関係者から承認を得るためにプロセスを自動的に受け取ります。
データ製品のアクセスの詳細については、Microsoft Purview でのデータ カタログ アクセス ポリシーの管理に関する記事を参照してください。