はじめに
データ量の増大やデータの多様化が進むなか、データ ガバナンスを効果的に実施するための課題は困難さを増す一方です。 デジタル変革テクノロジによって、新しいデータ ソースが爆発的に増えています。 どのようなデータにアクセスできるのかをユーザーがわかるようにするには、どうすればよいのでしょうか? どのような種類のデータが存在していて、それがどこに格納されているのかがわかるとは限らない場合、管理者はどうやってデータを管理すればよいのでしょうか? データに機密情報や個人情報が含まれているかどうかを把握できるようにするには、どうすればよいのでしょうか?
通常、これらの課題はいずれも、データやストレージのソースに関する分析情報がなければ、簡単には解決できません。 データの格納や使用に関する確固としたデータ ガバナンス計画を作成するには、まず組織で使用するデータのことを十分に把握することが重要となります。
シナリオ例
あなたはデータ コンシューマーまたはデータのプロデューサーであるとします。 ビジネス データ アナリストやテクニカル データ アナリスト、データ サイエンティスト、データ エンジニアなどが挙げられます。 これらのユーザーは通常、信頼できるデータ ソースに注釈を付けたり、カタログ化したり、検索したりするための手動のプロセスに、多くの時間を費やします。
データ ソースを一元的に登録する場所がないため、別のプロセスの過程でデータ ソースを利用するまで、その存在がユーザーにはわからない場合があるのです。
記述メタデータを使用してデータ ソースに注釈を付けることは、多くの場合、報われない努力になります。 通常、クライアント アプリケーションは、データ ソースに格納されている説明を無視します。 データ ソースのドキュメントを作成することは難しい場合があり、データ ソースとドキュメントの同期状態も絶えず維持する必要があります。 最新でないと認識されたドキュメントはユーザーの信頼を失うことになるでしょう。
データ資産全体にエンドツーエンドのデータ系列がない場合、データ コンシューマーは、他のチームが所有するアップストリーム データ パイプラインで発生した問題の根本原因を突き止めるために、多くの時間を費やすことになります。 さらに、データ プロデューサーがデータセットに変更を加えた場合、ビジネス クリティカル (またはミッション クリティカル) なダウンストリーム レポートに、意図しない影響を与えることになります。
Microsoft Purview はこれらの問題の解決を目指して設計されており、企業は、Microsoft Purview によって、既存の情報資産から最大の価値を引き出すことができます。 データ ソースは、データを管理しているユーザーがカタログを通じて容易に検出し、把握することができます。
学習内容
Microsoft Purview の概要を紹介し、Microsoft Purview がエンタープライズ データをマッピングするための最適なツールになる理由である重要な側面を見ていきます。 具体的には、次の機能について見ていきます。
- さまざまなプラットフォームや場所のデータを管理する。
- データ ランドスケープをマップする。
- 機密データを分類する。
- 顧客が信頼できるデータを見つけられるようにする。
主な目標
このセッションを終了すると、エンタープライズ データ環境を管理し、さまざまなデータ ソースを取り扱ううえで、Microsoft Purview が適切な選択肢となるかどうかを判断できるようになります。
ヘルプが必要ですか? Microsoft のトラブルシューティング ガイドをご覧になるか、問題を報告して具体的なフィードバックをお送りください。