はじめに

完了

データ量の増大やデータの多様化が進むなか、データ ガバナンスを効果的に実施するための課題は困難さを増す一方です。 デジタル変革テクノロジによって、新しいデータ ソースが爆発的に増えています。 どのようなデータにアクセスできるのかをユーザーがわかるようにするには、どうすればよいのでしょうか? どのような種類のデータが存在していて、それがどこに格納されているのかがわかるとは限らない場合、管理者はどうやってデータを管理すればよいのでしょうか? データに機密情報や個人情報が含まれているかどうかを把握できるようにするには、どうすればよいのでしょうか?

通常、これらの課題はいずれも、データやストレージのソースに関する分析情報がなければ、簡単には解決できません。 データの格納や使用に関する確固としたデータ ガバナンス計画を作成するには、まず組織で使用するデータのことを十分に把握することが重要となります。

データの保管場所の割合を示す円グラフの説明。複数のパブリック クラウドと 1 つ以上のプライベート/専用クラウドが 81%、複数のプライベート/専用クラウドが 11%、1 つのパブリック クラウドと 1 つ以上のプライベート/専用クラウドが 7.5%、複数のパブリック クラウドのみが 0.5% となっています。また、オンプレミスとクラウドでの、さまざまなソースの場所を表すアイコンも示されています。

シナリオ例

あなたはデータ コンシューマーまたはデータのプロデューサーであるとします。 ビジネス データ アナリストやテクニカル データ アナリスト、データ サイエンティスト、データ エンジニアなどが挙げられます。 これらのユーザーは通常、信頼できるデータ ソースに注釈を付けたり、カタログ化したり、検索したりするための手動のプロセスに、多くの時間を費やします。

データ ソースを一元的に登録する場所がないため、別のプロセスの過程でデータ ソースを利用するまで、その存在がユーザーにはわからない場合があるのです。

記述メタデータを使用してデータ ソースに注釈を付けることは、多くの場合、報われない努力になります。 通常、クライアント アプリケーションは、データ ソースに格納されている説明を無視します。 データ ソースのドキュメントを作成することは難しい場合があり、データ ソースとドキュメントの同期状態も絶えず維持する必要があります。 最新でないと認識されたドキュメントはユーザーの信頼を失うことになるでしょう。

データ資産全体にエンドツーエンドのデータ系列がない場合、データ コンシューマーは、他のチームが所有するアップストリーム データ パイプラインで発生した問題の根本原因を突き止めるために、多くの時間を費やすことになります。 さらに、データ プロデューサーがデータセットに変更を加えた場合、ビジネス クリティカル (またはミッション クリティカル) なダウンストリーム レポートに、意図しない影響を与えることになります。

Microsoft Purview はこれらの問題の解決を目指して設計されており、企業は、Microsoft Purview によって、既存の情報資産から最大の価値を引き出すことができます。 データ ソースは、データを管理しているユーザーがカタログを通じて容易に検出し、把握することができます。

データ ガバナンスの図。中央に最高データ責任者を示すアイコンがあり、検出に関する考慮事項を表したアイコンと、コンプライアンスに関する問題を表した 2 つ目のアイコンとのつながりが示されています。

学習内容

Microsoft Purview の概要を紹介し、Microsoft Purview がエンタープライズ データをマッピングするための最適なツールになる理由である重要な側面を見ていきます。 具体的には、次の機能について見ていきます。

  • さまざまなプラットフォームや場所のデータを管理する。
  • データ ランドスケープをマップする。
  • 機密データを分類する。
  • 顧客が信頼できるデータを見つけられるようにする。

主な目標

このセッションを終了すると、エンタープライズ データ環境を管理し、さまざまなデータ ソースを取り扱ううえで、Microsoft Purview が適切な選択肢となるかどうかを判断できるようになります。