Share via


データ ガバナンスのプロセス

データ ガバナンス プロセスには 4 つのカテゴリがあります。

プロセスのカテゴリ 処理
データ ランドスケープを理解するためのデータ検出プロセス データとデータ エンティティの検出、マッピング、カタログ化のプロセス
データの品質を判断するためのデータ プロファイル検出プロセス
機密データ検出とガバナンス分類プロセス
CRUD 分析のためのデータ メンテナンス検出プロセス。たとえば、ログ ファイルから、企業全体のマスター データなどのデータの使用状況とメンテナンスを把握する
データ ガバナンス定義プロセス ビジネス用語集で一般的なビジネス ボキャブラリを作成して管理し、マスター データ、データ属性名、データ整合性ルール、有効な形式などのデータ エンティティを定義する
企業全体でコード セットを標準化するための参照データを定義する
データにラベルを付けてデータの管理方法を決定するために、データ ガバナンス分類体系を定義する
データ エンティティとドキュメントのライフサイクルを管理するための、データ ガバナンス ポリシーとルールを定義する
成功のメトリックとしきい値を定義する
データ ガバナンス ポリシーとルールの適用プロセス データ ガバナンスのポリシーとルールの適用を自動化するプロセス
ポリシーとルールを手動で適用するプロセス
以下を制御するために呼び出すことができるサービスとして公開される、イベント駆動、オンデマンド、タイマー駆動 (バッチ) のデータ ガバナンス プロセス
データ インジェスト - カタログ化、分類、所有者の割り当て、格納
データ品質
データ アクセス セキュリティ
データのプライバシー
データ使用状況 (共有を含める、承認された目的にはライセンスされたデータのみを使用する、など)
データのメンテナンス (マスター データなど)
データの保持
マスター データと参照データの同期
監視プロセス データ使用状況アクティビティ、データ品質、データ アクセス セキュリティ、データ プライバシー、データ メンテナンス、データ保持の監視と監査
ポリシー ルール違反の検出と解決の監視

一般的なビジネス ボキャブラリが、データ カタログ内のビジネス用語集で定義されている必要があります。

データ ガバナンス作業グループは、データの定義と特定のデータ領域 (顧客やサプライヤーなど) の改善の計画と開発、進行状況に関するデータ ガバナンス コントロール ボードの更新、特定の領域に関する企業全体のスチュワードシップの管理を行います。 各作業グループは、特定のデータ エンティティまたはデータ サブジェクト領域 (複数の関連エンティティなど) を定義する必要があります。 その後、ボキャブラリ内の複数のデータ エンティティとポリシーやルールを、並行して処理できます。 詳細については、「データ ガバナンスの役割と責任」を参照してください。

一般的なビジネス ボキャブラリでのエンティティの定義の図。図 1: データ ガバナンス作業グループの例

その後、すべてのテクノロジに一貫した共通データ名を取得するには、カタログのビジネス用語集と他のテクノロジを統合する必要があります。 統合する他のテクノロジの例を次に示します。

  • 抽出、変換、読み込み (ETL)
  • データ モデリング ツール
  • BI ツール、データベース管理システム
  • マスター データ管理
  • データ仮想化ツール
  • ソフトウェア開発ツール

一般的なビジネス ボキャブラリを作成する良い方法は、データ概念モデルを作成することです。 このモデルはトップダウン アプローチであり、一般的なビジネス ボキャブラリでデータ エンティティとして使用できるデータ概念を識別します。 その後、各データの概念 (エンティティ) または関連するデータ概念のグループ (サブジェクト領域) に、異なるデータ ガバナンス作業グループを割り当てることができます。 ランドスケープ全体で異なるデータ エンティティを管理するために、異なる作業グループが割り当てられます。

一般的なビジネス ボキャブラリを構築する場合は、データ カタログ ソフトウェアを使用して、複数のデータ ストアに存在するデータを自動的に検出できます。 これは、特定のデータ エンティティに関連付けられているすべての属性を識別するのに役立ちます。 これは、ボトムアップのアプローチです。 データ概念モデルのトップダウン アプローチを使用して作業を開始し、ボトムアップの自動データ検出アプローチを使用してデータ エンティティの属性を識別することで、複数の作業グループが一般的なビジネス ボキャブラリをすばやく段階的に構築できます。

自動データ検出にデータ カタログを使用すると、一般的なボキャブラリに複数のデータをマッピングできます。 データ カタログは、ビジネス用語集内の各特定のデータ エンティティのデータが企業内のどこに存在するのか把握するのに役立ちます。

ライフサイクルの異なる時点でデータを管理するためのポリシーとルール

データ ガバナンス ポリシーでは、データの整合性、品質、アクセス セキュリティ、プライバシー、保持を制御するための一連のルールが記述されています。 次のようなさまざまな種類のポリシーがあります。

  • 有効な値、参照整合性などのデータ整合性ポリシー。
  • データの標準化、クレンジング、照合ルールを使用したデータ品質ポリシー。
  • アクセス セキュリティとデータ プライバシー ルールを使用したデータ保護ポリシー。
  • 保持、アーカイブ、バックアップのルールを使用してライフサイクルを管理するためのデータ保持ポリシー。 異なる法的管轄区域で同じデータを管理するには、複数のバージョンのポリシーが必要になる場合があります。

データ機密性分類体系には、5 つの分類レベルがあります。

  • パブリック
  • 内部でのみ使用されます
  • 機密
  • 高機密個人データ
  • 制限付き

この分類体系をポリシーおよびルールと組み合わせてデータを管理します。 5 つのレベルのそれぞれを使用して、高機密個人データなどのラベルをデータに付けます。 高機密個人データのルールを作成し、これらのルールをポリシーにアタッチすることで、高機密個人データのポリシーを作成します。 高機密個人データのラベルにポリシーをアタッチした後、高機密個人データのラベルをデータに添付できます。 これにより、高機密個人データとしてラベル付けされたすべてのデータが、同じポリシーとルールの対象になります。 このプロセスは、タグベースのポリシー管理と呼ばれます。 これは、個々のルールまたはポリシーを個別に変更できるので、柔軟性があります。 高機密個人データというラベルが付いたすべてのデータは、新しいルールによって管理されます。 同様に、高機密個人データのラベルをデータからデタッチして、代わりに機密ラベルを使用できます。 この場合、データは、機密ラベルに関連付けられている新しい一連のポリシーとルールによって直ちに管理されます。

データ ガバナンス分類体系で各クラスのデータ カ タログにポリシーとルールを定義したら、API を使用してデータ カタログから他のテクノロジに渡して、それらを適用することができます。 代わりに、複数のデータ ストアに接続できる一般的なデータ管理プラットフォームによって、それらを適用できる可能性があります。

その後、ライフサイクルを通じて、特定のデータ エンティティのデータ品質、プライバシー、アクセス セキュリティ、使用状況、メンテナンス、保持を監視できます。

次のステップ