データ品質のしきい値 (プレビュー)

データ品質しきい値は、データが許容される品質レベルを満たしているかどうかを決定する定義済みの制限です。 簡単に言えば、それは質問に答えます:どのくらい良いですか?

たとえば、列に対して完全性ルールを実行する場合は、次のようになります。

  • 合計レコード数: 1,000
  • 値を持つレコード: 920
  • 完全性スコア: 92%

しきい値が 90% の場合、データは期待を満たします。

しきい値が 95% の場合、データは期待を満たしていません。

しきい値は、データが特定のユース ケースに対する期待を満たしているかどうかを定義するカットオフ ポイントです。

しきい値が重要な理由

さまざまな種類のデータには、さまざまな品質の期待が必要です。 次に例を示します。

  • Emailアドレス列: 99 ~ 100% の完全性が必要な場合があります。
  • 説明列: おそらく 80 ~ 90% が許容されます。
  • 金融取引: 100% の精度が必要な場合があります。

80% などの 1 つの固定しきい値を使用すると、特に重要なデータや規制されたデータでは誤解を招く可能性があります。

しきい値の種類

  • ルール レベルのしきい値: ルールごとに設定します (たとえば、完全性は 95% ≥必要です)。
  • データ資産レベルのしきい値: 列ごとに異なる期待値。
  • データ製品レベルのしきい値: 全体的なスコア要件。

構成可能なデータ品質しきい値

データ品質のしきい値を構成して、ルールとデータ資産レベルで許容される最小品質スコアを設定できます。 品質評価をビジネスの重要度に合わせて調整するしきい値を定義します。

データ資産の既定のしきい値を構成または編集する

  1. Microsoft Purview 統合カタログで、[正常性管理] を選択し、[データ品質] を選択します。

  2. ガバナンス ドメインを選択し、データ製品を選択し、データ資産を選択します。

  3. [ 概要 ] ページで、[ スコアのしきい値の設定] を選択します。

  4. 既定のしきい値を変更します。

  5. [保存] を選択します。

    資産レベルのしきい値

データ品質ルールのしきい値を構成する

  1. 統合カタログで、[正常性管理] を選択し、[データ品質] を選択します。
  2. ガバナンス ドメインを選択し、データ製品を選択し、データ資産を選択します。
  3. [ ルール ] ページで、[ 新しいルール] を選択します。
  4. 既定の規則またはカスタム規則を選択し、[ 次へ] を選択します。
  5. [ しきい値のスコア付け ] を選択し、既定のしきい値を変更します。
  6. [保存] を選択します。

データ品質ルール レベルのしきい値

データ品質ルールのしきい値を編集する

  1. データ資産の [ ルール] ページで、ルールの編集アイコンを選択します。
  2. 概要から、[ スコアのしきい値] を選択します。
  3. しきい値を編集します。
  4. [保存] を選択します。

アラートを構成する

データ資産またはルールのデータ品質スコアが定義されたしきい値を下回ったときに通知するアラートを設定します。 ルールのしきい値を設定または編集する場合は、次の手順に従います。

  • [アラート] トグルを オンに設定します。
  • [受信者] で、1 人以上のユーザーを追加します。
  • [保存] を選択します。

しきい値のアラートを設定する

注:

しきい値を構成しない場合は、既定のしきい値と色が使用されます。 既定のしきい値スコアの値は次のとおりです。

  • 低 (赤): 0 から 40
  • 中 (オレンジ): 40 から 80
  • 高 (緑): 80 から 100

構成可能なデータ品質しきい値機能からorganizationが得られる利点は次のとおりです。

  • 企業は、organizationを品質ガバナンスに合わせて調整できます。
  • Microsoft Purview データ品質によって生成されるデータ品質スコアに対する信頼が向上し、企業全体のチームがデータが特定のユース ケースに適しているかどうかを自信を持って判断できるようになります。
  • 組織が一般的な品質チェックを超えて、ビジネス主導のデータ品質管理に移行するのに役立ちます。
  • 規制と意思決定に不可欠なユース ケースをサポートします。
  • しきい値の均一評価によって発生するユーザーまたは組織の混乱を軽減します。

ルール レベルのしきい値を設定すると、"良い" 外観の明確な標準が作成されます。 アラートを使用すると、データがその標準を下回る瞬間に動作します。 これにはいくつかの実用的な利点があります。

  • 問題の早期検出: レポート、パイプライン、またはモデルに影響を与える前に、不足しているデータ、一貫性のないデータ、不適切なデータなどをキャッチします。
  • ビジネス リスクの軽減: 不適切なデータが不適切な意思決定、財務上のエラー、またはコンプライアンスの問題を引き起さないようにします。
  • 迅速な修復: アラートを使用すると、チームは数日または数週間後に問題を検出するのではなく、すぐに対応できます。
  • 説明責任とガバナンス: しきい値をクリアすると、データ品質の所有権と期待が定義されます。
  • 運用効率: 手動による監視を排除し、アドホック チェックへの依存を減らします。
  • データに対する信頼: 品質基準を一貫して適用すると、分析と AI 出力に対する信頼が高まります。

つまり、 しきい値によって 許容される品質が定義され、アラートによってその標準が実行可能になります。

次の手順