更新ポリシーの概要

[アーティクル]
05/31/2024

更新ポリシーは、新しいデータがテーブルに書き込まれるときにトリガーされる自動化メカニズムです。取り込まれたデータを変換し、結果を変換先テーブルに保存するクエリを実行することで、特別なオーケストレーションが不要になります。 1 つのテーブルに複数の更新ポリシーを定義できるため、異なる変換を行い、データを複数のテーブルに同時に保存できます。ターゲットテーブルには、ソーステーブルとは異なるスキーマ、アイテム保持ポリシー、およびその他のポリシーを含めることができます。

たとえば、高速トレースソーステーブルには、フリーテキスト列として形式設定されたデータを含めることができます。ターゲットテーブルには、parse 演算子を使用してソーステーブルのフリーテキストデータの変換から生成され、適切に構造化されたスキーマに従って、特定のトレース行を含めることができます。詳細については、 common シナリオ。

次の図は、更新ポリシーの概要を示しています。 2 番目のソーステーブルにデータが追加されたときにトリガーされる 2 つの更新ポリシーが表示されます。トリガーされると、変換されたデータが 2 つのターゲットテーブルに追加されます。

図は、更新ポリシーの概要を示しています。

更新ポリシーには、通常のインジェストと同じ制限とベストプラクティスが適用されます。ポリシーはクラスターのサイズに応じてスケールアウトされ、一括インジェストを処理する場合に効率が向上します。

Note

ソースとターゲットテーブルは、同じデータベース内にある必要があります。
更新ポリシー関数スキーマとターゲットテーブルスキーマは、列名、型、順序で一致している必要があります。
更新ポリシー関数は、他のデータベースのテーブルを参照できます。これを行うには、更新ポリシーを ManagedIdentity プロパティで定義する必要があり、マネージド ID は参照先データベースに viewer role する必要があります。

形式設定されたデータを取り込む際は、パフォーマンスが向上します。CSV が推奨されます。これは形式が適切に定義されているためです。ただし、データの形式を制御できない場合や、データベース内の静的ディメンションテーブルとレコードを結合するなどして、取り込まれたデータを強化したい場合があります。

更新ポリシーのクエリ

更新ポリシーがターゲットテーブルで定義されている場合、ソーステーブルに取り込まれているデータに対して複数のクエリを実行できます。複数の更新ポリシーがある場合、実行順序は必ずしもわかっていません。

クエリの制限事項

ポリシー関連のクエリでは、ストアド関数を呼び出すことができますが、次のことができます。
- クラスター間クエリを実行することはできません。
- 外部データや外部テーブルにはアクセスできません。
- (プラグインを使用して) 吹き出しを作成することはできません。
クエリには、 RestrictedViewAccess ポリシーが有効になっているテーブルに対する読み取りアクセス権がありません。
ストリーミングインジェストにおける更新ポリシーの制限については、ストリーミングインジェストの制限事項に関するセクションを参照してください。

警告

クエリが正しくないと、ソーステーブルへのデータインジェストが妨げる可能性があります。クエリ結果とソーステーブルと変換先テーブルのスキーマの互換性だけでなく、制限により、ソーステーブルへのデータインジェストを防ぐクエリが正しくない可能性があることに注意してください。

これらの制限は、ポリシーの作成と実行中に検証されますが、クエリが参照する可能性のある任意のストアド関数が更新される場合は検証されません。そのため、更新ポリシーがそのまま残るように注意して変更を加える必要があります。

ポリシーの Query 部分、または Query 部分によって参照されている関数内で Source テーブルを参照する場合:

テーブルの修飾名を使用しないでください。代わりに TableName を使用してください。
database("DatabaseName").TableName も cluster("ClusterName").database("DatabaseName").TableName も使用しないでください。

更新ポリシーオブジェクト

テーブルには、0 個以上の更新ポリシーオブジェクトを関連付けることができます。そうした各オブジェクトは、次のプロパティが定義された JSON プロパティバッグとして表されます。

プロパティ	タイプ	説明
IsEnabled	`bool`	更新ポリシーが有効 (true) か、無効 (false) かを示す状態
ソース	`string`	更新ポリシーの呼び出しをトリガーするテーブルの名前
クエリ	`string`	更新用のデータを生成するために使用されるクエリ
IsTransactional	`bool`	更新ポリシーがトランザクションであるかどうかを示します。既定値は false です。ポリシーがトランザクションであり、更新ポリシーが失敗した場合、ソーステーブルは更新されません。
PropagateIngestionProperties	`bool`	ソーステーブルへのインジェスト中に指定されたプロパティ ( 拡張タグ作成時刻など) がターゲットテーブルに適用される場合の状態。
ManagedIdentity	`string`	更新ポリシーが実行されるマネージド ID。マネージド ID には、オブジェクト ID または `system` 予約語を指定できます。更新ポリシーは、クエリが有効な行レベルのセキュリティポリシーを持つ他のデータベースまたはテーブル内のテーブルを参照する場合に、マネージド ID で構成する必要があります。詳細については、「マネージド ID を使用して更新ポリシーを実行するを参照してください。

Note

実稼働システムでは、一時的な障害により、ターゲットテーブルでデータが失われないようにするために、IsTransactionaltrue を設定します。

Note

テーブル A からテーブル B へ、テーブル C へなどのカスケード更新は許可されます。ただし、更新ポリシーが循環的な方法で定義されている場合は、実行時にこれが検出され、更新のチェーンが切断されます。データは、チェーン内の各テーブルに 1 回だけ取り込まれます。

管理コマンド

更新ポリシー管理コマンドは次のとおりです。

.show table *TableName* policy update では、テーブルの現在の更新ポリシーが表示されます。
.alter table *TableName* policy update では、テーブルの現在の更新ポリシーが定義されます。
.alter-merge table *TableName* policy update では、テーブルの現在の更新ポリシーの定義が追加されます。
.delete table *TableName* policy update では、テーブルの現在の更新ポリシーが削除されます。

更新ポリシーはインジェスト後に開始される

更新ポリシーは、データが取り込まれたりソーステーブルに移動されたり、ソーステーブルにエクステントが作成されたりしたときに有効になります。これらのアクションは、次のいずれかのコマンドを使用して実行できます。

.ingest (プル)
.ingest (インライン)
.set | .append | .set-or-append | .set-or-replace
.move extents
.replace extents
- PropagateIngestionProperties コマンドは、インジェスト操作の場合にのみ有効になります。 .move extents または .replace extents コマンドの一環として更新ポリシーがトリガーされた場合、このオプションは無効です。

警告

.set-or-replace コマンドの一環として更新ポリシーが呼び出された場合、既定では、派生テーブルのデータはソーステーブルと同じ方法で置き換えられます。 replace コマンドが呼び出された場合、更新ポリシーのリレーションシップが設定されているすべてのテーブルでデータが失われる可能性があります。代わりに .set-or-append を使用することを検討してください。

ソーステーブルからデータを削除する

ターゲットテーブルにデータを取り込んだ後は、必要に応じてソーステーブルからデータを削除できます。ソーステーブルのアイテム保持ポリシーで論理的な削除期間を 0sec (または 00:00:00) に、さらに更新ポリシーをトランザクションとして設定します。次の条件が適用されます。

ソーステーブルからソースデータに対してクエリを実行することはできません
インジェスト操作の一環としてソースデータが永続ストレージに保持されることはありません
操作パフォーマンスが向上します。ソーステーブルのエクステントに対するバックグラウンドグルーミング操作のために、インジェスト後のリソースが削減されます。

Note

ソーステーブルの論理的な削除期間が 0sec (または 00:00:00) の場合、このテーブルを参照するすべての更新ポリシーはトランザクションである必要があります。

パフォーマンスへの影響

更新ポリシーはクラスターのパフォーマンスに影響を与える可能性があります。また、データエクステントのインジェストはターゲットテーブルの数に応じて増えます。ポリシー関連のクエリを最適化することが重要です。更新ポリシーのパフォーマンスへの影響をテストするには、ポリシーを作成または変更する前に既に存在するエクステントに対して、またはクエリで使用される関数に対してポリシーを呼び出します。

リソースの使用状況を評価する

.show queries と次のパラメーターを使用して、リソースの使用状況 (CPU、メモリなど) を評価します。

Source プロパティ (ソーステーブル名) を MySourceTable として設定します
MyFunction() という名前の関数を呼び出すように Query プロパティを設定します

// '_extentId' is the ID of a recently created extent, that likely hasn't been merged yet.
let _extentId = toscalar(
    MySourceTable
    | project ExtentId = extent_id(), IngestionTime = ingestion_time()
    | where IngestionTime > ago(10m)
    | top 1 by IngestionTime desc
    | project ExtentId
);
// This scopes the source table to the single recent extent.
let MySourceTable =
    MySourceTable
    | where ingestion_time() > ago(10m) and extent_id() == _extentId;
// This invokes the function in the update policy (that internally references `MySourceTable`).
MyFunction

トランザクション設定

更新ポリシー IsTransactional 設定では、更新ポリシーがトランザクションであり、ポリシー更新の動作に影響を与える可能性があるかどうかを次のように定義します。

IsTransactional:false: 値が既定値 ( false に設定されている場合、更新ポリシーでは、ソーステーブルとターゲットテーブル内のデータの整合性は保証されません。更新ポリシーが失敗した場合、データはソーステーブルにのみ取り込まれますが、ターゲットテーブルには取り込まれません。このシナリオでは、インジェスト操作は成功します。
IsTransactional:true: 値が true に設定されている場合、この設定により、ソーステーブルとターゲットテーブル内のデータの一貫性が保証されます。更新ポリシーが失敗した場合、データはソーステーブルまたはターゲットテーブルに取り込まれません。このシナリオでは、インジェスト操作は失敗します。

エラー処理

ポリシーの更新が失敗した場合、 IsTransactional の設定が true か falseかに基づいて処理が異なります。更新ポリシーの失敗の一般的な理由は次のとおりです。

クエリ出力スキーマとターゲットテーブルが一致していません。
クエリエラー。

次のコマンドを使用して、 .show ingestion failures コマンドを使用してポリシー更新エラーを表示できます。

.show ingestion failures
| where FailedOn > ago(1hr) and OriginatesFromUpdatePolicy == true

抽出、変換、読み込みの例

更新ポリシー設定を使用して、抽出、変換、読み込み (ETL) を実行できます。

この例では、単純な関数で更新ポリシーを使用して ETL を実行します。まず、2 つのテーブルを作成します。

ソーステーブル - データを取り込む 1 つの文字列型の列が含まれています。
ターゲットテーブル - 目的のスキーマが含まれています。このテーブルには更新ポリシーが定義されています。

ソーステーブルを作成しましょう。

.create table MySourceTable (OriginalRecord:string)

次に、ターゲットテーブルを作成します。

.create table MyTargetTable (Timestamp:datetime, ThreadId:int, ProcessId:int, TimeSinceStartup:timespan, Message:string)

その後、データを抽出する関数を作成します。

.create function
 with (docstring = 'Parses raw records into strongly-typed columns', folder = 'UpdatePolicyFunctions')
     ExtractMyLogs()
    {
    MySourceTable
    | parse OriginalRecord with "[" Timestamp:datetime "] [ThreadId:" ThreadId:int "] [ProcessId:" ProcessId:int "] TimeSinceStartup: " TimeSinceStartup:timespan " Message: " Message:string
    | project-away OriginalRecord
}

ここで、作成した関数を呼び出すように更新ポリシーを設定します。

.alter table MyTargetTable policy update
@'[{ "IsEnabled": true, "Source": "MySourceTable", "Query": "ExtractMyLogs()", "IsTransactional": true, "PropagateIngestionProperties": false}]'

データがターゲットテーブルに取り込まれた後にソーステーブルを空にするために、ソーステーブルにアイテム保持ポリシーを定義して、その SoftDeletePeriod として 0s を設定します。
```
 .alter-merge table MySourceTable policy retention softdelete = 0s
```

次の方法で共有

更新ポリシーの概要

更新ポリシーのクエリ

クエリの制限事項

更新ポリシーオブジェクト

管理コマンド

更新ポリシーはインジェスト後に開始される

ソーステーブルからデータを削除する

パフォーマンスへの影響

リソースの使用状況を評価する

トランザクション設定

エラー処理

抽出、変換、読み込みの例

フィードバック

フィードバック

その他のリソース

次の方法で共有

更新ポリシーの概要

更新ポリシーのクエリ

クエリの制限事項

更新ポリシー オブジェクト

管理コマンド

更新ポリシーはインジェスト後に開始される

ソース テーブルからデータを削除する

パフォーマンスへの影響

リソースの使用状況を評価する

トランザクション設定

エラー処理

抽出、変換、読み込みの例

関連するコンテンツ

フィードバック

フィードバック

その他のリソース

更新ポリシーオブジェクト

ソーステーブルからデータを削除する