導入
Microsoft Fabric の Eventhouse には、大量のデータ用のデータ ストアが用意されています。 これは、1 つ以上の KQL データベースを格納するコンテナーです。各データベースは、さまざまなソースから継続的に到着するリアルタイム データを格納および分析するために最適化されています。
Eventstream を使用して Eventhouse の KQL データベースにデータを読み込んだり、KQL データベースにデータを直接取り込んだりすることができます。 データを取り込んだら、次のことができます。
- KQL クエリ セットで Kusto クエリ言語 (KQL) または T-SQL を使用してデータのクエリを実行します。
- Real-Time ダッシュボードを使用してデータを視覚化します。
- Fabric Activator を使用して、データに基づいてアクションを自動化します。
KQL データベースのしくみを理解すると、リアルタイム データを分析するための効果的なクエリを作成できます。 このモジュールでは、KQL データベースをリアルタイム データに最適にする特性について学習した後、KQL クエリ手法と、具体化されたビューやストアド関数などのデータベース オブジェクトを調ぶことで、この知識を適用します。
KQL データベースはリアルタイム データとどのように連携しますか?
KQL データベースは、インジェスト時間によってデータを自動的にパーティション分割し、傾向分析用の履歴データを格納しながら、最近のデータにすばやくアクセスできるようにします。 パーティション分割 とは、データベースが到着した日時に基づいてデータを個別のストレージの場所に整理することを意味するため、最近のデータを照会すると、データベースはすべてのデータをスキャンするのではなく、検索する場所を正確に認識します。
デジタルコンベヤベルトのように考えてください- イベントは継続的に流れ、到着したときに自動的に整理され、ストリームが流れ続けている間すぐに分析に利用できます。
この自動時間ベースの組織は、リアルタイム データに固有の特性があるために機能します。これは、特定の時点で発生した不変のイベントを表します。 不変 とは、これらのイベントが発生した後に変更できないことを意味します。午後 3 時 15 分の温度読み取りは、その時点で実際に発生したことを表しているため、常にその読み取りになります。 各イベントは発生時に永続的に関連付けられているため、時系列データと呼ばれる データ が作成されます。タイムスタンプはイベント自体と同じくらい重要です。
時系列データは、新しいイベントが継続的に追加される追加専用のパターンに従います。イベントは特定の時点で実際に発生したことを表しているため、データはほとんど更新または削除されません。 これは、通常、既存のレコードを更新し、異なるデータ テーブル間のリレーションシップを維持する従来のリレーショナル データベースとは根本的に異なります。