Azure Storage からデータを取得する

データ インジェストは、1 つ以上のソースから Azure Data Explorer のテーブルにデータを読み込むプロセスです。 取り込まれたデータは、クエリに使用できるようになります。 この記事では、Azure Storage (ADLS Gen2 コンテナー、BLOB コンテナー、または個々の BLOB) から新しいテーブルまたは既存のテーブルにデータを取得する方法について説明します。

インジェストは、1 回限りの操作または継続的な方法として実行できます。 継続的インジェストは、ポータル経由でのみ構成できます。

データ インジェストの一般的な情報については、「Azure Data Explorer データ インジェストの概要」を参照してください。

前提条件

データを取得

  1. 左側のメニューから [クエリ] を選択 します

  2. データを取り込むデータベースを右クリックします。 [データの取得] を選択します。

    データベースを右クリックし、[オプションの取得] ダイアログが開いているクエリ タブのスクリーンショット。

source

[ データの取得 ] ウィンドウで、[ ソース ] タブが選択されています。

使用可能な一覧からデータ ソースを選択します。 この例では、 Azure Storage からデータを取り込みます。

[ソース] タブが選択されている [データの取得] ウィンドウのスクリーンショット。

構成

  1. ターゲット データベースとテーブルを選択します。 新しいテーブルにデータを取り込む場合は、[ + 新しいテーブル ] を選択し、テーブル名を入力します。

    注意

    テーブル名には、スペース、英数字、ハイフン、アンダースコアを含む最大 1024 文字を指定できます。 特殊文字はサポートされていません。

  2. ソースを追加するには、[ コンテナーの選択 ] または [ URI の追加] を選択します

    1. [コンテナーの 選択] を選択した場合は、次のフィールドに入力します。

      新しいテーブルが入力され、1 つのサンプル データ ファイルが選択された [構成] タブのスクリーンショット。

      設定 フィールドの説明
      サブスクリプション ストレージ アカウントが配置されているサブスクリプション ID。
      ストレージ アカウント ストレージ アカウントを識別する名前。
      コンテナー 取り込むストレージ コンテナー。
      ファイル フィルター (省略可能)
      フォルダー パス 特定のフォルダー パスを持つファイルを取り込むためのデータをフィルター処理します。
      [ファイル拡張子] 特定のファイル拡張子のみを持つファイルを取り込むためのデータをフィルター処理します。
    2. [URI の追加] を選択した場合は、BLOB コンテナーまたは個々のファイルのストレージ 接続文字列を [URI] フィールドに貼り付けてから、 を選択+します。

      注意

      • 最大 10 個の個々の BLOB を追加できます。 各 BLOB は、最大 1 GB の非圧縮にすることができます。
      • 1 つのコンテナーから最大 5000 個の BLOB を取り込むことができます。

      [URI] フィールドに接続文字列が貼り付けられた [構成] タブのスクリーンショット。

  3. [次へ] を選択します

検査

[ 検査 ] タブが開き、データのプレビューが表示されます。

インジェスト プロセスを完了するには、[完了] を選択 します

[検査] タブのスクリーンショット。

省略可能:

列の編集

注意

  • 表形式 (CSV、TSV、PSV) の場合、列を 2 回マップすることはできません。 既存の列にマップするには、最初に新しい列を削除します。
  • 既存の列の型を変更することはできません。 異なる形式の列にマップしようとすると、空の列になってしまう場合があります。

テーブルに加えることができる変更は、次のパラメーターによって異なります。

  • テーブルの種類が新規かまたは既存か
  • マッピングの種類が新規かまたは既存か
テーブルの種類です。 マッピングの種類 使用可能な調整
新しいテーブル 新しいマッピング 列の名前変更、データ型の変更、データ ソースの変更、 マッピング変換、列の追加、列の削除
既存のテーブル 新しいマッピング 列の追加 (データ型の変更、名前の変更、更新が可能)
既存のテーブル 既存のマッピング なし

編集のために開いている列のスクリーンショット。

マッピング変換

一部のデータ形式マッピング (Parquet、JSON、Avro) では、簡単な取り込み時の変換がサポートされています。 マッピング変換を適用するには、[列の 編集] ウィンドウで列を作成または更新します。

マッピング変換は、string 型または datetime 型の列に対して実行でき、ソースのデータ型は int または long です。 サポートされているマッピング変換は次のとおりです。

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

データ型に基づく高度なオプション

表形式 (CSV、TSV、PSV):

  • 既存のテーブルに表形式を取り込む場合は、[高度な>現在のテーブル スキーマを保持する] を選択できます。 表形式データには、ソース データを既存の列にマップするために使用される列名が必ずしも含まれるとは限りません。 このオプションをオンにすると、マッピングは順番に行われ、テーブル スキーマは変わりません。 このオプションをオフにすると、データ構造に関係なく、受信データに対して新しい列が作成されます。

  • 最初の行を列名として使用するには、[詳細設定>] [最初の行は列ヘッダー] の順に選択します。

    高度な CSV オプションのスクリーンショット。

JSON:

  • JSON データの列分割を決定するには、1 から 100 までの 高度な>入れ子になったレベルを選択します。

  • [詳細]>[データ形式のエラーを無視する] を選択した場合、データは JSON 形式で取り込まれます。 このチェック ボックスをオフのままにすると、データは multijson 形式で取り込まれます。

    高度な JSON オプションのスクリーンショット。

まとめ

[データ準備] ウィンドウでは、3 つの手順はすべて、データ インジェストが正常に完了したときに緑色のチェックマークでマークされます。 各ステップで使用されたコマンドを表示したり、取り込まれたデータのクエリ、視覚化、または削除を行うカードを選択できます。

正常なインジェストが完了した概要ページのスクリーンショット。