Amazon S3 からデータを取得する

[アーティクル]
11/16/2023

この記事では、Amazon S3 から新規または既存のテーブルのいずれかにデータを取得する方法について説明します。 Amazon S3 は、データを格納および取得するために構築されたオブジェクトストレージサービスです。

Amazon S3 の詳細については、「Amazon S3 とは」を参照してください。

前提条件

Microsoft Fabric 対応容量を持つワークスペース
編集アクセス許可を持つ KQL データベース
データを含む Amazon S3 バケット

ソース

KQL データベースの下部のリボンで、[データの取得] を選択します。

[データの取り込み] ウィンドウで [ソース] タブが選択されます。
使用可能な一覧からデータソースを選択します。この例では Amazon S3 からデータを取り込みます。

構成

ターゲットテーブルを選択します。新しいテーブルにデータを取り込む場合は、[+新しいテーブル] を選択し、テーブル名を入力します。

Note

テーブル名には、スペース、英数字、ハイフン、アンダースコアを含め、最大 1024 文字を使用できます。特殊文字はサポートされていません。
[URI] フィールドに、1 つのバケットの接続文字列または個別のオブジェクトを、次の形式で貼り付けます。

バケット: https://BucketName.s3.RegionName.amazonaws.com;AwsCredentials=AwsAccessID,AwsSecretKey

必要に応じて、バケットフィルターを適用し、特定のファイル拡張子に従ってデータをフィルター処理できます。
[次へ] を選択します。

検査

[検査] タブが開き、データのプレビューが表示されます。

インジェストプロセスを完了するには、[完了] を選択します。

必要に応じて、次の操作を行います。

[コマンドビューアー] を選択し、入力から生成される自動コマンドを表示してコピーします。
[スキーマ定義ファイル] ドロップダウンを使用して、スキーマを推論する元のファイルを変更します。
ドロップダウンから必要な形式を選択して、自動的に推論されるデータの形式を変更します。詳細については、「リアルタイム分析でサポートされているデータ形式」を参照してください。
列を編集します。
データ型に基づく [詳細] オプションを確認します。

列の編集

Note

表形式 (CSV、TSV、PSV) では、列を 2 回マップすることはできません。既存の列にマップするには、最初に新しい列を削除します。
既存の列の型を変更することはできません。異なる形式の列にマップしようとすると、空の列になってしまう場合があります。

テーブルに加えることができる変更は、次のパラメーターによって異なります。

テーブルの種類が新規かまたは既存か
マッピングの種類が新規かまたは既存か

テーブルの種類です。	マッピングの種類	使用可能な調整
新しいテーブル	新しいマッピング	列の名前変更、データ型の変更、データソースの変更、マッピング変換、列の追加、列の削除
既存のテーブル	新しいマッピング	新しい列の追加 (その後、データ型の変更、名前変更、更新が可能)
既存のテーブル	既存のマッピング	なし

マッピング変換

一部のデータ形式マッピング (Parquet、JSON、Avro) では、簡単な取り込み時の変換がサポートされています。マッピング変換を適用するには、[列の編集] ウィンドウで列を作成または更新します。

マッピング変換は、データ型が int または long であるソースを使用して、string または datetime 型の列に対して実行できます。サポートされているマッピング変換は次のとおりです。

DateTimeFromUnixSeconds
DateTimeFromUnixMilliseconds
DateTimeFromUnixMicroseconds
DateTimeFromUnixNanoseconds

データ型に基づく [詳細] オプション

表形式 (CSV、TSV、PSV):

表形式を "既存のテーブル" に取り込もうとしている場合は、[詳細]>[テーブルスキーマを保持する] を選択できます。表形式データには、ソースデータを既存の列にマップするために使用される列名が必ずしも含まれるとは限りません。このオプションをオンにすると、マッピングは順番に行われ、テーブルスキーマは同じままになります。このオプションをオフにすると、データ構造に関係なく、受信するデータに対して新しい列が作成されます。
最初の行を列名として使用するには、[詳細]>[最初の行を列ヘッダーにする] を選択します。

JSON:

JSON データの列分割を指定するには、[詳細]>[入れ子のレベル] を 1 から 100 までで選択します。
[詳細]>[エラーのある JSON 行をスキップする] を選択すると、データは JSON 形式で取り込まれます。このチェックボックスをオフのままにすると、データは multijson 形式で取り込まれます。

まとめ

[データ準備] ウィンドウでは、データインジェストが正常に終了した場合、3 つのステップすべてに緑色のチェックマークが表示されます。カードを選択してクエリを実行すること、取り込まれたデータを削除すること、インジェストの概要のダッシュボードを表示することができます。

データベースを管理するには、「データの管理」を参照してください。
クエリを作成、格納、およびエクスポートするには、「KQL クエリセット内のデータのクエリ」を参照してください。

Amazon S3 からデータを取得する

前提条件

ソース

構成

検査

列の編集

マッピング変換

データ型に基づく [詳細] オプション

まとめ

フィードバック

フィードバック

その他のリソース

Amazon S3 からデータを取得する

前提条件

ソース

構成

検査

列の編集

マッピング変換

データ型に基づく [詳細] オプション

まとめ

関連するコンテンツ

フィードバック

フィードバック

その他のリソース