サーバーレス SQL プールクエリでファイルのメタデータを使用します

Tip

Microsoft Fabric Data Warehouse は、将来のアーキテクチャ、組み込みの AI、および新機能を備えた、Data Lake 基盤上のエンタープライズ規模のリレーショナルウェアハウスです。データウェアハウスを初めて使用する場合は、Fabric Data Warehouseから始めます。既存の dedicated SQL プールワークロードは、Fabric にアップグレードして、データサイエンス、リアルタイム分析、レポートの新機能にアクセスできます。

Fabric無料試用版を開始します。
Fabric Data Warehouse 用マイグレーションアシスタント

この記事では、メタデータを使用して特定のファイルまたはフォルダーに対してクエリを実行する方法について説明します。サーバーレス SQL プールは、複数のファイルとフォルダーに対応できます。詳細については、「フォルダーと複数のファイルに対してクエリを実行する」を参照してください。

場合によっては、どのファイルまたはフォルダーのソースが、結果セット内の特定の行に関連付けられているかを知る必要がある可能性があります。 filepath 関数と filename 関数を使用して、結果セット内のファイル名またはパスを返したり、ファイル名またはフォルダーパスに基づいてデータをフィルター処理したりできます。これらの関数については、「filename 関数」と「filepath 関数」で説明されています。

次のセクションでは、簡単な説明とコードサンプルを提供します。

前提条件

最初の手順は、ストレージアカウントを参照するデータソースを使用してデータベースを作成することです。次に、そのデータベースでセットアップスクリプトを実行して、オブジェクトを初期化します。このセットアップスクリプトにより、この記事のサンプルで使用されるデータソース、データベーススコープの資格情報、外部ファイル形式が作成されます。

Functions

ファイル名

filename 関数からは、行の生成元のファイル名が返されます。

次のサンプルでは、2017 年 9 月の NYC イエロータクシーのデータファイルを読み取り、ファイルごとの乗車数を返します。クエリの OPENROWSET 部分では、読み取るファイルを指定します。

SELECT
    nyc.filename() AS [filename]
    ,COUNT_BIG(*) AS [rows]
FROM  
    OPENROWSET(
        BULK 'parquet/taxi/year=2017/month=9/*.parquet',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT='PARQUET'
    ) nyc
GROUP BY nyc.filename();

次の例では、filename() 句で WHERE を使用して、読み取るファイルをフィルター処理する方法を示します。クエリの OPENROWSET 部分のフォルダー全体にアクセスし、WHERE 句内のファイルをフィルター処理します。

結果は前の例と同じになります。

SELECT
    r.filename() AS [filename]
    ,COUNT_BIG(*) AS [rows]
FROM OPENROWSET(
    BULK 'csv/taxi/yellow_tripdata_2017-*.csv',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT = 'CSV',
        PARSER_VERSION = '2.0',
        FIRSTROW = 2) 
        WITH (C1 varchar(200) ) AS [r]
WHERE
    r.filename() IN ('yellow_tripdata_2017-10.csv', 'yellow_tripdata_2017-11.csv', 'yellow_tripdata_2017-12.csv')
GROUP BY
    r.filename()
ORDER BY
    [filename];

ファイルパス

filepath 関数からは、完全なパスまたは部分的なパスが返されます。

パラメーターを指定せずに呼び出した場合、行の生成元である完全なファイルパスが返されます。 DATA_SOURCE で OPENROWSET が使用されると、DATA_SOURCE に対する相対パスが返されます。
パラメーターを指定して呼び出すと、パラメーターで指定した位置にあるワイルドカードと一致するパスの一部が返されます。たとえば、パラメーター値 1 の場合は、最初のワイルドカードと一致するパスの一部が返されます。

次のサンプルでは、2017 年の過去 3 か月間について、NYC イエロータクシーのデータファイルが読み取られます。それぞれのファイルパスごとの乗車数を返します。クエリの OPENROWSET 部分では、読み取るファイルを指定します。

SELECT
    r.filepath() AS filepath
    ,COUNT_BIG(*) AS [rows]
FROM OPENROWSET(
        BULK 'csv/taxi/yellow_tripdata_2017-1*.csv',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT = 'CSV',
        PARSER_VERSION = '2.0',
        FIRSTROW = 2
    )
    WITH (
        vendor_id INT
    ) AS [r]
GROUP BY
    r.filepath()
ORDER BY
    filepath;

次の例では、filepath() 句で WHERE を使用して、読み取るファイルをフィルター処理する方法を示します。

クエリの OPENROWSET 部分にワイルドカードを使用し、WHERE 句内のファイルをフィルター処理することができます。結果は前の例と同じになります。

SELECT
    r.filepath() AS filepath
    ,r.filepath(1) AS [year]
    ,r.filepath(2) AS [month]
    ,COUNT_BIG(*) AS [rows]
FROM OPENROWSET(
        BULK 'csv/taxi/yellow_tripdata_*-*.csv',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT = 'CSV',
        PARSER_VERSION = '2.0',        
        FIRSTROW = 2
    )
WITH (
    vendor_id INT
) AS [r]
WHERE
    r.filepath(1) IN ('2017')
    AND r.filepath(2) IN ('10', '11', '12')
GROUP BY
    r.filepath()
    ,r.filepath(1)
    ,r.filepath(2)
ORDER BY
    filepath;

次のステップ

サーバーレス SQL プールを使用して Parquet ファイルに対してクエリを実行する

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-03