Azure Data FactoryまたはAzure Synapse Analyticsを使用してファイルシステム間でデータをコピーする

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

Data Factory in Microsoft Fabric は、よりシンプルなアーキテクチャ、組み込みの AI、および新機能を備えた次世代のAzure Data Factoryです。データ統合を初めて使用する場合は、Fabric Data Factory から始めます。既存の ADF ワークロードをFabricにアップグレードして、データサイエンス、リアルタイム分析、レポートの新機能にアクセスできます。

Fabric無料試用版を開始します。
Azure Data Factory から Microsoft Fabric の Data Factory へのアップグレード

この記事では、ファイルシステムをコピー先またはコピー元としてデータをコピーする方法について説明します。詳細については、Azure Data Factory または Azure Synapse Analytics の入門記事を参照してください。

サポートされる機能

このファイルシステムコネクタでは、次の機能がサポートされます。

サポートされる機能	IR
Copy アクティビティ (ソース/シンク)	(1) (2)
ルックアップアクティビティ	(1) (2)
GetMetadata アクティビティ	(1) (2)
Delete アクティビティ	(1) (2)

(1) Azure統合ランタイム (2) セルフホステッド統合ランタイム

具体的には、このファイルシステムコネクタは以下をサポートします。

ネットワークファイル共有をコピー元またはコピー先とするファイルのコピー。 Linux ファイル共有を使用するには、Linux サーバーに Samba をインストールします。
基本認証を使用したファイルのコピー。
ファイルをそのままコピーするか、サポートされているファイル形式と圧縮コーデックを使用したファイルの解析/生成。

前提条件

データストアがオンプレミスネットワーク、Azure仮想ネットワーク、または Amazon Virtual Private Cloud 内にある場合は、自身がホストする統合ランタイムを構成して接続する必要があります。

データストアがマネージドクラウドデータサービスの場合は、Azure Integration Runtimeを使用できます。アクセスがファイアウォール規則で承認されている IP に制限されている場合は、許可リストに Azure Integration Runtime IP を追加できます。

Azure Data Factoryの管理された仮想ネットワーク統合ランタイム機能を使用して、セルフホステッド統合ランタイムをインストールして構成することなく、オンプレミスネットワークにアクセスすることもできます。

Data Factory によってサポートされるネットワークセキュリティメカニズムやオプションの詳細については、「データアクセス戦略」を参照してください。

概要

パイプラインでコピーアクティビティを実行するには、次のいずれかのツールまたは SDK を使用できます。

UI を使用してファイルシステムのリンクサービスを作成する

Azure ポータル UI でファイルシステムのリンクされたサービスを作成するには、次の手順に従います。

Azure Data Factoryまたは Synapse ワークスペースの [管理] タブを参照し、[リンクされたサービス] を選択し、[新規] を選択します。
- Azureデータファクトリー
- Azure Synapse
Azure Data Factory UI を使用した新しいリンクサービスの作成のスクリーンショット
ファイルを検索し、ファイルシステムコネクタを選択します。
サービスの詳細を構成し、接続をテストして、新しいリンクサービスを作成します。

コネクタの構成の詳細

以下のセクションでは、ファイルシステムに固有の Data Factory および Synapse パイプラインエンティティの定義に使用されるプロパティについて詳しく説明します。

リンクされたサービスのプロパティ

ファイルシステムののリンクされたサービスでは、次のプロパティがサポートされます。

プロパティ	説明	必須
型	type プロパティは、次のように設定する必要があります:FileServer.	はい
ホスティング	コピーするフォルダーのルートパスを指定します。文字列内の特殊文字にはエスケープ文字 "" を使用します。例については、「サンプルのリンクされたサービスとデータセットの定義」ご覧ください。	はい
userId	サーバーにアクセスするユーザーの ID を指定します。	はい
パスワード	ユーザー (userId) のパスワードを指定します。このフィールドを SecureString としてマークして安全に格納するか、Azure Key Vault。	はい
connectVia	データストアへの接続に使用するIntegration Runtime。詳細については、「前提条件」セクションを参照してください。指定しない場合は、既定のAzure Integration Runtimeが使用されます。	いいえ

サンプルのリンクされたサービスとデータセットの定義

シナリオ	リンクされたサービス定義の "host"	データセット定義の "folderPath"
リモート共有フォルダー: 例: \\myserver\share\* または \\myserver\share\folder\subfolder\*	JSON の場合: `\\\\myserver\\share` UI の場合: `\\myserver\share`	JSON の場合: `.\\` または `folder\\subfolder` UI の場合: `.\` または `folder\subfolder`

Note

UI を使用して作成する場合、JSON のように、エスケープするために二重バックスラッシュ (\\) を入力する必要はなく、単一のバックスラッシュを指定します。

Note

Azure Integration Runtimeでは、ローカルコンピューターからのファイルのコピーはサポートされていません。
セルフホステッド統合ランタイムでローカルコンピューターへのアクセスを有効にするには、こちらからコマンドラインを参照してください。これは既定で無効になっています。

例:

{
    "name": "FileLinkedService",
    "properties": {
        "type": "FileServer",
        "typeProperties": {
            "host": "<host>",
            "userId": "<domain>\\<user>",
            "password": {
                "type": "SecureString",
                "value": "<password>"
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

データセットのプロパティ

データセットを定義するために使用できるセクションとプロパティの完全な一覧については、データセットに関する記事をご覧ください。

Azure Data Factoryでは、次のファイル形式がサポートされています。形式ベースの設定については、各記事を参照してください。

ファイルシステムでは、形式ベースのデータセットの location 設定において、次のプロパティがサポートされています。

プロパティ	説明	必須
型	データセットの `location` の type プロパティは、FileServerLocation に設定する必要があります。	はい
folderPath	フォルダーのパス。フォルダーをフィルター処理するためにワイルドカードを使用する場合は、この設定をスキップし、アクティビティのソースの設定で指定します。共有用のフォルダーを公開するには、Windowsまたは Linux 環境でファイル共有の場所を設定する必要があります。	いいえ
fileName	特定の folderPath の下のファイル名。ファイルをフィルター処理するためにワイルドカードを使用する場合は、この設定をスキップし、アクティビティのソースの設定で指定します。	いいえ

例:

{
    "name": "DelimitedTextDataset",
    "properties": {
        "type": "DelimitedText",
        "linkedServiceName": {
            "referenceName": "<File system linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [ < physical schema, optional, auto retrieved during authoring > ],
        "typeProperties": {
            "location": {
                "type": "FileServerLocation",
                "folderPath": "root/folder/subfolder"
            },
            "columnDelimiter": ",",
            "quoteChar": "\"",
            "firstRowAsHeader": true,
            "compressionCodec": "gzip"
        }
    }
}

Copy activity のプロパティ

アクティビティの定義に利用できるセクションとプロパティの完全な一覧については、パイプラインに関する記事を参照してください。このセクションでは、ファイルシステムのソースとシンクでサポートされるプロパティの一覧を示します。

ソースとしてのファイルシステム

Azure Data Factoryでは、次のファイル形式がサポートされています。形式ベースの設定については、各記事を参照してください。

ファイルシステムでは、形式ベースのコピーソースの storeSettings 設定において、次のプロパティがサポートされています。

プロパティ	説明	必須
型	`storeSettings` の type プロパティは FileServerReadSettings に設定する必要があります。	はい
コピーするファイルを特定する:
オプション 1: 静的パス	データセットに指定されている所定のフォルダーまたはファイルパスからコピーします。フォルダーからすべてのファイルをコピーする場合は、さらに `wildcardFileName` として `*` を指定します。
オプション 2: サーバー側のフィルター -Filefilter	オプション 3 のワイルドカードフィルターより優れたパフォーマンスを提供する、ファイルサーバー側のネイティブフィルター。 0 個以上の文字に一致させるには `` を使用し、0 または 1 文字に一致させるには `?` を使用します。詳細および注については､このセクション*の下部の「解説」を参照してください。	いいえ
オプション 3: クライアント側のフィルター - ワイルドカードフォルダパス	ソースフォルダーをフィルター処理するための、ワイルドカード文字を含むフォルダーパス。このようなフィルター処理はサービス内で実行されます。指定されたパスにあるフォルダーまたはファイルが列挙され、その後、ワイルドカードフィルターが適用されます。使用できるワイルドカーは、`*` (ゼロ文字以上の文字に一致) と `?` (ゼロ文字または 1 文字に一致) です。実際のフォルダー名にワイルドカードまたはこのエスケープ文字が含まれている場合は、`^` を使用してエスケープします。「フォルダーとファイルフィルターの例」の他の例をご覧ください。	いいえ
オプション 3: クライアント側のフィルター - ワイルドカードファイル名	ソースファイルをフィルター処理するための、特定の folderPath/wildcardFolderPath の下のワイルドカード文字を含むファイル名。このようなフィルター処理はサービス内で行われます。指定されたパスにあるファイルが列挙され、ワイルドカードフィルターが適用されます。使用できるワイルドカーは、`*` (ゼロ文字以上の文字に一致) と `?` (ゼロ文字または 1 文字に一致) です。実際のファイル名にワイルドカードまたはこのエスケープ文字が含まれている場合は、`^` を使用してエスケープします。「フォルダーとファイルフィルターの例」の他の例をご覧ください。	はい
オプション 3: ファイルの一覧 - fileListPath（ファイルリストのパス）	指定されたファイルセットをコピーすることを示します。コピーするファイルの一覧を含むテキストファイルをポイントします。データセットで構成されているパスへの相対パスであるファイルを 1 行につき 1 つずつ指定します。このオプションを使用する場合は、データセット内でファイル名を指定しないでください。その他の例については、ファイルリストの例を参照してください。	いいえ
追加の設定:
recursive	データをサブフォルダーから再帰的に読み取るか、指定したフォルダーからのみ読み取るかを指定します。 recursive が true に設定されていて、シンクがファイルベースのストアである場合、空のフォルダーまたはサブフォルダーはシンクでコピーも作成もされません。使用可能な値: true (既定値) および false。 `fileListPath` を構成する場合、このプロパティは適用されません。	いいえ
deleteFilesAfterCompletion	バイナリファイルを宛先ストアに正常に移動した後、それらのバイナリファイルをソースストアから削除するかどうかを示します。ファイルの削除はファイルごとに行われます。つまり、アクティビティが失敗した場合、一部のファイルは既にコピー先にコピーされて、ソースから削除されています。一方で、他のファイルはまだソースストアに残されています。このプロパティは、バイナリファイルのコピーシナリオでのみ有効です。既定値: false。	いいえ
modifiedDatetimeStart	最終変更日時属性に基づくファイルフィルター。ファイルは、最終変更日時が `modifiedDatetimeStart` と同じかそれよりも後であり、`modifiedDatetimeEnd` よりも前である場合に選ばれます。時刻は、YYYY-MM-DDTHH:mm:ssZ の形式で UTC タイムゾーンに適用されます。各プロパティには NULL を指定できます。これは、ファイル属性フィルターをデータセットに適用しないことを意味します。 `modifiedDatetimeStart` で datetime 値を設定し、`modifiedDatetimeEnd` が NULL の場合は、最終変更日時属性が datetime 値と同じまたはそれより後であるファイルが選択されます。 `modifiedDatetimeEnd` で datetime 値を設定し、`modifiedDatetimeStart` が NULL の場合は、最終変更日時属性が datetime 値より前であるファイルが選択されます。 `fileListPath` を構成する場合、このプロパティは適用されません。	いいえ
modifiedDatetimeEnd	modifiedDateTimeStart と同じです。	いいえ
enablePartitionDiscovery	パーティション分割されているファイルの場合、ファイルパスのパーティションを解析し、それを追加のソース列として追加するかどうかを指定します。指定できる値は false (既定値) と true です。	いいえ
partitionRootPath	パーティション検出が有効になっている場合は、パーティション分割されたフォルダーをデータ列として読み取るための絶対ルートパスを指定します。これを指定していない場合は、既定で次のようになります。 - ソース上のデータセットまたはファイルの一覧内のファイルパスを使用する場合、パーティションのルートパスはそのデータセットで構成されているパスです。 - ワイルドカードフォルダーフィルターを使用する場合、最初のワイルドカードより前のサブパスが、パーティションのルートパスになります。たとえば、データセット内のパスを "root/folder/year=2020/month=08/day=27" として構成するとします。 - パーティションのルートパスを "root/folder/year=2020" として指定した場合は、Copy アクティビティによって、ファイル内の列に加え、それぞれ "08" や "27" という値を持つ、`month` や `day` という 2 つの追加の列が生成されます。 - パーティションのルートパスを指定していない場合、追加の列は生成されません。	いいえ
maxConcurrentConnections	アクティビティの実行中にデータストアに対して確立されるコンカレント接続数の上限。コンカレント接続数を制限する場合にのみ、値を指定します。	いいえ

例:

"activities":[
    {
        "name": "CopyFromFileSystem",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Delimited text input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "DelimitedTextSource",
                "formatSettings":{
                    "type": "DelimitedTextReadSettings",
                    "skipLineCount": 10
                },
                "storeSettings":{
                    "type": "FileServerReadSettings",
                    "recursive": true,
                    "wildcardFolderPath": "myfolder*A",
                    "wildcardFileName": "*.csv"
                }
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

シンクとしてのファイルシステム

Azure Data Factoryでは、次のファイル形式がサポートされています。形式ベースの設定については、各記事を参照してください。

Note

MergeFilescopyBehavior オプションは、Synapse Analytics パイプラインではなく、Azure Data Factory パイプラインでのみ使用できます。

ファイルシステムでは、形式ベースのコピーシンクの storeSettings 設定において、次のプロパティがサポートされています。

プロパティ	説明	必須
型	`storeSettings` の type プロパティは FileServerWriteSettings に設定する必要があります。	はい
copyBehavior	ソースがファイルベースのデータストアのファイルの場合は、コピー動作を定義します。使用できる値は、以下のとおりです。 - PreserveHierarchy (既定値): ファイル階層をターゲットフォルダー内で保持します。ソースフォルダーに対するソースファイルの相対パスと、ターゲットフォルダーに対するターゲットファイルの相対パスが一致します。 - FlattenHierarchy: ソースフォルダー内に存在しているすべてのファイルが、ターゲットフォルダーの第一レベルに配置されます。ターゲットファイルは、自動生成された名前になります。 - MergeFiles: ソースフォルダーのすべてのファイルを 1 つのファイルにマージします。ファイル名を指定した場合、マージされたファイル名は指定した名前になります。それ以外は自動生成されたファイル名になります。	いいえ
maxConcurrentConnections	アクティビティの実行中にデータストアに対して確立されるコンカレント接続数の上限。コンカレント接続数を制限する場合にのみ、値を指定します。	いいえ

例:

"activities":[
    {
        "name": "CopyToFileSystem",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Parquet output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "ParquetSink",
                "storeSettings":{
                    "type": "FileServerWriteSettings",
                    "copyBehavior": "PreserveHierarchy"
                }
            }
        }
    }
]

フォルダーとファイルフィルターの例

このセクションでは、ワイルドカードフィルターを使用した結果のフォルダーのパスとファイル名の動作について説明します。

folderPath	fileName	recursive	ソースのフォルダー構造とフィルターの結果 (太字のファイルが取得されます)
`Folder*`	(空、既定値を使用)	false	FolderA File1.csv File2.json Subfolder1 File3.csv File4.json File5.csv AnotherFolderB File6.csv
`Folder*`	(空、既定値を使用)	true	FolderA File1.csv File2.json Subfolder1 File3.csv File4.json File5.csv AnotherFolderB File6.csv
`Folder*`	`*.csv`	false	FolderA File1.csv File2.json Subfolder1 File3.csv File4.json File5.csv AnotherFolderB File6.csv
`Folder*`	`*.csv`	true	FolderA File1.csv File2.json Subfolder1 File3.csv File4.json File5.csv AnotherFolderB File6.csv

ファイルリストの例

このセクションでは、コピーアクティビティのソースでファイルリストパスを使用した結果の動作について説明します。

次のソースフォルダー構造があり、太字のファイルをコピーするとします。

サンプルのソース構造	FileListToCopy.txt のコンテンツ	パイプラインの構成
ルート FolderA File1.csv File2.json Subfolder1 File3.csv File4.json File5.csv Metadata FileListToCopy.txt	File1.csv Subfolder1/File3.csv Subfolder1/File5.csv	データセット内: - フォルダーパス: `root/FolderA` Copy アクティビティのソース内: - ファイルリストのパス: `root/Metadata/FileListToCopy.txt` ファイルリストのパスは、同じデータストア内にある 1 個のテキストファイルを指します。このファイルに、コピーしようとするファイルのリストを含めます。各行には、データセット内で構成したルートパスを基準として、各ファイルへの相対パスを含めます。

recursive と copyBehavior の例

このセクションでは、recursive 値と copyBhavior 値の組み合わせごとに、Copy 操作で行われる動作について説明します。

recursive	copyBehavior	ソースのフォルダー構造	ターゲットの結果
true	preserveHierarchy	Folder1 File1 File2 Subfolder1 File3 File4 File5	ターゲットフォルダー Folder1 は、ソースと同じ構造で作成されます。 Folder1 File1 File2 Subfolder1 File3 File4 File5.
true	flattenHierarchy	Folder1 File1 File2 Subfolder1 File3 File4 File5	ターゲットの Folder1 は、次の構造で作成されます。 Folder1 File1 の自動生成された名前 File2 の自動生成された名前 File3 の自動生成された名前 File4 の自動生成された名前 File5 の自動生成された名前
true	mergeFiles	Folder1 File1 File2 Subfolder1 File3 File4 File5	ターゲットの Folder1 は、次の構造で作成されます。 Folder1 File1、File2、File3、File4、File5 の内容は、自動生成されたファイル名を持つ 1 つのファイルにマージされます
false	preserveHierarchy	Folder1 File1 File2 Subfolder1 File3 File4 File5	ターゲットフォルダー Folder1 は、次の構造で作成されます。 Folder1 File1 File2 Subfolder1 と File3、File4、File5 は取得されません。
false	flattenHierarchy	Folder1 File1 File2 Subfolder1 File3 File4 File5	ターゲットフォルダー Folder1 は、次の構造で作成されます。 Folder1 File1 の自動生成された名前 File2 の自動生成された名前 Subfolder1 と File3、File4、File5 は取得されません。
false	mergeFiles	Folder1 File1 File2 Subfolder1 File3 File4 File5	ターゲットフォルダー Folder1 は、次の構造で作成されます。 Folder1 File1、File2 の内容は 1 つのファイルにマージされ、自動生成されたファイル名が付けられます。 File1 の自動生成された名前 Subfolder1 と File3、File4、File5 は取得されません。

Lookup アクティビティのプロパティ

プロパティの詳細については、Lookup アクティビティに関するページを参照してください。

GetMetadata アクティビティのプロパティ

プロパティの詳細については、「GetMetadata アクティビティ」を参照してください。

Delete アクティビティのプロパティ

プロパティの詳細については、「Delete アクティビティ」を参照してください。

レガシモデル

Note

次のモデルは、下位互換性のために引き続きそのままサポートされます。今後は、上記のセクションで説明した新しいモデルを使用することをお勧めします。作成 UI は、新しいモデルを生成するように切り替えられています。

レガシデータセットモデル

プロパティ	説明	必須
型	データセットの type プロパティは、次のように設定する必要があります:FileShare	はい
folderPath	フォルダーへのパス。ワイルドカードフィルターがサポートされています。使用できるワイルドカーは、`*` (ゼロ文字以上の文字に一致) と `?` (ゼロ文字または 1 文字に一致) です。実際のフォルダー名にワイルドカードまたはこのエスケープ文字が含まれている場合は、`^` を使用してエスケープします。例: ルートフォルダー/サブフォルダー。「サンプルのリンクされたサービスとデータセットの定義」および「フォルダーとファイルフィルターの例」の例も参照してください。	いいえ
fileName	指定した "folderPath" の下にあるファイルを対象にする、名前またはワイルドカードフィルター。このプロパティの値を指定しない場合、データセットはフォルダー内のすべてのファイルをポイントします。フィルターに使用できるワイルドカードは、`` (ゼロ文字以上の文字に一致) と `?` (ゼロ文字または 1 文字に一致) です。 - 例 1: `"fileName": ".csv"` - 例 2: `"fileName": "???20180427.txt"` 実際のファイル名にワイルドカードまたはこのエスケープ文字が含まれている場合は、`^` を使用してエスケープします。出力データセットに fileName の指定がなく、アクティビティシンクに preserveHierarchy の指定がない場合、コピーアクティビティは、"Data.0a405f8a-93ff-4c6f-b3be-f69616f1df7a.txt.gz" のように "Data.[アクティビティ実行 ID GUID].[FlattenHierarchy の場合は GUID].[構成されている場合は形式].[構成されている場合は圧縮] " のパターンでファイル名を自動生成します。クエリの代わりにテーブル名を使用して表形式のソースからコピーする場合、名前のパターンは "MyTable.csv" のように " [テーブル名].[形式].[構成されている場合は圧縮] " になります。	いいえ
modifiedDatetimeStart	最終変更日時属性に基づくファイルフィルター。ファイルは、最終変更日時が `modifiedDatetimeStart` と同じかそれよりも後であり、`modifiedDatetimeEnd` よりも前である場合に選ばれます。時刻は、YYYY-MM-DDTHH:mm:ssZ の形式で UTC タイムゾーンに適用されます。多数のファイルに対してファイルフィルター処理を実行する場合は、この設定を有効にすると、データ移動の全体的なパフォーマンスが影響を受けることに注意してください。各プロパティには NULL を指定できます。これは、ファイル属性フィルターをデータセットに適用しないことを意味します。 `modifiedDatetimeStart` で datetime 値を設定し、`modifiedDatetimeEnd` が NULL の場合は、最終変更日時属性が datetime 値と同じまたはそれより後であるファイルが選択されます。 `modifiedDatetimeEnd` で datetime 値を設定し、`modifiedDatetimeStart` が NULL の場合は、最終変更日時属性が datetime 値より前であるファイルが選択されます。	いいえ
modifiedDatetimeEnd	最終変更日時属性に基づくファイルフィルター。ファイルは、最終変更日時が `modifiedDatetimeStart` と同じかそれよりも後であり、`modifiedDatetimeEnd` よりも前である場合に選ばれます。時刻は "2018-12-01T05:00:00Z" の形式で UTC タイムゾーンに適用されます。多数のファイルに対してファイルフィルター処理を実行する場合は、この設定を有効にすると、データ移動の全体的なパフォーマンスが影響を受けることに注意してください。各プロパティには NULL を指定できます。これは、ファイル属性フィルターをデータセットに適用しないことを意味します。 `modifiedDatetimeStart` で datetime 値を設定し、`modifiedDatetimeEnd` が NULL の場合は、最終変更日時属性が datetime 値と同じまたはそれより後であるファイルが選択されます。 `modifiedDatetimeEnd` で datetime 値を設定し、`modifiedDatetimeStart` が NULL の場合は、最終変更日時属性が datetime 値より前であるファイルが選択されます。	いいえ
format	ファイルベースのストア間でファイルをそのままコピー (バイナリコピー) する場合は、入力と出力の両方のデータセット定義で format セクションをスキップします。特定の形式のファイルを解析または生成する場合、サポートされるファイル形式の種類は、TextFormat、JsonFormat、AvroFormat、OrcFormat、ParquetFormat です。形式の type プロパティをいずれかの値に設定します。詳細については、「テキスト形式、 JSON 形式、 Avro 形式、 Orc 形式、 Parquet 形式」セクションを参照してください。	いいえ (バイナリコピーシナリオのみ)
圧縮	データの圧縮の種類とレベルを指定します。詳細については、サポートされるファイル形式と圧縮コーデックに関する記事を参照してください。サポートされる種類は、GZip、Deflate、BZip2、ZipDeflate です。サポートされるレベルは、Optimal と Fastest です。	いいえ

ヒント

フォルダーの下のすべてのファイルをコピーするには、folderPath のみを指定します。
特定の名前の単一のファイルをコピーするには、フォルダー部分で folderPath、ファイル名で fileName を指定します。
フォルダーの下のファイルのサブセットをコピーするには、フォルダー部分で folderPath、ワイルドカードフィルターで fileName を指定します。

Note

ファイルフィルターで "fileFilter" プロパティを使用していた場合は、そのまま引き続きサポートされますが、今後は "fileName" に追加された新しいフィルター機能を使用することをお勧めします。

例:

{
    "name": "FileSystemDataset",
    "properties": {
        "type": "FileShare",
        "linkedServiceName":{
            "referenceName": "<file system linked service name>",
            "type": "LinkedServiceReference"
        },
        "typeProperties": {
            "folderPath": "folder/subfolder/",
            "fileName": "*",
            "modifiedDatetimeStart": "2018-12-01T05:00:00Z",
            "modifiedDatetimeEnd": "2018-12-01T06:00:00Z",
            "format": {
                "type": "TextFormat",
                "columnDelimiter": ",",
                "rowDelimiter": "\n"
            },
            "compression": {
                "type": "GZip",
                "level": "Optimal"
            }
        }
    }
}

レガシコピーアクティビティソースモデル

プロパティ	説明	必須
型	コピーアクティビティのソースの type プロパティは、次のように設定する必要があります:FileSystemSource	はい
recursive	データをサブフォルダーから再帰的に読み取るか、指定したフォルダーからのみ読み取るかを指定します。 recursive を true に設定し、シンクがファイルベースのストアである場合、空のフォルダー/サブフォルダーはシンク側でコピーも作成もされないことに注意してください。使用可能な値: true (既定値)、false	いいえ
maxConcurrentConnections	アクティビティの実行中にデータストアに対して確立されるコンカレント接続数の上限。コンカレント接続数を制限する場合にのみ、値を指定します。	いいえ

例:

"activities":[
    {
        "name": "CopyFromFileSystem",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<file system input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "FileSystemSource",
                "recursive": true
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

レガシコピーアクティビティシンクモデル

プロパティ	説明	必須
型	コピーアクティビティのシンクの type プロパティは、次のように設定する必要があります: FileSystemSink	はい
copyBehavior	ソースがファイルベースのデータストアのファイルの場合は、コピー動作を定義します。使用できる値は、以下のとおりです。 - PreserveHierarchy (既定値): ファイル階層をターゲットフォルダー内で保持します。ソースフォルダーに対するソースファイルの相対パスと、ターゲットフォルダーに対するターゲットファイルの相対パスが一致します。 - FlattenHierarchy: ソースフォルダー内に存在しているすべてのファイルが、ターゲットフォルダーの第一レベルに配置されます。ターゲットファイルの名前は、自動生成されます。 - MergeFiles: ソースフォルダーのすべてのファイルを 1 つのファイルにマージします。レコードの重複除去は、マージ中には実行されません。ファイル名を指定した場合、マージされたファイル名は指定した名前になります。それ以外の場合は、自動生成されたファイル名になります。	いいえ
maxConcurrentConnections	アクティビティの実行中にデータストアに対して確立されるコンカレント接続数の上限。コンカレント接続数を制限する場合にのみ、値を指定します。	いいえ

例:

"activities":[
    {
        "name": "CopyToFileSystem",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<file system output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "FileSystemSink",
                "copyBehavior": "PreserveHierarchy"
            }
        }
    }
]

Copy アクティビティでソースおよびシンクとしてサポートされるデータストアの一覧については、サポートされるデータストアに関するセクションを参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-01-06

Azure Data FactoryまたはAzure Synapse Analyticsを使用してファイル システム間でデータをコピーする

サポートされる機能

前提条件

概要

UI を使用してファイル システムのリンク サービスを作成する

コネクタの構成の詳細

リンクされたサービスのプロパティ

サンプルのリンクされたサービスとデータセットの定義

データセットのプロパティ

Copy activity のプロパティ

ソースとしてのファイル システム

シンクとしてのファイル システム

フォルダーとファイル フィルターの例

ファイル リストの例

recursive と copyBehavior の例

Lookup アクティビティのプロパティ

GetMetadata アクティビティのプロパティ

Delete アクティビティのプロパティ

レガシ モデル

レガシ データセット モデル

レガシ コピー アクティビティ ソース モデル

レガシ コピー アクティビティ シンク モデル

関連コンテンツ

フィードバック

その他のリソース

Azure Data FactoryまたはAzure Synapse Analyticsを使用してファイルシステム間でデータをコピーする

UI を使用してファイルシステムのリンクサービスを作成する

ソースとしてのファイルシステム

シンクとしてのファイルシステム

フォルダーとファイルフィルターの例

ファイルリストの例

レガシモデル

レガシデータセットモデル

レガシコピーアクティビティソースモデル

レガシコピーアクティビティシンクモデル