XML (拡張マークアップ言語) は、構造化データ交換用のテキスト ベースの形式です。 この記事では、Microsoft Fabricの Data Factory のコピー アクティビティ パイプラインで XML 形式をソースとして構成する方法について説明します。
サポートされる機能
XML 形式は、ソースとして次のアクティビティとコネクタでサポートされています。
| カテゴリ | コネクタ/アクティビティ |
|---|---|
| サポートされているコネクタ | アマゾンS3 |
| Amazon S3 互換 | |
| Azure Blob Storage | |
| Azure Data Lake Storage Gen2 | |
| Azure Files | |
| ファイル システム | |
| FTP | |
| Google Cloud Storage | |
| HTTP | |
| レイクハウス ファイル | |
| Oracle Cloud Storage | |
| SFTP | |
| サポートされているアクティビティ | コピー処理 (ソース/-) |
| Lookup アクティビティ | |
| メタデータ取得アクティビティ | |
| アクティビティを削除する |
Copy アクティビティの XML 形式
XML 形式を構成するには、パイプライン コピー アクティビティのソースで接続を選択し、ファイル形式のドロップダウン リストで [XML] を選択します。 この形式をさらに構成するには、[設定] を選択します。
ソースとしての XML
[ファイル形式] セクションで [設定] を選択すると、ポップアップの [File format settings] (ファイル形式設定) ダイアログ ボックスに以下のプロパティが表示されます。
[圧縮の種類]: XML ファイルの読み取りに使用される圧縮コーデック。 ドロップダウン リストでは、[なし]、[bzip2]、[gzip]、[deflate]、[ZipDeflate]、[TarGZip]、[tar] の種類から選択できます。
圧縮の種類として [ZipDeflate] を選択した場合、[ソース] タブの [詳細設定] に [Preserve zip file name as folder] (ZIP ファイル名をフォルダーとして保持する) が表示されます。
-
[Preserve zip file name as folder] (ZIP ファイル名をフォルダーとして保持する): コピー時にソースの ZIP ファイル名をフォルダー構造として保持するかどうかを指定します。
- このボックスがオン (既定値) の場合、解凍されたファイルはサービスによって
<specified file path>/<folder named as source zip file>/に書き込まれます。 - このボックスがオフの場合、解凍されたファイルはサービスによって
<specified file path>に直接書き込まれます。 競合または予期しない動作を避けるために、異なるソース ZIP ファイルに重複したファイル名がないことを確認します。
- このボックスがオン (既定値) の場合、解凍されたファイルはサービスによって
圧縮の種類として [TarGZip/tar] を選択した場合、[ソース] タブの [詳細設定] に [Preserve compression file name as folder] (圧縮ファイル名をフォルダーとして保持する) が表示されます。
-
[Preserve compression file name as folder] (圧縮ファイル名をフォルダーとして保持する): コピー時にソースの圧縮ファイル名をフォルダー構造として保持するかどうかを指定します。
- このボックスがオン (既定値) の場合、圧縮解除されたファイルがサービスによって
<specified file path>/<folder named as source compressed file>/に書き込まれます。 - このボックスがオフの場合、圧縮解除されたファイルがサービスによって
<specified file path>に直接書き込まれます。 競合または予期しない動作を避けるために、異なるソース ファイルに重複したファイル名がないことを確認します。
- このボックスがオン (既定値) の場合、圧縮解除されたファイルがサービスによって
-
[Preserve zip file name as folder] (ZIP ファイル名をフォルダーとして保持する): コピー時にソースの ZIP ファイル名をフォルダー構造として保持するかどうかを指定します。
[圧縮レベル]: 圧縮の種類を選択するときに圧縮率を指定します。 [最速] または [最適] から選べます。
- Fastest: 圧縮操作は可能な限り短時間で完了しますが、圧縮後のファイルが最適に圧縮されていない場合があります。
- Optimal:圧縮操作で最適に圧縮されますが、操作が完了するまでに時間がかかる場合があります。 詳細については、 圧縮レベル に関するトピックをご覧ください。
エンコード: テキスト ファイルの読み取りに使用するエンコードの種類を指定します。 ドロップダウン リストから種類を 1 つ選びます。 既定値は UTF-8です。
[NULL 値]: null 値の文字列表現を指定します。 既定値は空の文字列です。
[ソース] タブの [詳細] 設定に、XML 形式に関係する次のプロパティが表示されます。
検証モード: XML スキーマを検証するかどうかを指定します。 ドロップダウン リストからモードを 1 つ選びます。
- なし: 検証モードを使用しない場合は、これを選択します。
- xsd: XSD を使用して XML スキーマを検証するには、これを選択します。
- dtd: DTD を使用して XML スキーマを検証するには、これを選択します。
名前空間: XML ファイルの解析時に名前空間を有効にするかどうかを指定します。 これは既定で選択されています。
名前空間プレフィックスのペア: [名前空間] が有効になっている場合は、[+ 新規] を選択し、[URL] と [プレフィックス] を指定します。 [+ 新規] を選択すると、ペアをさらに追加できます。
名前空間 URI とプレフィックスのマッピングは、XML ファイルの解析時にフィールドに名前を付けるために使用されます。 XML ファイルに名前空間があり、名前空間が有効になっている場合、既定では、フィールド名は XML ドキュメント内のものと同じになります。 このマップの名前空間 URI に対して定義された項目がある場合、フィールド名はprefix:fieldNameです。
データ型の検出: 整数、倍精度、ブール値のデータ型を検出するかどうかを指定します。 これは既定で選択されています。
XML コピー アクティビティのプロパティ
ソースとしての XML
XML 形式を使う場合、Copy アクティビティの [ソース] セクションでは、次のプロパティがサポートされます。
| 名前 | 説明 | 値 | 必須 | JSON スクリプト プロパティ |
|---|---|---|---|---|
| ファイル形式 | 使用するファイル形式。 | XML | はい | type (datasetSettings の下):Xml |
| [圧縮の種類] | XML ファイルの読み取りに使用される圧縮コーデック。 |
なし bzip2 gzip デフレート ZipDeflate TarGZip tar |
いいえ | type (compression 以下で):bzip2 gzip デフレート ZipDeflate TarGZip tar |
| 圧縮レベル | 圧縮率です。 |
最速 Optimal |
なし | レベル (compression の下):最速 最適 |
| [エンコード] | テキスト ファイルの読み取りに使用されるエンコードの種類。 | "UTF-8" (既定値)、"BOM なしの UTF-8"、"UTF-16LE"、"UTF-16BE"、"UTF-32LE"、"UTF-32BE"、"US-ASCII"、"UTF-7"、"BIG5"、"EUC-JP"、"EUC-KR"、"GB2312"、"GB18030"、"JOHAB"、"SHIFT-JIS"、"CP875"、"CP866"、"IBM00858"、"IBM037"、"IBM273"、"IBM437"、"IBM500"、"IBM737"、"IBM775"、"IBM850"、"IBM852"、"IBM855"、"IBM857"、"IBM860"、"IBM861"、"IBM863"、"IBM864"、"IBM865"、"IBM869"、"IBM870"、"IBM01140"、"IBM01141"、"IBM01142"、"IBM01143"、"IBM01144"、"IBM01145"、"IBM01146"、"IBM01147"、"IBM01148"、"IBM01149"、"ISO-2022-JP"、"ISO-2022-KR"、"ISO-8859-1"、"ISO-8859-2"、"ISO-8859-3"、"ISO-8859-4"、"ISO-8859-5"、"ISO-8859-6"、"ISO-8859-7"、"ISO-8859-8"、"ISO-8859-9"、"ISO-8859-13"、"ISO-8859-15"、"WINDOWS-874"、"WINDOWS-1250"、"WINDOWS-1251"、"WINDOWS-1252"、"WINDOWS-1253"、"WINDOWS-1254"、"WINDOWS-1255"、"WINDOWS-1256"、"WINDOWS-1257"、"WINDOWS-1258" | なし | エンコーディング名 |
| Preserve zip file name as folder (ZIP ファイル名をフォルダーとして保持する) | コピー時にソースの ZIP ファイル名をフォルダー構造として保持するかどうかを指定します。 | 選択済み(既定値)または選択解除 | いいえ | preserveZipFileNameAsFolder (" compressionProperties->type の下に ZipDeflateReadSettings として"):true (既定値) または false |
| Preserve compression file name as folder (圧縮ファイル名をフォルダーとして保持する) | コピー時にソースの圧縮ファイル名をフォルダー構造として保持するかどうかを指定します。 | 選択済み(既定値)または選択解除 | いいえ | 圧縮ファイル名をフォルダ名として保存する (preserveCompressionFileNameAsFolder) (" compressionProperties->type の下に TarGZipReadSettings または TarReadSettings として"):true (既定値) または false |
| [Null value](Null 値) | null 値の文字列表現。 |
<あなたのnull値> 空の文字列 (既定値) |
なし | nullValue |
| 検証モード | XML スキーマを検証するかどうか。 |
なし xsd dtd |
いいえ | 検証モード (validationMode) xsd dtd |
| 名前空間 | XML ファイルの解析時に名前空間を有効にするかどうか。 | 選択済み (既定値) または未選択 | いいえ | ネームスペース true (既定値) または false |
| 名前空間プレフィックスのペア | 名前空間 URI とプレフィックスのマッピング。XML ファイルの解析時にフィールドに名前を付けるために使用されます。 XML ファイルに名前空間があり、名前空間が有効になっている場合、既定では、フィールド名は XML ドキュメント内のものと同じになります。 このマップの名前空間 URI に対して定義された項目がある場合、フィールド名は prefix:fieldName です。 |
< url >:< プレフィックス > | いいえ | ネームスペースプレフィックス: < url >:< プレフィックス > |
| データ型の検出 | 整数、倍精度、およびブール値のデータ型を検出するかどうか。 | 選択済み (既定値) または未選択 | いいえ | detectDataType: true (既定値) または false |