Microsoft Fabric の Data Factory での XML 形式
この記事では、Microsoft Fabric の Data Factory のデータ パイプラインで XML 形式を構成する方法の概要を示します。
XML 形式は、ソースとして次のアクティビティとコネクタでサポートされています。
カテゴリ | コネクタ/アクティビティ |
---|---|
サポートされているコネクタ | Amazon S3 |
Amazon S3 互換 | |
Azure Blob Storage | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
ファイル システム | |
FTP | |
Google Cloud Storage | |
HTTP | |
レイクハウス ファイル | |
Oracle Cloud Storage | |
SFTP | |
サポートされているアクティビティ | Copy アクティビティ (ソース/-) |
Lookup アクティビティ | |
GetMetadata アクティビティ | |
アクティビティを削除する |
XML 形式を構成するには、データ パイプラインの Copy アクティビティのソースで接続を選択し、[ファイル形式] のドロップダウン リストで [XML] を選択します。 この形式をさらに構成するには、[設定] を選択します。
[ファイル形式] セクションで [設定] を選択すると、ポップアップの [File format settings] (ファイル形式設定) ダイアログ ボックスに以下のプロパティが表示されます。
[圧縮の種類]: XML ファイルの読み取りに使用される圧縮コーデック。 ドロップダウン リストでは、[なし]、[bzip2]、[gzip]、[deflate]、[ZipDeflate]、[TarGZip]、[tar] の種類から選択できます。
圧縮の種類として [ZipDeflate] を選択した場合、[ソース] タブの [詳細設定] に [Preserve zip file name as folder] (ZIP ファイル名をフォルダーとして保持する) が表示されます。
- [Preserve zip file name as folder] (ZIP ファイル名をフォルダーとして保持する): コピー時にソースの ZIP ファイル名をフォルダー構造として保持するかどうかを指定します。
- このボックスがオン (既定値) の場合、解凍されたファイルはサービスによって
<specified file path>/<folder named as source zip file>/
に書き込まれます。 - このボックスがオフの場合、解凍されたファイルはサービスによって
<specified file path>
に直接書き込まれます。 競合または予期しない動作を避けるために、異なるソース ZIP ファイルに重複したファイル名がないことを確認します。
- このボックスがオン (既定値) の場合、解凍されたファイルはサービスによって
圧縮の種類として [TarGZip/tar] を選択した場合、[ソース] タブの [詳細設定] に [Preserve compression file name as folder] (圧縮ファイル名をフォルダーとして保持する) が表示されます。
- [Preserve compression file name as folder] (圧縮ファイル名をフォルダーとして保持する): コピー時にソースの圧縮ファイル名をフォルダー構造として保持するかどうかを指定します。
- このボックスがオン (既定値) の場合、圧縮解除されたファイルがサービスによって
<specified file path>/<folder named as source compressed file>/
に書き込まれます。 - このボックスがオフの場合、圧縮解除されたファイルがサービスによって
<specified file path>
に直接書き込まれます。 競合または予期しない動作を避けるために、異なるソース ファイルに重複したファイル名がないことを確認します。
- このボックスがオン (既定値) の場合、圧縮解除されたファイルがサービスによって
- [Preserve zip file name as folder] (ZIP ファイル名をフォルダーとして保持する): コピー時にソースの ZIP ファイル名をフォルダー構造として保持するかどうかを指定します。
[圧縮レベル]: 圧縮の種類を選択するときに圧縮率を指定します。 [最速] または [最適] から選べます。
- Fastest: 圧縮操作は可能な限り短時間で完了しますが、圧縮後のファイルが最適に圧縮されていない場合があります。
- Optimal:圧縮操作で最適に圧縮されますが、操作が完了するまでに時間がかかる場合があります。 詳細については、 圧縮レベル に関するトピックをご覧ください。
[エンコード]: テスト ファイルの書き込みに使うエンコードの種類を指定します。 ドロップダウン リストから種類を 1 つ選びます。 既定値は UTF-8です。
[NULL 値]: null 値の文字列表現を指定します。 既定値は空の文字列です。
[ソース] タブの [詳細] 設定に、XML 形式に関係する次のプロパティが表示されます。
検証モード: XML スキーマを検証するかどうかを指定します。 ドロップダウン リストからモードを 1 つ選びます。
- なし: 検証モードを使用しない場合は、これを選択します。
- xsd: XSD を使用して XML スキーマを検証するには、これを選択します。
- dtd: DTD を使用して XML スキーマを検証するには、これを選択します。
名前空間: XML ファイルの解析時に名前空間を有効にするかどうかを指定します。 これは既定で選択されています。
名前空間プレフィックスのペア: [名前空間] が有効になっている場合は、[+ 新規] を選択し、[URL] と [プレフィックス] を指定します。 [+ 新規] を選択すると、ペアをさらに追加できます。
名前空間 URI とプレフィックスのマッピングは、XML ファイルの解析時にフィールドに名前を付けるために使用されます。 XML ファイルに名前空間があり、名前空間が有効になっている場合、既定では、フィールド名は XML ドキュメント内のものと同じになります。 このマップの名前空間 URI に対して定義された項目がある場合、フィールド名はprefix:fieldName
です。データ型の検出: 整数、倍精度、ブール値のデータ型を検出するかどうかを指定します。 これは既定で選択されています。
XML 形式を使う場合、Copy アクティビティの [ソース] セクションでは、次のプロパティがサポートされます。
名前 | 説明 | Value | 必須 | JSON スクリプト プロパティ |
---|---|---|---|---|
ファイル形式 | 使用するファイル形式。 | XML | はい | type ("datasetSettings の下"):Xml |
[圧縮の種類] | XML ファイルの読み取りに使用される圧縮コーデック。 | なし bzip2 gzip deflate ZipDeflate TarGZip tar |
いいえ | type ("compression の下"):bzip2 gzip deflate ZipDeflate TarGZip tar |
圧縮レベル | 圧縮率です。 | Fastest Optimal |
なし | level ("compression の下"):Fastest 最適 |
[エンコード] | テスト ファイルの読み取りに使われるエンコードの種類。 | "UTF-8" (既定値)、"BOM なしの UTF-8"、"UTF-16LE"、"UTF-16BE"、"UTF-32LE"、"UTF-32BE"、"US-ASCII"、"UTF-7"、"BIG5"、"EUC-JP"、"EUC-KR"、"GB2312"、"GB18030"、"JOHAB"、"SHIFT-JIS"、"CP875"、"CP866"、"IBM00858"、"IBM037"、"IBM273"、"IBM437"、"IBM500"、"IBM737"、"IBM775"、"IBM850"、"IBM852"、"IBM855"、"IBM857"、"IBM860"、"IBM861"、"IBM863"、"IBM864"、"IBM865"、"IBM869"、"IBM870"、"IBM01140"、"IBM01141"、"IBM01142"、"IBM01143"、"IBM01144"、"IBM01145"、"IBM01146"、"IBM01147"、"IBM01148"、"IBM01149"、"ISO-2022-JP"、"ISO-2022-KR"、"ISO-8859-1"、"ISO-8859-2"、"ISO-8859-3"、"ISO-8859-4"、"ISO-8859-5"、"ISO-8859-6"、"ISO-8859-7"、"ISO-8859-8"、"ISO-8859-9"、"ISO-8859-13"、"ISO-8859-15"、"WINDOWS-874"、"WINDOWS-1250"、"WINDOWS-1251"、"WINDOWS-1252"、"WINDOWS-1253"、"WINDOWS-1254"、"WINDOWS-1255"、"WINDOWS-1256"、"WINDOWS-1257"、"WINDOWS-1258" | なし | encodingName |
Preserve zip file name as folder (ZIP ファイル名をフォルダーとして保持する) | コピー時にソースの ZIP ファイル名をフォルダー構造として保持するかどうかを指定します。 | オン (既定値) またはオフ | いいえ | preserveZipFileNameAsFolder (" compressionProperties ->type の下に ZipDeflateReadSettings として"):true (既定値) または false |
Preserve compression file name as folder (圧縮ファイル名をフォルダーとして保持する) | コピー時にソースの圧縮ファイル名をフォルダー構造として保持するかどうかを指定します。 | オン (既定値) またはオフ | いいえ | preserveCompressionFileNameAsFolder (" compressionProperties ->type の下に TarGZipReadSettings または TarReadSettings として"):true (既定値) または false |
[Null value](Null 値) | null 値の文字列表現。 | <null 値> 空の文字列 (既定値) |
なし | nullValue |
検証モード | XML スキーマを検証するかどうか。 | なし xsd dtd |
いいえ | validationMode: xsd dtd |
名前空間 | XML ファイルの解析時に名前空間を有効にするかどうか。 | オン (既定値) またはオフ | いいえ | namespaces: true (既定値) または false |
名前空間プレフィックスのペア | 名前空間 URI とプレフィックスのマッピング。XML ファイルの解析時にフィールドに名前を付けるために使用されます。 XML ファイルに名前空間があり、名前空間が有効になっている場合、既定では、フィールド名は XML ドキュメント内のものと同じになります。 このマップの名前空間 URI に対して定義された項目がある場合、フィールド名は prefix:fieldName です。 |
< url >:< プレフィックス > | いいえ | namespacePrefixes: < url >:< プレフィックス > |
データ型の検出 | 整数、倍精度、およびブール値のデータ型を検出するかどうか。 | オン (既定値) またはオフ | いいえ | detectDataType: true (既定値) または false |