次の方法で共有


Microsoft Fabric の Data Factory での XML 形式

この記事では、Microsoft Fabric の Data Factory のデータ パイプラインで XML 形式を構成する方法の概要を示します。

サポートされる機能

XML 形式は、ソースとして次のアクティビティとコネクタでサポートされています。

カテゴリ コネクタ/アクティビティ
サポートされているコネクタ Amazon S3
Amazon S3 互換
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure Files
ファイル システム
FTP
Google Cloud Storage
HTTP
レイクハウス ファイル
Oracle Cloud Storage
SFTP
サポートされているアクティビティ Copy アクティビティ (ソース/-)
Lookup アクティビティ
GetMetadata アクティビティ
アクティビティを削除する

Copy アクティビティの XML 形式

XML 形式を構成するには、データ パイプラインの Copy アクティビティのソースで接続を選択し、[ファイル形式] のドロップダウン リストで [XML] を選択します。 この形式をさらに構成するには、[設定] を選択します。

ファイル形式の設定を示すスクリーンショット。

ソースとしての XML

[ファイル形式] セクションで [設定] を選択すると、ポップアップの [File format settings] (ファイル形式設定) ダイアログ ボックスに以下のプロパティが表示されます。

ファイル形式の選択を示すスクリーンショット。

  • [圧縮の種類]: XML ファイルの読み取りに使用される圧縮コーデック。 ドロップダウン リストでは、[なし][bzip2][gzip][deflate][ZipDeflate][TarGZip][tar] の種類から選択できます。

    圧縮の種類として [ZipDeflate] を選択した場合、[ソース] タブの [詳細設定][Preserve zip file name as folder] (ZIP ファイル名をフォルダーとして保持する) が表示されます。

    • [Preserve zip file name as folder] (ZIP ファイル名をフォルダーとして保持する): コピー時にソースの ZIP ファイル名をフォルダー構造として保持するかどうかを指定します。
      • このボックスがオン (既定値) の場合、解凍されたファイルはサービスによって <specified file path>/<folder named as source zip file>/ に書き込まれます。
      • このボックスがオフの場合、解凍されたファイルはサービスによって <specified file path> に直接書き込まれます。 競合または予期しない動作を避けるために、異なるソース ZIP ファイルに重複したファイル名がないことを確認します。

    圧縮の種類として [TarGZip/tar] を選択した場合、[ソース] タブの [詳細設定][Preserve compression file name as folder] (圧縮ファイル名をフォルダーとして保持する) が表示されます。

    • [Preserve compression file name as folder] (圧縮ファイル名をフォルダーとして保持する): コピー時にソースの圧縮ファイル名をフォルダー構造として保持するかどうかを指定します。
      • このボックスがオン (既定値) の場合、圧縮解除されたファイルがサービスによって <specified file path>/<folder named as source compressed file>/ に書き込まれます。
      • このボックスがオフの場合、圧縮解除されたファイルがサービスによって <specified file path> に直接書き込まれます。 競合または予期しない動作を避けるために、異なるソース ファイルに重複したファイル名がないことを確認します。
  • [圧縮レベル]: 圧縮の種類を選択するときに圧縮率を指定します。 [最速] または [最適] から選べます。

    • Fastest: 圧縮操作は可能な限り短時間で完了しますが、圧縮後のファイルが最適に圧縮されていない場合があります。
    • Optimal:圧縮操作で最適に圧縮されますが、操作が完了するまでに時間がかかる場合があります。 詳細については、 圧縮レベル に関するトピックをご覧ください。
  • [エンコード]: テスト ファイルの書き込みに使うエンコードの種類を指定します。 ドロップダウン リストから種類を 1 つ選びます。 既定値は UTF-8です。

  • [NULL 値]: null 値の文字列表現を指定します。 既定値は空の文字列です。

[ソース] タブの [詳細] 設定に、XML 形式に関係する次のプロパティが表示されます。

  • 検証モード: XML スキーマを検証するかどうかを指定します。 ドロップダウン リストからモードを 1 つ選びます。

    • なし: 検証モードを使用しない場合は、これを選択します。
    • xsd: XSD を使用して XML スキーマを検証するには、これを選択します。
    • dtd: DTD を使用して XML スキーマを検証するには、これを選択します。

    検証モードを示すスクリーンショット。

  • 名前空間: XML ファイルの解析時に名前空間を有効にするかどうかを指定します。 これは既定で選択されています。

  • 名前空間プレフィックスのペア: [名前空間] が有効になっている場合は、[+ 新規] を選択し、[URL][プレフィックス] を指定します。 [+ 新規] を選択すると、ペアをさらに追加できます。
    名前空間 URI とプレフィックスのマッピングは、XML ファイルの解析時にフィールドに名前を付けるために使用されます。 XML ファイルに名前空間があり、名前空間が有効になっている場合、既定では、フィールド名は XML ドキュメント内のものと同じになります。 このマップの名前空間 URI に対して定義された項目がある場合、フィールド名は prefix:fieldName です。

    名前空間プレフィックスのペアを示すスクリーンショット。

  • データ型の検出: 整数、倍精度、ブール値のデータ型を検出するかどうかを指定します。 これは既定で選択されています。

テーブルの概要

ソースとしての XML

XML 形式を使う場合、Copy アクティビティの [ソース] セクションでは、次のプロパティがサポートされます。

名前 説明 Value 必須 JSON スクリプト プロパティ
ファイル形式 使用するファイル形式。 XML はい type ("datasetSettings の下"):
Xml
[圧縮の種類] XML ファイルの読み取りに使用される圧縮コーデック。 なし
bzip2
gzip
deflate
ZipDeflate
TarGZip
tar
いいえ type ("compression の下"):

bzip2
gzip
deflate
ZipDeflate
TarGZip
tar
圧縮レベル  圧縮率です。 Fastest
Optimal 
なし level ("compression の下"):
Fastest
最適
[エンコード] テスト ファイルの読み取りに使われるエンコードの種類。 "UTF-8" (既定値)、"BOM なしの UTF-8"、"UTF-16LE"、"UTF-16BE"、"UTF-32LE"、"UTF-32BE"、"US-ASCII"、"UTF-7"、"BIG5"、"EUC-JP"、"EUC-KR"、"GB2312"、"GB18030"、"JOHAB"、"SHIFT-JIS"、"CP875"、"CP866"、"IBM00858"、"IBM037"、"IBM273"、"IBM437"、"IBM500"、"IBM737"、"IBM775"、"IBM850"、"IBM852"、"IBM855"、"IBM857"、"IBM860"、"IBM861"、"IBM863"、"IBM864"、"IBM865"、"IBM869"、"IBM870"、"IBM01140"、"IBM01141"、"IBM01142"、"IBM01143"、"IBM01144"、"IBM01145"、"IBM01146"、"IBM01147"、"IBM01148"、"IBM01149"、"ISO-2022-JP"、"ISO-2022-KR"、"ISO-8859-1"、"ISO-8859-2"、"ISO-8859-3"、"ISO-8859-4"、"ISO-8859-5"、"ISO-8859-6"、"ISO-8859-7"、"ISO-8859-8"、"ISO-8859-9"、"ISO-8859-13"、"ISO-8859-15"、"WINDOWS-874"、"WINDOWS-1250"、"WINDOWS-1251"、"WINDOWS-1252"、"WINDOWS-1253"、"WINDOWS-1254"、"WINDOWS-1255"、"WINDOWS-1256"、"WINDOWS-1257"、"WINDOWS-1258" なし encodingName
Preserve zip file name as folder (ZIP ファイル名をフォルダーとして保持する) コピー時にソースの ZIP ファイル名をフォルダー構造として保持するかどうかを指定します。 オン (既定値) またはオフ いいえ preserveZipFileNameAsFolder
("compressionProperties->type の下に ZipDeflateReadSettings として"):
true (既定値) または false
Preserve compression file name as folder (圧縮ファイル名をフォルダーとして保持する) コピー時にソースの圧縮ファイル名をフォルダー構造として保持するかどうかを指定します。 オン (既定値) またはオフ いいえ preserveCompressionFileNameAsFolder
("compressionProperties->type の下に TarGZipReadSettings または TarReadSettings として"):
true (既定値) または false
[Null value](Null 値) null 値の文字列表現。 <null 値>
空の文字列 (既定値)
なし nullValue
検証モード XML スキーマを検証するかどうか。 なし
xsd
dtd
いいえ validationMode:

xsd
dtd
名前空間 XML ファイルの解析時に名前空間を有効にするかどうか。 オン (既定値) またはオフ いいえ namespaces:
true (既定値) または false
名前空間プレフィックスのペア 名前空間 URI とプレフィックスのマッピング。XML ファイルの解析時にフィールドに名前を付けるために使用されます。
XML ファイルに名前空間があり、名前空間が有効になっている場合、既定では、フィールド名は XML ドキュメント内のものと同じになります。
このマップの名前空間 URI に対して定義された項目がある場合、フィールド名は prefix:fieldName です。
< url >:< プレフィックス > いいえ namespacePrefixes:
< url >:< プレフィックス >
データ型の検出 整数、倍精度、およびブール値のデータ型を検出するかどうか。 オン (既定値) またはオフ いいえ detectDataType:
true (既定値) または false