英語で読む

次の方法で共有


Microsoft Fabric の Data Factory での XML 形式

この記事では、Microsoft Fabric の Data Factory のデータ パイプラインで XML 形式を構成する方法の概要を示します。

サポートされる機能

XML 形式は、ソースとして次のアクティビティとコネクタでサポートされています。

Copy アクティビティの XML 形式

XML 形式を構成するには、データ パイプラインの Copy アクティビティのソースで接続を選択し、[ファイル形式] のドロップダウン リストで [XML] を選択します。 この形式をさらに構成するには、[設定] を選択します。

ファイル形式の設定を示すスクリーンショット。

ソースとしての XML

[ファイル形式] セクションで [設定] を選択すると、ポップアップの [File format settings] (ファイル形式設定) ダイアログ ボックスに以下のプロパティが表示されます。

ファイル形式の選択を示すスクリーンショット。

  • [圧縮の種類]: XML ファイルの読み取りに使用される圧縮コーデック。 ドロップダウン リストでは、[なし][bzip2][gzip][deflate][ZipDeflate][TarGZip][tar] の種類から選択できます。

    圧縮の種類として [ZipDeflate] を選択した場合、[ソース] タブの [詳細設定][Preserve zip file name as folder] (ZIP ファイル名をフォルダーとして保持する) が表示されます。

    • [Preserve zip file name as folder] (ZIP ファイル名をフォルダーとして保持する): コピー時にソースの ZIP ファイル名をフォルダー構造として保持するかどうかを指定します。
      • このボックスがオン (既定値) の場合、解凍されたファイルはサービスによって <specified file path>/<folder named as source zip file>/ に書き込まれます。
      • このボックスがオフの場合、解凍されたファイルはサービスによって <specified file path> に直接書き込まれます。 競合または予期しない動作を避けるために、異なるソース ZIP ファイルに重複したファイル名がないことを確認します。

    圧縮の種類として [TarGZip/tar] を選択した場合、[ソース] タブの [詳細設定][Preserve compression file name as folder] (圧縮ファイル名をフォルダーとして保持する) が表示されます。

    • [Preserve compression file name as folder] (圧縮ファイル名をフォルダーとして保持する): コピー時にソースの圧縮ファイル名をフォルダー構造として保持するかどうかを指定します。
      • このボックスがオン (既定値) の場合、圧縮解除されたファイルがサービスによって <specified file path>/<folder named as source compressed file>/ に書き込まれます。
      • このボックスがオフの場合、圧縮解除されたファイルがサービスによって <specified file path> に直接書き込まれます。 競合または予期しない動作を避けるために、異なるソース ファイルに重複したファイル名がないことを確認します。
  • [圧縮レベル]: 圧縮の種類を選択するときに圧縮率を指定します。 [最速] または [最適] から選べます。

    • Fastest: 圧縮操作は可能な限り短時間で完了しますが、圧縮後のファイルが最適に圧縮されていない場合があります。
    • Optimal:圧縮操作で最適に圧縮されますが、操作が完了するまでに時間がかかる場合があります。 詳細については、 圧縮レベル に関するトピックをご覧ください。
  • [エンコード]: テスト ファイルの書き込みに使うエンコードの種類を指定します。 ドロップダウン リストから種類を 1 つ選びます。 既定値は UTF-8です。

  • [NULL 値]: null 値の文字列表現を指定します。 既定値は空の文字列です。

[ソース] タブの [詳細] 設定に、XML 形式に関係する次のプロパティが表示されます。

  • 検証モード: XML スキーマを検証するかどうかを指定します。 ドロップダウン リストからモードを 1 つ選びます。

    • なし: 検証モードを使用しない場合は、これを選択します。
    • xsd: XSD を使用して XML スキーマを検証するには、これを選択します。
    • dtd: DTD を使用して XML スキーマを検証するには、これを選択します。

    検証モードを示すスクリーンショット。

  • 名前空間: XML ファイルの解析時に名前空間を有効にするかどうかを指定します。 これは既定で選択されています。

  • 名前空間プレフィックスのペア: [名前空間] が有効になっている場合は、[+ 新規] を選択し、[URL][プレフィックス] を指定します。 [+ 新規] を選択すると、ペアをさらに追加できます。
    名前空間 URI とプレフィックスのマッピングは、XML ファイルの解析時にフィールドに名前を付けるために使用されます。 XML ファイルに名前空間があり、名前空間が有効になっている場合、既定では、フィールド名は XML ドキュメント内のものと同じになります。 このマップの名前空間 URI に対して定義された項目がある場合、フィールド名は prefix:fieldName です。

    名前空間プレフィックスのペアを示すスクリーンショット。

  • データ型の検出: 整数、倍精度、ブール値のデータ型を検出するかどうかを指定します。 これは既定で選択されています。

テーブルの概要

ソースとしての XML

XML 形式を使う場合、Copy アクティビティの [ソース] セクションでは、次のプロパティがサポートされます。

名前 説明 Value 必須 JSON スクリプト プロパティ
ファイル形式 使用するファイル形式。 XML はい type ("datasetSettings の下"):
Xml
[圧縮の種類] XML ファイルの読み取りに使用される圧縮コーデック。 なし
bzip2
gzip
deflate
ZipDeflate
TarGZip
tar
いいえ type ("compression の下"):

bzip2
gzip
deflate
ZipDeflate
TarGZip
tar
圧縮レベル  圧縮率です。 Fastest
Optimal 
なし level ("compression の下"):
Fastest
最適
[エンコード] テスト ファイルの読み取りに使われるエンコードの種類。 "UTF-8" (既定値)、"BOM なしの UTF-8"、"UTF-16LE"、"UTF-16BE"、"UTF-32LE"、"UTF-32BE"、"US-ASCII"、"UTF-7"、"BIG5"、"EUC-JP"、"EUC-KR"、"GB2312"、"GB18030"、"JOHAB"、"SHIFT-JIS"、"CP875"、"CP866"、"IBM00858"、"IBM037"、"IBM273"、"IBM437"、"IBM500"、"IBM737"、"IBM775"、"IBM850"、"IBM852"、"IBM855"、"IBM857"、"IBM860"、"IBM861"、"IBM863"、"IBM864"、"IBM865"、"IBM869"、"IBM870"、"IBM01140"、"IBM01141"、"IBM01142"、"IBM01143"、"IBM01144"、"IBM01145"、"IBM01146"、"IBM01147"、"IBM01148"、"IBM01149"、"ISO-2022-JP"、"ISO-2022-KR"、"ISO-8859-1"、"ISO-8859-2"、"ISO-8859-3"、"ISO-8859-4"、"ISO-8859-5"、"ISO-8859-6"、"ISO-8859-7"、"ISO-8859-8"、"ISO-8859-9"、"ISO-8859-13"、"ISO-8859-15"、"WINDOWS-874"、"WINDOWS-1250"、"WINDOWS-1251"、"WINDOWS-1252"、"WINDOWS-1253"、"WINDOWS-1254"、"WINDOWS-1255"、"WINDOWS-1256"、"WINDOWS-1257"、"WINDOWS-1258" なし encodingName
Preserve zip file name as folder (ZIP ファイル名をフォルダーとして保持する) コピー時にソースの ZIP ファイル名をフォルダー構造として保持するかどうかを指定します。 オン (既定値) またはオフ いいえ preserveZipFileNameAsFolder
("compressionProperties->type の下に ZipDeflateReadSettings として"):
true (既定値) または false
Preserve compression file name as folder (圧縮ファイル名をフォルダーとして保持する) コピー時にソースの圧縮ファイル名をフォルダー構造として保持するかどうかを指定します。 オン (既定値) またはオフ いいえ preserveCompressionFileNameAsFolder
("compressionProperties->type の下に TarGZipReadSettings または TarReadSettings として"):
true (既定値) または false
[Null value](Null 値) null 値の文字列表現。 <null 値>
空の文字列 (既定値)
なし nullValue
検証モード XML スキーマを検証するかどうか。 なし
xsd
dtd
いいえ validationMode:

xsd
dtd
名前空間 XML ファイルの解析時に名前空間を有効にするかどうか。 オン (既定値) またはオフ いいえ namespaces:
true (既定値) または false
名前空間プレフィックスのペア 名前空間 URI とプレフィックスのマッピング。XML ファイルの解析時にフィールドに名前を付けるために使用されます。
XML ファイルに名前空間があり、名前空間が有効になっている場合、既定では、フィールド名は XML ドキュメント内のものと同じになります。
このマップの名前空間 URI に対して定義された項目がある場合、フィールド名は prefix:fieldName です。
< url >:< プレフィックス > いいえ namespacePrefixes:
< url >:< プレフィックス >
データ型の検出 整数、倍精度、およびブール値のデータ型を検出するかどうか。 オン (既定値) またはオフ いいえ detectDataType:
true (既定値) または false