閱讀英文

共用方式為


Data Factory in Microsoft Fabric 中的 XML 格式

本文概述如何在 Microsoft Fabric 的 Data Factory 資料管線中設定 XML 格式。

支援的功能

下列活動和連接器支援 XML 格式做為來源。

複製活動中的 XML 格式

若要設定 XML 格式,請在資料管線複製活動的來源中選擇您的連線,然後在 [檔案格式] 下拉式清單中選取 [XML]。 選取 [設定 ] 以進一步設定此格式。

顯示檔案格式設定的螢幕快照。

XML 做為來源

選取 [檔案格式] 區段中的 [設定] 之後,快顯 [檔案格式設定] 對話框中會顯示下列屬性。

顯示選取檔案格式的螢幕快照。

  • 壓縮類型:用來讀取 XML 檔案的壓縮編解碼器。 您可以在下拉式清單中選擇 Nonebzip2gzipdeflateZipDeflateTarGZiptar 類型。

    如果您選取 ZipDeflate 作為壓縮類型,則系統會在來源索引標籤中的進階設定下顯示保留 zip 檔案名稱作為資料夾

    • 將 ZIP 檔案名稱保留為資料夾:指出是否要在複製期間保留來源 ZIP 檔案名稱做為資料夾結構。
      • 如果核取此方塊(預設值),服務會將解壓縮的檔案寫入至 <specified file path>/<folder named as source zip file>/
      • 如果未核取此方塊,服務會將解壓縮的檔案直接寫入 。<specified file path> 請確定不同的來源 ZIP 檔案中沒有重複的檔案名稱,以避免發生競爭或非預期的行為。

    如果您選取 TarGZip/tar 作為壓縮類型,則系統會在來源索引標籤中的進階設定下顯示保留壓縮檔案名稱作為資料夾

    • 將壓縮檔名稱保留為資料夾:指出是否要在複製期間保留來源壓縮檔案名稱做為資料夾結構。
      • 如果核取此方塊(預設值),服務會將解壓縮的檔案寫入至 <specified file path>/<folder named as source compressed file>/
      • 如果未核取此方塊,服務會將解壓縮的檔案直接寫入 。<specified file path> 請確定不同的來源檔案中沒有重複的檔案名稱,以避免發生競爭或非預期的行為。
  • 壓縮層級:當您選取壓縮類型時,請指定壓縮比例。 您可以選擇最快最佳

    • Fastest:即使產生的檔案不以最佳方式壓縮,也應盡快完成壓縮作業。
    • Optimal:即使作業需要較長時間完成,壓縮作業也應以最佳方式壓縮。 如需詳細資訊,請參閱 壓縮層級 主題。
  • 編碼:指定用來寫入測試檔案的編碼類型。 從下拉式清單選取一個類型。 預設值為 UTF-8

  • Null 值:指定 Null 值的字串表示法。 預設值是空字串。

[來源] 索引標籤的 [進階設定] 底下,會顯示下列 XML 格式相關屬性。

  • 驗證模式:指定是否要驗證 XML 結構描述。 從下拉式清單中選擇一種模式。

    • :選取此選項以不使用驗證模式。
    • xsd:選取此選項以使用 XSD 驗證 XML 架構。
    • dtd:選取此選項以使用 DTD 驗證 XML 架構。

    顯示驗證模式的螢幕快照。

  • 命名空間:指定是否要在剖析 XML 檔案時啟用命名空間。 預設為選取狀態。

  • Namespace前置片語:如果 已啟用命名空間 ,請選取 [+ 新增 ],然後指定 URL前置詞。 您可以選取 [+ 新增] 來新增更多配對。
    前置詞對應的命名空間 URI,用於在剖析 XML 檔案時指定欄位。 如果 XML 檔案已啟用命名空間和命名空間,則欄位名稱預設會與 XML 文件中相同。 如果此對應中已定義命名空間 URI 的項目,則欄位名稱為 prefix:fieldName

    顯示命名空間前置片語的螢幕快照。

  • 偵測資料類型:指定是否偵測整數、雙數和布林資料類型。 預設為選取狀態。

資料表摘要

XML 做為來源

使用 XML 格式時,複製活動的來源區段支援下列屬性。

名稱 描述 必填 JSON 腳本屬性
檔案格式 選取要使用的檔案格式。 XML Yes type (datasetSettings):
Xml
壓縮類型 用來讀取 XML 檔案的壓縮編解碼器。 None
bzip2
gzip
deflate
ZipDeflate
TarGZip
tar
No type (compression):

bzip2
gzip
deflate
ZipDeflate
TarGZip
tar
壓縮層級  壓縮比。 最快
最佳 
層級 (compression):
最快
最佳
編碼方式 用來讀取測試檔案的編碼類型。 "UTF-8" (依預設)、"UTF-8 without BOM"、"UTF-16LE"、"UTF-16BE"、"UTF-32LE"、"UTF-32BE"、"US-ASCII"、"UTF-7"、"BIG5"、"EUC-JP"、"EUC-KR"、"GB2312"、"GB18030"、"JOHAB"、"SHIFT-JIS"、"CP875"、"CP866"、"IBM00858"、"IBM037"、"IBM273"、"IBM437"、"IBM500"、"IBM737"、"IBM775"、"IBM850"、"IBM852"、"IBM855"、"IBM857"、"IBM860"、"IBM861"、"IBM863"、"IBM864"、"IBM865"、"IBM869"、"IBM870"、"IBM01140"、"IBM01141"、"IBM01142"、"IBM01143"、"IBM01144"、"IBM01145"、"IBM01146"、"IBM01147"、"IBM01148"、"IBM01149"、"ISO-2022-JP"、"ISO-2022-KR"、"ISO-8859-1"、"ISO-8859-2"、"ISO-8859-3"、"ISO-8859-4"、"ISO-8859-5"、"ISO-8859-6"、"ISO-8859-7"、"ISO-8859-8"、"ISO-8859-9"、"ISO-8859-13"、"ISO-8859-15"、"WINDOWS-874"、"WINDOWS-1250"、"WINDOWS-1251"、"WINDOWS-1252"、"WINDOWS-1253"、"WINDOWS-1254"、"WINDOWS-1255"、"WINDOWS-1256"、"WINDOWS-1257"、"WINDOWS-1258" encodingName
將 zip 檔名保留為資料夾 指出是否要在複製期間保留來源 ZIP 檔案名稱做為資料夾結構。 已選取 (預設值) 或取消選取 No preserveZipFileNameAsFolder
(compressionProperties->type 下為 ZipDeflateReadSettings):
true (預設) 或 false
將壓縮檔名保留為資料夾 指出是否要在複製期間保留來源壓縮檔案名稱做為資料夾結構。 已選取 (預設值) 或取消選取 No preserveCompressionFileNameAsFolder
(compressionProperties->type 下為 TarGZipReadSettingsTarReadSettings):
true (預設) 或 false
NULL 值 Null 值的字串表示法。 <您的 Null 值>
空字串 (預設)
nullValue
驗證模式 是否要驗證 XML 結構描述。 None
xsd
dtd
No validationMode:

xsd
dtd
命名空間 是否要在剖析 XML 檔案時啟用命名空間。 已選取 (預設值) 或未選取 No 命名空間:
true (預設) 或 false
命名空間前置詞對組 前置詞對應的命名空間 URI,用於在剖析 XML 檔案時指定欄位。
如果 XML 檔案已啟用命名空間和命名空間,則欄位名稱預設會與 XML 文件中相同。
如果此對應中已定義命名空間 URI 的項目,則欄位名稱為 prefix:fieldName
< url >:< 前置詞 > No namespacePrefixes:
< url >:< 前置詞 >
偵測資料類型 是否要偵測整數、雙精度浮點數和布林值資料類型。 已選取 (預設值) 或未選取 No detectDataType:
true (預設) 或 false