共用方式為


Microsoft Fabric 中 Data Factory 中的 XML 格式

本文概述如何在 Microsoft Fabric 的 Data Factory 數據管線中設定 XML 格式。

支援的功能

下列活動和連接器支援 XML 格式做為來源。

類別 連接器/活動
支援的連接器 Amazon S3
Amazon S3 相容
Azure Blob 儲存體
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2 \(部分機器翻譯\)
Azure 檔案
檔案系統
FTP
Google Cloud Storage
HTTP
Lakehouse 檔案
Oracle 雲端儲存空間
SFTP
支援的活動 複製活動 (來源/-)
查閱活動
GetMetadata 活動
刪除活動

複製活動中的 XML 格式

若要設定 XML 格式,請在資料管線複製活動的來源中選擇您的連線,然後在 [檔案格式] 下拉式清單中選取 [XML]。 選取 [設定 ] 以進一步設定此格式。

顯示檔案格式設定的螢幕快照。

XML 做為來源

選取 [檔案格式] 區段中的 [設定] 之後,快顯 [檔案格式設定] 對話框中會顯示下列屬性。

顯示選取檔案格式的螢幕快照。

  • 壓縮類型:用來讀取 XML 檔案的壓縮編解碼器。 您可以選擇 下拉式清單中的 Nonebzip2gzipdeflateZipDeflateTarGZiptar 類型。

    如果您選取 ZipDeflate 作為壓縮類型,[來源] 索引標籤中的 [進階設定] 底下會顯示 [保留 zip 檔案名] 作為資料夾

    • 將 zip 檔名保留為資料夾:指出是否要在複製期間保留來源 zip 檔案名作為資料夾結構。
      • 如果核取此方塊(預設值),服務會將解壓縮的檔案寫入至 <specified file path>/<folder named as source zip file>/
      • 如果未核取此方塊,服務會將解壓縮的檔案直接寫入 。<specified file path> 請確定不同的來源 ZIP 檔案中沒有重複的檔案名稱,以避免發生競爭或非預期的行為。

    如果您選取 TarGZip/tar 做為壓縮類型,[來源] 索引標籤中的 [進階設定] 底下會顯示 [保留壓縮檔名] 作為資料夾

    • 將壓縮檔名保留為資料夾:指出是否要在複製期間將來源壓縮檔名保留為資料夾結構。
      • 如果核取此方塊(預設值),服務會將解壓縮的檔案寫入至 <specified file path>/<folder named as source compressed file>/
      • 如果未核取此方塊,服務會將解壓縮的檔案直接寫入 。<specified file path> 請確定不同的來源檔案中沒有重複的檔案名稱,以避免發生競爭或非預期的行為。
  • 壓縮層級:當您選取壓縮類型時,請指定壓縮比例。 您可以從 [最快] 或 [最佳] 中選擇。

    • Fastest:即使產生的檔案不以最佳方式壓縮,也應盡快完成壓縮作業。
    • Optimal:即使作業需要較長時間完成,壓縮作業也應以最佳方式壓縮。 如需詳細資訊,請參閱 壓縮層級 主題。
  • 編碼:指定用來撰寫測試檔案的編碼類型。 從下拉式清單中選取一個類型。 預設值為 UTF-8

  • Null 值:指定 Null 值的字串表示。 預設值是空字串。

[來源] 索引標籤的 [進階設定] 底下,會顯示下列 XML 格式相關屬性。

  • 驗證模式:指定是否要驗證 XML 架構。 從下拉式清單中選取一個模式。

    • :選取此選項以不使用驗證模式。
    • xsd:選取此選項以使用 XSD 驗證 XML 架構。
    • dtd:選取此選項以使用 DTD 驗證 XML 架構。

    顯示驗證模式的螢幕快照。

  • 命名空間:指定剖析 XML 檔案時是否要啟用命名空間。 默認會選取它。

  • 命名空間前置片語:如果 已啟用命名空間 ,請選取 [+ 新增 ],然後指定 URL前置詞。 您可以選取 [+ 新增] 來新增更多配對。
    剖析 XML 檔案時,會使用命名空間 URI 與前置詞對應來命名字段。 如果 XML 檔案已啟用命名空間和命名空間,則欄位名稱預設會與 XML 文件中相同。 如果此對應中已定義命名空間 URI 的項目,則欄位名稱為 prefix:fieldName

    顯示命名空間前置片語的螢幕快照。

  • 偵測數據類型:指定是否要偵測整數、雙精度浮點數和布爾數據類型。 默認會選取它。

數據表摘要

XML 做為來源

使用 XML 格式時,複製活動 [來源 ] 區段支援下列屬性。

名字 描述 必填 JSON 腳本屬性
檔案格式 您想要使用的檔案格式。 XML Yes type (datasetSettings):
Xml
壓縮類型 用來讀取 XML 檔案的壓縮編解碼器。 None
bzip2
gzip
緊縮
ZipDeflate
TarGZip
焦油
No type (compression):

bzip2
gzip
緊縮
ZipDeflate
TarGZip
tar
壓縮層級  壓縮比。 最快
最佳的 
層級 (compression):
最快
最佳
編碼方式 用來讀取測試檔案的編碼類型。 “UTF-8” (預設),“UTF-8 不含 BOM”、“UTF-16LE”、“UTF-16BE”、“UTF-32LE”、“UTF-32BE”、“US-ASCII”、“UTF-7”、 “BIG5”、“EUC-JP”、“EUC-KR”、“GB2312”、“GB18030”、“JOHAB”、“SHIFT-JIS”、“CP875”、“CP866”、“CP866”、“IBM00858”、“IBM037”、“IBM273”、“IBM437”、“IBM500”、“IBM737”、 “IBM775”、“IBM850”、“IBM852”、“IBM855”、“IBM857”、“IBM860”、“IBM861”、“IBM863”、“IBM864 ”、“IBM865”、“IBM865”、“IBM869”、“IBM870”、“IBM01140”、“IBM01141”、“IBM01142”、“IBM01143”、“IBM01144”、“IBM01145”、“IBM01146”、“IBM01147”、“IBM01148”、” “IBM01149”、“ISO-2022-JP”、“ISO-2022-KR”、“ISO-8859-1”、 “ISO-8859-2”、“ISO-8859-3”、“ISO-8859-4”、“ISO-8859-5”、“ISO-8859-6”、“ISO-8859-7”、“ISO-8859-8”、“ISO-8859-9”、 “ISO-8859-13”、“ISO-8859-15”、“WINDOWS-874”、“WINDOWS-1250”、“WINDOWS-1251”、“WINDOWS-12552”、“WINDOWS-1253”、“WINDOWS-1254”、“WINDOWS-1255”、“WINDOWS-1256”、“WINDOWS-1257”、“WINDOWS-1258” encodingName
將 zip 檔名保留為資料夾 指出是否要在複製期間保留來源 zip 檔名作為資料夾結構。 已選取 (預設值) 或取消選取 No preserveZipFileNameAsFolder
compressionProperties->type as ZipDeflateReadSettings下):
true (預設值) 或 false
將壓縮檔名保留為資料夾 指出是否要在複製期間保留來源壓縮檔名做為資料夾結構。 已選取 (預設值) 或取消選取 No preserveCompressionFileNameAsFolder
compressionProperties->typeTarGZipReadSettingsTarReadSettings下 ):
true (預設值) 或 false
Null 值 Null 值的字串表示。 <您的 Null 值>
空字串 (預設)
nullValue
驗證模式 是否要驗證 XML 架構。 None
xsd
dtd
No validationMode:

xsd
dtd
命名空間 是否要在剖析 XML 檔案時啟用命名空間。 已選取 (預設值) 或未選取 No 命名空間:
true (預設值) 或 false
命名空間前置片語 命名空間 URI 到前置詞對應,用來在剖析 XML 檔案時命名字段。
如果 XML 檔案已啟用命名空間和命名空間,則欄位名稱預設會與 XML 文件中相同。
如果此對應中已定義命名空間 URI 的項目,則欄位名稱為 prefix:fieldName
< url >:< prefix > No namespacePrefixes:
< url >:< prefix >
偵測數據類型 是否要偵測整數、雙精度浮點數和布林值資料類型。 已選取 (預設值) 或未選取 No detectDataType:
true (預設值) 或 false