Microsoft Fabric 中 Data Factory 的二進位格式

二進位格式可 as-is 檔案複製且不需解析,這對於在不需轉換的情況下在儲存位置間移動檔案非常有用。 本文說明如何在 Microsoft Fabric 的 Data Factory 中設定複製活動流程中的二進位格式。

支援的功能

下列活動和連接器支援二進位格式作為來源和目的地。

類別 連接器/任務
支援的連接器 Amazon S3
Amazon S3 相容
Azure Blob 儲存體
Azure Data Lake Storage Gen2
Azure 檔案
檔案系統
FTP
谷歌雲存儲
HTTP
湖倉檔案
Oracle 雲端儲存空間
SFTP
支援的活動 複製活動(來源/目的地)
GetMetadata 活動
刪除活動

複製活動中的二進位格式

若要設定二進位格式,請在管線複製活動的來源或目的地中選擇您的連線,然後在檔案格式的下拉式清單中選取二進位。 選取 [設定 ] 以進一步設定此格式。

顯示檔案設定按鈕的螢幕擷取畫面。

注意

在複製活動中使用二進位格式時,來源和目的地都應該使用二進位格式。

將二進位作為來源

當您在 [來源] 索引標籤下的 [檔案格式] 區段中選取 [設定] 之後,下列屬性會顯示在快顯 [檔案格式設定] 對話框中。

顯示檔案格式設定的螢幕快照。

  • 壓縮類型:用來讀取二進位檔案的壓縮編解碼器。 您可以在下拉式清單中選擇 Nonebzip2gzipdeflateZipDeflateTarGzip 或、tar 類型。

    如果您選取 ZipDeflate 作為壓縮類型,則系統會在來源索引標籤中的進階設定下顯示保留 zip 檔案名稱作為資料夾

    • 將 ZIP 檔案名稱保留為資料夾:指出是否要在複製期間保留來源 ZIP 檔案名稱做為資料夾結構。
      • 如果核取此方塊(預設值),服務會將解壓縮的檔案寫入至 <specified file path>/<folder named as source zip file>/
      • 如果未核取此方塊,服務會將解壓縮的檔案直接寫入 。<specified file path> 請確定不同的來源 ZIP 檔案中沒有重複的檔案名稱,以避免發生競爭或非預期的行為。

    如果您選取 TarGzip/tar 作為壓縮類型,則系統會在來源索引標籤中的進階設定下顯示保留壓縮檔案名稱作為資料夾

    • 將壓縮檔名稱保留為資料夾:指出是否要在複製期間保留來源壓縮檔案名稱做為資料夾結構。
      • 如果核取此方塊(預設值),服務會將解壓縮的檔案寫入至 <specified file path>/<folder named as source compressed file>/
      • 如果未核取此方塊,服務會將解壓縮的檔案直接寫入 。<specified file path> 請確定不同的來源 ZIP 檔案中沒有重複的檔案名稱,以避免發生競爭或非預期的行為。
  • 壓縮層級:壓縮比例。 您可以選擇最佳最快

    • 最快:即使產生的檔案不以最佳方式壓縮,也應盡快完成壓縮作業。
    • Optimal:即使作業需要較長時間完成,壓縮作業也應以最佳方式壓縮。 如需更多資訊,請前往壓縮等級文章。

[來源] 索引標籤的 [進階設定] 底下,會顯示進一步的二進位格式相關屬性。

  • 完成後刪除檔案:指出成功移至目的地存放區之後,是否要從來源存放區中刪除二進位檔案。 刪除是以單個檔案為單位進行。 因此,複製活動失敗時,某些檔案已複製至目的地且已從來源刪除,而其他檔案仍然保留在來源存放區上。

二進位做為目的地

在 [目的地] 索引標籤下的 [檔案格式] 區段中選取 [設定] 之後,快顯 [檔案格式設定] 對話框中會顯示下列屬性。

顯示選取檔案格式的螢幕快照。

  • 壓縮類型:用來寫入二進位檔案的壓縮編解碼器。 您可以在下拉式清單中選擇 Nonebzip2gzipdeflateZipDeflateTarGziptar 類型。

  • 壓縮層級:壓縮比例。 您可以選擇最佳最快

    • 最快:即使產生的檔案不以最佳方式壓縮,也應盡快完成壓縮作業。
    • Optimal:即使作業需要較長時間完成,壓縮作業也應以最佳方式壓縮。 如需詳細資訊,請移至 壓縮層級 一文。

二元複製活動屬性

將二進位作為來源

使用二進位格式時,複製活動的來源區段支援下列屬性。

名稱 描述 必要 JSON 腳本屬性
檔案格式 選取要使用的檔案格式。 二進位 Yes type (datasetSettings):
二進制
壓縮類型 用來讀取二進位檔案的壓縮編解碼器。 從下列項目中選擇:
None
bzip2
gzip
解壓縮
ZipDeflate
TarGzip
tar
No type (compression):

bzip2
gzip
解壓縮算法
ZipDeflate
TarGzip
tar
壓縮層級 壓縮比。 允許的值為 Optimal 或 Fastest。 最佳最快 No 層級(位於 compression之下):
最快
最佳
將 zip 檔名保留為資料夾 指出是否要在複製期間保留來源 ZIP 檔案名稱做為資料夾結構。 已選取或取消選取 No 將壓縮檔名稱保留為資料夾
(compressionProperties->type 下如 ZipDeflateReadSettings)
將壓縮檔名保留為資料夾 指出是否要在複製期間保留來源壓縮檔案名稱做為資料夾結構。 已選取或取消選取 No 保留壓縮檔案名作為資料夾
(compressionProperties->type 下為 TarGZipReadSettingsTarReadSettings)
完成之後刪除檔案 指出成功移至目的地存放區之後,是否要從來源存放區中刪除二進位檔案。 已選取或取消選取 No deleteFilesAfterCompletion:
[True] 或 [False]

二進位做為目的地

使用二進位格式時,複製活動 目的地 區段支援下列屬性。

名稱 描述 必要 JSON 腳本屬性
檔案格式 選取要使用的檔案格式。 二進位 Yes type (datasetSettings):
二進制
壓縮類型 用來寫入二進位檔案的壓縮轉碼器。 從下列項目中選擇:
None
bzip2
gzip
解壓縮
ZipDeflate
TarGzip
tar
No type (compression):

bzip2
gzip
解壓縮算法
ZipDeflate
TarGzip
tar
壓縮層級 壓縮比。 允許的值為 Optimal 或 Fastest。 最佳最快 No 層級(位於 compression之下):
最快
最佳