在複製活動中設定 Azure 資料表 儲存體
本文概述如何使用數據管線中的複製活動,從 Azure 數據表 儲存體 複製數據。
支援的組態
如需複製活動下每個索引標籤的設定,請分別移至下列各節。
一般
請參閱一般設定指引,以設定 [一般設定] 索引卷標。
來源
移至 [ 來源] 索引標籤以設定複製活動來源。 如需詳細的設定,請參閱下列內容。
需要下列三個屬性:
數據存放區類型:選取 [外部]。
連線:從聯機清單中選取 Azure 數據表 儲存體 連線。 如果沒有連線,請選取 [新增],以建立新的 Azure 數據表 儲存體 連線。
使用查詢:指定讀取資料的方式。 選取 [數據表 ] 以從指定的數據表讀取數據,或選取 [查詢 ] 以使用查詢讀取數據。
如果您選取 [ 資料表]:
- 數據表:指定 Azure 數據表 儲存體 資料庫實例中的數據表名稱。 從下拉式清單中選取資料表,或選取 [編輯] 手動輸入名稱。
如果您選取 [ 查詢]:
數據表:指定 Azure 數據表 儲存體 資料庫實例中的數據表名稱。 從下拉式清單中選取資料表,或選取 [編輯] 手動輸入名稱。
查詢:指定要讀取數據的自定義資料表記憶體查詢。 來源查詢是 Azure 數據表所支援之查詢選項的直接對應
$filter
儲存體,深入瞭解本文中的語法。注意
Azure 數據表查詢作業會在 Azure 資料表服務強制執行的 30 秒內逾時。 瞭解如何從 設計查詢文章優化查詢 。
在 [進階] 底下,您可以指定下列欄位:
找不到資料表:指定是否允許數據表的例外狀況不存在。 預設為未選取。
其他數據行:新增其他數據行以儲存來源檔案的相對路徑或靜態值。 後者支持表達式。
Destination
移至 [ 目的地 ] 索引標籤以設定複製活動目的地。 如需詳細的設定,請參閱下列內容。
需要下列三個屬性:
- 數據存放區類型:選取 [外部]。
- 連線:從聯機清單中選取 Azure 數據表 儲存體 連線。 如果沒有連線,請選取 [新增],以建立新的 Azure 數據表 儲存體 連線。
- 數據表:指定 Azure 數據表 儲存體 資料庫實例中的數據表名稱。 從下拉式清單中選取資料表,或選取 [編輯] 手動輸入名稱。
在 [進階] 底下,您可以指定下列欄位:
插入類型:選取要將數據插入 Azure 資料表的模式。 模式為 Merge 和 Replace。 此屬性可控制輸出數據表中具有相符數據分割和數據列索引鍵的現有數據列是否已取代或合併其值。 此設定適用於數據列層級,而非數據表層級。 這兩個選項都不會刪除輸出數據表中不存在的數據列。 若要了解合併和取代設定的運作方式,請參閱 插入或合併實體 和 插入或取代實體。
數據分割索引鍵值選取範圍:從 [指定數據分割值 ] 或 [使用目的地數據行] 中選取。 數據分割索引鍵值可以是固定值,也可以從目的地數據行取得值。
如果您選擇 [ 指定分割區值]:
- 默認分割區值:指定目的地可使用的預設分割區索引鍵值。
如果您選擇 [ 使用目的地] 資料列:
- 數據分割索引鍵數據行:選取數據行值做為數據分割索引鍵的數據行名稱。 如果未指定,則會使用 「AzureTableDefaultPartitionKeyValue」 作為分割區索引鍵。
數據列索引鍵值選取範圍:從 [唯一標識符] 或 [使用目的地] 數據行選取。 數據列索引鍵值可以是自動產生的唯一標識符,也可以從目的地數據行取得值。
如果您選擇 [ 使用目的地] 資料列:
- 數據列索引鍵數據行:選取數據行值做為數據列索引鍵的數據行名稱。 如果未指定,請使用每個數據列的 GUID。
寫入批次大小:叫用指定的寫入批次大小時,將數據插入 Azure 數據表。 允許的值為整數(數據列數目)。 默認值為 10,000。
寫入批次逾時:在達到指定的寫入批次逾時時,將數據插入 Azure 數據表。 允許的值是時間範圍。
並行連線上限:活動執行期間,與數據存放區建立的並行連線上限。 只有當您想要限制並行連線時,才指定值
對應
如需 [ 對應 ] 索引標籤設定,請參閱 在 [對應] 索引標籤底下設定對應。
設定
如需 設定 索引標籤組態,請移至 [設定] 索引標籤下的 [設定其他設定]。
數據表摘要
下表包含 Azure 資料表 儲存體 中複製活動的詳細資訊。
來源資訊
目的地資訊
名稱 | 描述: | 值 | 必要 | JSON 腳本屬性 |
---|---|---|---|---|
數據存放區類型 | 您的資料存放區類型。 | 外部 | Yes | / |
[連接] | 您與目的地資料存放區的連線。 | <您的 Azure 資料表 儲存體 連線> | Yes | connection |
Table | Azure 資料表 儲存體 資料庫實例中的數據表名稱。 | < 您的資料表名稱 > | Yes | tableName |
插入類型 | 將數據插入 Azure 資料表的模式。 此屬性可控制輸出數據表中具有相符數據分割和數據列索引鍵的現有數據列是否已取代或合併其值。 | • 合併 • 取代 |
No | azureTableInsertType: • 合併 •取代 |
分割區索引鍵值選取 | 數據分割索引鍵值可以是固定值,也可以從目的地數據行取得值。 | • 指定分割區值 • 使用目的地數據行 |
No | / |
默認分割區值 | 目的地可以使用的預設分割區索引鍵值 | < 您的預設分割區值 > | No | azureTableDefaultPartitionKeyValue |
數據分割索引鍵數據行 | 其值做為數據分割索引鍵的數據行名稱。 如果未指定,則會使用 「AzureTableDefaultPartitionKeyValue」 作為分割區索引鍵。 | < 分割區索引鍵數據行 > | No | azureTablePartitionKeyName |
數據列索引鍵值選取 | 數據列索引鍵值可以是自動產生的唯一標識符,也可以從目的地數據行取得值。 | • 唯一標識碼 • 使用目的地數據行 |
No | / |
數據列索引鍵數據行 | 數據行值做為數據列索引鍵的數據行名稱。 如果未指定,請使用每個數據列的 GUID。 | < 您的數據列索引鍵數據行 > | No | azureTableRowKeyName |
寫入批次大小 | 叫用寫入批次大小時,將數據插入 Azure 數據表。 | 整數 (預設值為 10,000) |
No | writeBatchSize |
寫入批次逾時 | 在達到寫入批次逾時時,將數據插入 Azure 數據表 | 時間範圍 | No | writeBatchTimeout |
並行連線上限 | 在活動執行期間,與數據存放區建立的並行連線上限。 只有在您想要限制並行連線時,才指定值。 | < 您的最大並行連線 > | No | maxConcurrent 連線 ions |