大量插入工作
適用於: SQL Server Azure Data Factory 中的 SSIS Integration Runtime
「大量插入」工作提供有效的方式,將大量資料複製到 SQL Server 資料表或檢視。 例如,假設公司將百萬個資料列的產品清單儲存在大型主機系統上,但公司的電子商務系統是使用 SQL Server 填入網頁。 您必須在晚上以大型主機的主產品清單更新 SQL Server 產品資料表。 若要更新資料表,請以 Tab 分隔的格式儲存產品清單,並使用「大量插入」工作,將資料直接複製到 SQL Server 資料表中。
為了確保高速資料複製,從來源檔案將資料搬移到資料表或檢視時,無法執行資料的轉換。
使用狀況的考量
使用「大量插入」工作之前,請考慮下列事項:
「大量插入」工作只能從文字檔將資料傳送到 SQL Server 資料表或檢視。 若要使用「大量插入」工作傳輸來自其他資料庫管理系統 (DBMS) 的資料,您必須從來源將資料匯出到文字檔,然後從文字檔將資料匯入到 SQL Server 資料表或檢視。
目的地必須是 SQL Server 資料庫中的資料表或檢視。 若目的地資料表或檢視已經包含資料,則「大量插入」工作執行時,便會將新資料附加到現有資料中。 如果您要取代資料,請在執行「大量插入」工作之前,先執行會執行 DELETE 或 TRUNCATE 陳述式的執行 SQL 工作。 如需相關資訊,請參閱 Execute SQL Task。
您可以在「大量插入」工作物件中使用格式檔案。 如果您已經有 bcp 公用程式所建立的格式檔,就可以在「大量插入」工作中指定它的路徑。 「大量插入」工作支援 XML 和非 XML 格式檔案。 如需格式檔案的詳細資訊,請參閱匯入或匯出資料的格式檔案 (SQL Server)。
只有系統管理員 (sysadmin) 固定伺服器角色的成員才能執行包含「大量插入」工作的封裝。
使用交易的大量插入工作
若未設定批次大小,則會將整個大量複製作業視為一項交易。 批次大小 0 表示會將資料插入一個批次中。 若有設定批次大小,則每一個批次即代表批次完成時的一筆認可交易。
「大量插入」工作的行為與交易相關,端視工作是否聯結封裝交易而定。 若「大量插入」工作並未聯結封裝交易,在嘗試下一個批次之前,會將每一個無錯誤的 (Error-free) 批次視為一個單位進行認可。 如果「大量插入」工作與封裝交易聯結,那麼工作結束時,無錯誤批次仍會保留在交易中。 這些批次是取決於封裝的認可或復原作業。
「大量插入」工作的錯誤不會自動復原已成功載入的批次;同樣地,如果工作成功,批次並不會自動認可。 認可和復原作業只會發生於回應封裝以及工作流程屬性設定的時候。
來源和目的地
當您指定文字來源檔的位置時,請考慮下列各項:
伺服器必須有權限,才能同時存取檔案和目的地資料庫。
伺服器會執行「大量插入」工作。 因此,該工作使用的任何格式檔案都必須位於伺服器上。
「大量插入」工作載入的來源檔所在伺服器,可以和要插入資料的 SQL Server 資料庫所在的伺服器相同,或位於遠端伺服器上。 如果檔案位於遠端伺服器上,則必須在路徑中指定使用「通用命名慣例」(UNC) 名稱的檔名。
效能最佳化
若要最佳化效能,請考慮下列各項:
如果文字檔與要插入資料的 SQL Server 資料庫位於同一台電腦上,則由於資料並非在網路上移動,因此複製作業進行的速度更快。
「大量插入」工作不會記錄導致錯誤的資料列。 如果您必須擷取這項資訊,請使用資料流程元件的錯誤輸出擷取例外狀況檔案中造成錯誤的資料列。
大量插入工作上可用的自訂記錄項目
下表列出「大量插入」工作的自訂記錄項目。 如需詳細資訊,請參閱 Integration Services (SSIS) 記錄。
記錄項目 | 描述 |
---|---|
BulkInsertTaskBegin | 指出大量插入已經開始。 |
BulkInsertTaskEnd | 指出大量插入已經完成。 |
BulkInsertTaskInfos | 提供有關工作的描述性資訊。 |
大量插入工作組態
您可以利用下列方式設定「大量插入」工作:
指定讓 OLE DB 連接管理員連接到目的地 SQL Server 資料庫,以及要插入資料的資料表或檢視。 「大量插入」工作只支援用於目的地資料庫的 OLE DB 連接。
指定「檔案」或「一般檔案」連接管理員存取來源檔案。 「大量插入」工作僅針對來源檔案的位置,使用連接管理員。 此工作會忽略您在連接管理員編輯器中選取的其他選項。
以格式檔案或定義來源資料之資料行和資料列的分隔符號,定義「大量插入」工作所使用的格式。 如果使用格式檔案,請指定讓「檔案」連接管理員存取該格式檔案。
指定當工作插入資料時,要在目的地資料表或檢視上執行的動作。 這些選項包括是否檢查條件約束、啟用識別插入、保留 Null、引發觸發程序,或鎖定資料表。
提供要插入的資料批次相關資訊,例如批次大小、要插入的檔案中的第一個和最後一個資料列、在工作停止插入資料列之前容許發生的插入錯誤數目,以及將進行排序的資料行名稱。
如果「大量插入」工作使用「一般檔案」連接管理員存取來源檔案,則該工作不會使用「一般檔案」連接管理員中指定的格式。 而「大量插入」工作會使用格式檔案中指定的格式,或工作之 RowDelimiter 和 ColumnDelimiter 屬性的值。
您可以透過 SSIS 設計師或以程式設計方式設定屬性。
如需可在 SSIS 設計工具中設定的屬性的詳細資訊,請按下列主題:
如需如何在 SSIS 設計工具中設定這些屬性的詳細資訊,請按一下下列主題:
大量插入工作的程式設計組態
如需有關以程式設計方式設定這些屬性的詳細資訊,請按下列主題:
相關工作
相關內容
support.microsoft.com 上的技術文件: 您可能會在啟用 UAC 的系統上收到「無法準備 SSIS 大量插入來進行資料插入」錯誤。
msdn.microsoft.com 上的技術文章: 資料載入效能指南。
simple-talk.com 上的技術文件: Using SQL Server Integration Services to Bulk Load Data(使用 SQL Server Integration Services 大量載入資料)。
大量插入工作編輯器 (連接頁面)
使用 [大量插入工作編輯器] 對話方塊的 [連接] 頁面,即可指定大量插入作業的來源和目的地,以及要使用的格式。
若要了解如何使用大量插入,請參閱大量插入工作和匯入或匯出資料的格式檔案 (SQL Server)。
選項。
[連接]
在清單中選取 OLE DB 連線管理員,或按一下 [新增連接…]<> 建立新的連接。
相關主題:OLE DB 連線管理員
DestinationTable
輸入目的地資料表或檢視的名稱,或在清單中選取資料表或檢視。
格式
選取大量插入的格式來源。 這個屬性具有下表中所列的選項。
值 | 描述 |
---|---|
使用檔案 | 選取包含格式規格的檔案。 選取此選項會顯示動態選項 [FormatFile] 。 |
指定 | 指定格式。 選取此選項會顯示動態選項 [RowDelimiter] 和 [ColumnDelimiter] 。 |
檔案
在清單中選取檔案或一般檔案連線管理員,或按一下 [新增連接...]<> 建立新的連接。
檔案位置相對於在此工作之連接管理員中指定的 SQL Server Database Engine。 SQL Server Database Engine 必須可以在伺服器上的本機硬碟,或透過 SQL Server 的共用或對應磁碟機,存取文字檔。 SSIS 執行階段無法存取檔案。
如果您使用一般檔案連接管理員存取來源檔案,則大量插入工作不會使用一般檔案連接管理員中指定的格式。 而「大量插入」工作會使用格式檔案中指定的格式,或工作之 RowDelimiter 和 ColumnDelimiter 屬性的值。
重新整理資料表
重新整理資料表和檢視的清單。
格式動態選項
格式 = 使用檔案
FormatFile
輸入格式檔案的路徑,或按一下省略符號按鈕 (...) 以尋找格式檔案。
格式 = 指定
RowDelimiter
指定來源檔案中的資料列分隔符號。 預設值是 [{CR}{LF}] 。
ColumnDelimiter
指定來源檔案中的資料行分隔符號。 預設值是 [定位字元] 。
大量插入工作編輯器 (一般頁面)
使用 [大量插入工作編輯器] 對話方塊的 [一般] 頁面,即可命名和描述大量插入工作。
選項。
名稱
為大量插入工作提供唯一的名稱。 這個名稱是作為工作圖示中的標籤使用。
注意
工作名稱在封裝內必須是唯一的。
說明
輸入大量插入工作的描述。
大量插入工作編輯器 (選項頁面)
使用 [大量插入工作編輯器] 對話方塊的 [選項] 頁面,即可設定大量插入作業的屬性。 大量插入工作會將大量資料複製到 Microsoft SQL 資料表或檢視表。
若要了解如何使用大量插入,請參閱大量插入工作和 BULK INSERT (Transact-SQL)。
選項。
CodePage
指定資料檔中之資料的字碼頁。
DataFileType
指定載入作業所用的資料類型值。
BatchSize
指定批次中的資料列數目。 預設為整個資料檔。 如果您將 [BatchSize] 設定為零,則會以單一批次載入資料。
LastRow
指定要複製的最後一個資料列。
FirstRow
指定要開始複製的第一個資料列。
選項
字詞 | 定義 |
---|---|
檢查條件約束 | 選取此選項可檢查資料表與資料行條件約束。 |
保留 Null | 選取此選項可在大量插入作業期間保留 Null 值,而不是在空白資料行插入任何預設值。 |
啟用識別插入 | 選取此選項可將現有的值插入識別欄位。 |
資料表鎖定 | 選取此選項可在大量插入期間鎖定資料表。 |
引發觸發程序 | 選取即可引發資料表上的任何插入、更新或刪除觸發程序。 |
SortedData
在大量插入陳述式中指定 ORDER BY 子句。 您所提供的資料行名稱必須是目的資料表中的有效資料行。 預設值為 false。 這表示資料並未依 ORDER BY 子句排序。
MaxErrors
指定取消大量插入作業之前,可以發生的錯誤數目上限。 值為 0 指出允許發生無限個錯誤。
注意
大量載入作業無法匯入的每個資料列都會計算為一個錯誤。