分割資料表與索引
SQL Server 支援資料表和索引資料分割。 資料分割資料表和索引的資料,已分成可以在資料庫中的多個檔案群組之間分佈的單位。 資料是以水平方式分割,因此資料列的群組可對應至個別的資料分割。 單一索引或資料表的所有資料分割必須在同一個資料庫中。 在資料上執行查詢或更新時,資料表或索引會被視為單一邏輯實體。 並非每個 Microsoft SQL Server 版本都可使用分割資料表和索引。 如需 SQL Server 版本所支援功能的清單,請參閱<SQL Server 2012 版本支援的功能>。
重要事項 |
---|
SQL Server 2012 預設最多支援 15,000 個資料分割。 在舊版中,資料分割數目預設限制為 1,000。 在 x86 型系統上,可以建立超過 1000 個資料分割的資料表或索引,但不予支援。 |
資料分割的優點
對大型資料表或索引進行資料分割,可以具有下列管理能力和效能優點。
您可以快速並有效率地傳送或存取資料子集,同時維護資料集合的完整性。 例如,將資料從 OLTP 載入至 OLAP 系統這類作業只需要數秒的時間,而不用像未對資料進行資料分割時,需要數分鐘或數小時的時間才能執行作業。
您可以更快速地對一個或多個資料分割執行維護作業。 作業只處理這些資料子集,而非整個資料表,因此會更有效率。 例如,您可以選擇壓縮一個或多個資料分割中的資料,或是重建索引的一個或多個資料分割。
您可以提升查詢效能,不過這要視您經常執行的查詢類型和硬體組態而定。 例如,因為您可以聯結資料分割本身,則在資料表中的分割資料行相同時,查詢最佳化工具可以更快速地處理兩個以上資料分割資料表之間的等聯結 (Equi-Join) 查詢。
SQL Server 在為 I/O 作業執行資料排序時,會先依資料分割排序資料。 SQL Server 一次會存取一台磁碟機,而這樣會降低效能。 若要改善資料排序效能,請設定 RAID,以將資料分割的資料檔分割到多個磁碟上。 利用這種方式,雖然 SQL Server 仍然會依資料分割排序資料,但它可以同時存取每個資料分割的所有磁碟機。
此外,您可以啟用資料分割層級的鎖定擴大 (而非整個資料表) 來提升效能。 這可以減少資料表上的鎖定競爭。
元件和概念
下列詞彙適用於資料表和索引資料分割。
資料分割函數
一種資料庫物件,可定義資料表或索引的資料列如何根據某些資料行 (稱為分割資料行) 的值對應至資料分割集。 也就是說,資料分割函數會定義資料表擁有的資料分割數目,以及資料分割界限的定義方式。 例如,如果資料表包含銷售訂單資料,您可能想要根據 datetime 資料行 (例如銷售日期) 將資料表分割為 12 個 (每月) 資料分割。資料分割配置
將資料分割函數的資料分割對應至一組檔案群組的資料庫物件。 將資料分割放在不同檔案群組的主要理由是可以確保能夠對資料分割獨立執行備份作業。 這是因為您可以對個別檔案群組執行備份。資料分割資料行
資料分割函數用於分割資料表或索引的資料表或索引資料行。 參與資料分割函數的計算資料行必須明確地標示為 PERSISTED。 所有適用於做為索引資料行的資料類型都可以做為分割資料行,但 timestamp 除外。 無法指定 ntext、text、image、xml、varchar(max)、nvarchar(max) 或 varbinary(max) 資料類型。 此外,也無法指定 Microsoft .NET Framework Common Language Runtime (CLR) 使用者定義型別及別名資料類型資料行。對齊的索引
在與對應資料表相同的資料分割配置上建立的索引。 資料表與其索引對齊時,SQL Server 可以在維護資料表及其索引之資料分割結構的同時,快速且有效地切換資料分割。 索引不需要參與相同的具名資料分割函數,即可對齊其基底資料表。 不過,索引和基底資料表的資料分割函數本質上必須相同,也就是說 1) 這兩種資料分割函數的引數具有相同的資料類型,2) 它們都定義相同數目的資料分割,3) 對資料分割都定義相同的界限值。非對齊的索引
與其對應資料表分開進行資料分割的索引。 亦即,索引具有不同的資料分割結構描述,或放在與基底資料表不同的檔案群組中。 在下列情況中,設計非對齊的資料分割索引可能十分有用:尚未對基底資料表進行資料分割。
索引鍵是唯一的,並且不含資料表的分割資料行。
您希望使用不同的聯結資料行,讓基底資料表參與具有多個資料表的共置聯結。
資料分割刪除
查詢最佳化工具用來只存取相關資料分割以滿足查詢篩選準則的程序。
效能方針
15,000 個資料分割中新的且較高的限制會影響記憶體、資料分割索引作業、DBCC 命令和查詢。 此節描述將資料分割數目增加為超過 1,000 個的效能含意,並視需要提供解決方案。 具有最大資料分割數目增加為 15,000 的限制,就可以較長時間地儲存資料。 不過,您只應該保留必要的資料,並維護效能與資料分割數目之間的平衡。
記憶體使用量和方針
如果正在使用大量資料分割,則建議您至少使用 16 GB 的 RAM。 如果系統的記憶體不足,則資料操作語言 (DML) 陳述式、資料定義語言 (DDL) 陳述式和其他作業可能會因記憶體不足而失敗。 RAM 為 16 GB 且執行許多記憶體密集處理序的系統,可能會在針對大量資料分割執行的作業時記憶體不足。 因此,記憶體愈多 (超過 16 GB),發生效能和記憶體問題的機會可能就愈少。
記憶體限制會影響 SQL Server 建立資料分割索引的效能或能力。 如果資料表有適用的叢集索引,當索引沒有對齊基底資料表或沒有對齊叢集索引時,特別會發生這種狀況。
資料分割索引作業
記憶體限制會影響 SQL Server 建立資料分割索引的效能或能力。 這特別適用於非對齊索引。 您可以對包含超過 1,000 個資料分割的資料表,建立及重建不以資料表為準的索引,但不予支援。 此做法可能會導致在作業期間效能降低或耗用過多記憶體。
建立和重建對齊索引所需的執行時間,可能會隨著資料分割數目的增加而增加。 建議您不要同時執行多個建立和重建索引命令,這樣做可能會造成效能和記憶體問題。
SQL Server 執行排序以建立資料分割索引時,會先對每個資料分割建立一個排序表。 接著會在每個資料分割的個別檔案群組中建立排序表,而如果指定 SORT_IN_TEMPDB 索引選項,則會在 tempdb 中建立排序表。 每個排序表都需要最小量的記憶體才能建立。 當您在建立對齊基底資料表的資料分割索引時,會使用少量記憶體一次建立一個排序表。 不過,當您在建立非對齊資料分割索引時,則會同時建立排序表。 因此,必須有足夠的記憶體才能處理這些並行排序作業。 資料分割的數量越大的話,則需要越多記憶體。 對每個資料分割來說,每個排序表的大小下限為 40 個頁面,而每一頁都為 8 KB。 例如,具有 100 個資料分割的非對齊資料分割索引,需要足夠的記憶體,才能同時連續排序 4,000 (40 * 100) 頁。 如果有可用的記憶體,則建立作業會成功,但效能會變差。 如果無法使用這個數量的記憶體,建立作業會失敗。 此外,具有 100 個資料分割的對齊資料分割索引只需要足夠排序 40 頁的記憶體,因為並不會同時執行排序作業。
若為對齊和非對齊索引,如果 SQL Server 將平行處理原則的程度套用至多處理器電腦上的建立作業,則記憶體需求會比較大。 這是因為平行處理原則的程度越大,則記憶體需求也越大。 例如,如果 SQL Server 將平行處理原則的程度設為 4,則具有 100 個資料分割的非對齊資料分割索引需要四個處理器的足夠記憶體,才能同時排序 4,000 頁或 16,000 頁。 如果已對齊資料分割索引,則記憶體需求會降低為四個處理器排序 40 頁,或 160 (4 * 40) 頁。 您可以使用 MAXDOP 索引選項,以手動方式降低平行處理原則的程度。
DBCC 命令
如果具有較大的資料分割數目,則 DBCC 命令所需的執行時間可能會隨著資料分割數目的增加而增加。
查詢
使用資料分割刪除的查詢,可能會具有較大資料分割數目的可比較或改善效能。 未使用資料分割刪除的查詢,所需執行時間可能會隨著資料分割數目的增加而增加。
例如,假設資料表有 1 億個資料列和資料行 A、B 和 C。 在案例 1 中,資料表的資料行 A 上分成 1000 個資料分區。 在案例 2 中,資料表的資料行 A 上分成 10,000 個資料分區。 資料表上具有篩選資料行 A 之 WHERE 子句的查詢,會執行資料分割刪除,並掃描一個資料分割。 在案例 2 中,因為資料分割中要掃描的資料列較少,所以這個相同查詢的執行速度會較快。 具有篩選資料行 B 之 WHERE 子句的查詢會掃描所有資料分割。 在案例 1 中,因為要掃描的資料分割較少,所以此查詢的執行速度會比案例 2 還要快。
如果查詢在分割資料行以外的資料行上使用類似 TOP 或 MAX/MIN 的運算子,則可能會因為資料分割而遇到效能降低的情況,因為所有分割區都必須評估。
資料分割索引作業期間統計資料計算的行為變更
SQL Server 2012 並不會在建立或重建資料分割索引之後掃描資料表中所有的資料列建立統計資料。 反之,查詢最佳化工具會使用預設的採樣演算法來產生統計資料。 升級具有資料分割索引的資料庫之後,可能會注意到這些索引之長條圖資料的差異。 此行為變更可能不會影響查詢效能。 如果要在掃描資料表中所有資料列時取得資料分割索引的統計資料,請使用 CREATE STATISTICS 或 UPDATE STATISTICS 搭配 FULLSCAN 子句。
相關工作
工作 |
主題 |
描述如何建立資料分割函數和資料分割結構描述,然後將它們套用至資料表和索引。 |
|
相關內容
您可能會發現下列資料分割資料表和索引策略和實作白皮書十分有用。