共用方式為


估計叢集索引的大小

更新: 2007 年 9 月 15 日

您可以使用下列步驟,估計在叢集索引中儲存資料所需的空間量:

  1. 計算用來在叢集索引的分葉層級中儲存資料的空間。
  2. 計算用來儲存叢集索引之索引資訊的空間。
  3. 加總計算的值。

步驟 1:計算用來在分葉層級中儲存資料的空間

  1. 指定要出現在資料表中的資料列數目:
    Num_Rows = 資料表中的資料列數
  2. 指定固定長度與可變長度資料行的數目,並計算儲存這些資料行所需的空間:
    計算這兩組資料行在資料列內各佔多少空間。資料行的大小取決於資料類型和長度規格。如需詳細資訊,請參閱<資料類型 (Database Engine)>。
    Num_Cols = 資料行總數 (包括固定長度和可變長度的資料行)
    Fixed_Data_Size = 所有固定長度資料行的位元組總大小
    Num_Variable_Cols = 可變長度資料行數
    Max_Var_Size = 所有可變長度資料行的最大位元組大小
  3. 如果叢集索引為非唯一的索引,請將 uniqueifier 資料行列入考慮:
    uniqueifier 是可為 Null 的可變長度資料行。在具有非唯一索引鍵值的資料列中,它將會是非 Null 並且為 4 個位元組大小。此值是索引鍵的一部分,必須用來確定每個資料列都有唯一的索引鍵值。
    Num_Cols = Num_Cols + 1
    Num_Variable_Cols = Num_Variable_Cols + 1
    Max_Var_Size = Max_Var_Size + 4
    這些修改假設所有值均為非唯一的值。
  4. 資料列中有一部分 (稱為 Null 點陣圖) 是保留的空間,用來管理資料行的 Null 屬性。計算它的大小:
    Null_Bitmap = 2 + ((Num_Cols + 7) / 8)
    上述運算式中只有整數部分應該使用,請捨棄餘數。
  5. 計算可變長度資料的大小:
    如果在索引中有可變長度的資料行,請決定將資料行儲存到索引列中所需的空間大小。
    Variable_Data_Size* = 2 + (Num_Variable_Cols x 2) + *Max_Var_Size 這個公式假設所有可變長度的資料行是 100% 填滿的。如果您預期可變長度資料行所佔空間的百分比會比較低,您可以經由調整百分比所得的 Max_Var_Size 值,取得更精確的整體資料表大小。
    ms178085.note(zh-tw,SQL.90).gif附註:
    SQL Server 2005 推出結合 varcharnvarcharvarbinarysql_variant 資料行的功能,因而使定義的資料表總寬度超過 8,060 位元組。這些資料行的每個長度必須仍然在 varcharvarbinarysql_variant 資料行的 8,000 位元組限制內,以及 nvarchar 資料行的 4,000 位元組。然而,結合的寬度可能超過資料表中 8,060 位元組的限制。如需詳細資訊,請參閱<超過 8 KB 的資料列溢位資料>。
    若沒有可變長度的資料行,請將 ***Variable\_Data\_Size*** 設成 0。
  6. 計算資料列總大小:
    Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4
    4 這個值是資料列的資料列標頭負擔。
  7. 計算每個分頁的資料列數目 (每個分頁包含 8096 個可用位元組):
    Rows_Per_Page = 8096 / (Row_Size + 2)
    因為資料列不能跨頁,每個分頁的資料列數目必須無條件捨去小數,而取最接近的整數資料列。公式中的 2 這個值是給分頁位置陣列中的該資料列項目。
  8. 根據指定的填滿因數,計算每個分頁所保留的可用資料列數目:
    Free_Rows_Per_Page = 8096 x ((100 - Fill_Factor) / 100) / (Row_Size + 2)
    計算中所使用的填滿因數是整數值而不是百分比。因為資料列不能跨頁,每個分頁的資料列數目必須無條件捨去小數,而取最接近的整數資料列。當填滿因數變大時,每個分頁上會儲存更多資料,分頁也會比較少。公式中的 2 這個值是給分頁位置陣列中的該資料列項目。
  9. 計算儲存所有資料列所需的分頁數目:
    Num_Pages = Num_Rows / (Rows_Per_Page - Free_Rows_Per_Page)
    估計的分頁數目應該要將小數進位到最接近的整分頁數。
  10. 計算在分葉層級中儲存資料所需的空間量 (每個分頁共有 8192 個位元組):
    Leaf_space_used* = 8192 x *Num_Pages

步驟 2:計算用來儲存索引資訊的空間

您可以使用下列步驟,估計儲存較高索引層級所需的空間量:

  1. 指定索引鍵中固定長度和可變長度資料行的數目,並計算儲存它們所需的空間:
    索引的索引鍵資料行可以包含固定長度和可變長度的資料行。若要估計內部層級的索引資料列大小,請計算這些資料行群組在索引資料列中佔用的空間。資料行的大小取決於資料類型和長度規格。如需詳細資訊,請參閱<資料類型 (Database Engine)>。
    Num_Key_Cols = 索引鍵資料行總數 (包括固定長度和可變長度的資料行)
    Fixed_Key_Size = 所有固定長度索引鍵資料行的總位元組大小
    Num_Variable_Key_Cols = 可變長度索引鍵資料行數
    Max_Var_Key_Size = 所有可變長度索引鍵資料行的最大位元組大小
  2. 如果索引為非唯一的索引,請將任何所需的 uniqueifier 列入考慮:
    uniqueifier 是可為 Null 的可變長度資料行。在具有非唯一索引鍵值的資料列中,它將會是非 Null 並且為 4 個位元組大小。此值是索引鍵的一部分,必須用來確定每個資料列都有唯一的索引鍵值。
    Num_Key_Cols = Num_Key_Cols + 1
    Num_Variable_Key_Cols = Num_Variable_Key_Cols + 1
    Max_Var_Key_Size = Max_Var_Key_Size + 4
    這些修改假設所有值均為非唯一的值。
  3. 計算 Null 點陣圖大小:
    若索引鍵中有可為 Null 的資料行,索引資料列的一部分會保留給 Null 點陣圖。計算它的大小:
    Index_Null_Bitmap = 2 + ((可為 Null 索引鍵資料行數 + 7) / 8)
    您應該僅使用先前運算式的整數部分。請捨去任何餘數。
    若沒有可為 Null 的索引鍵資料行,請將 Index_Null_Bitmap 設成 0。
  4. 計算可變長度資料的大小:
    如果在索引中有可變長度的資料行,請決定要在索引資料列中儲存資料行的空間。
    Variable_Key_Size* = 2 + (Num_Variable_Key_Cols x 2) + *Max_Var_Key_Size 這個公式假設所有可變長度的資料行 100% 填滿。如果您預期可變長度資料行所使用的儲存空間百分比會比較小,您可以經由調整百分比所得的 Max_Var_Key_Size 值,產生更精確的整體資料表大小之估計。
    若沒有可變長度的資料行,請將 Variable_Key_Size 設成 0。
  5. 計算索引資料列的大小:
    Index_Row_Size = Fixed_Key_Size + Variable_Key_Size + Index_Null_Bitmap + 1 (索引資料列的資料列標頭負擔) + 6 (子頁面識別碼指標)
  6. 計算每個分頁的索引資料列數目 (每個分頁包含 8096 個可用位元組):
    Index_Rows_Per_Page = 8096 / (Index_Row_Size + 2)
    由於索引資料列並不會跨越分頁,因此每個分頁索引資料列的數目應該捨去小數,而取最接近的整數列數。公式中的 2 是給分頁位置陣列中的該資料列項目。
  7. 計算索引中的層級數目:
    Levels = 1 + log Index_Rows_Per_Page (Num_Rows / Index_Rows_Per_Page)
    將此值無條件向上進位到最近的整數。此值不包含叢集索引的分葉層級。
  8. 計算索引中的分頁數目:
    Num_Index_Pages =∑Level (Num_Rows / (Index_Rows_Per_PageLevel)) 其中 1 <= Level <= Levels
    簡單舉例說明,假設有個索引,其在分葉層級以上需要的索引資料列總數為 1000,並且每個分頁可以容納 25 個索引資料列。這表示儲存這 1000 個資料列需要 40 頁。索引的下一個層級必須儲存 40 個資料列。這表示它需要 2 頁。索引的最後一個層級必須儲存 2 個資料列。這表示它需要 1 頁。在上述公式中使用這些數字時,結果如下:
    高度 = 1 + log25 (1000 / 25) = 3
    Num_Index_Pages = (1000/(25)3) + (1000/(25)2) + (1000/(25)1) = 43,這是範例中所描述的頁數。
  9. 計算索引的大小 (每個分頁共有 8192 個位元組):
    Index_Space_Used* = 8192 x *Num_Index_Pages

步驟 3:加總計算的值

將前兩個步驟所取得的值加總:

叢集索引大小 (位元組) = Leaf_Space_Used + Index_Space_used

上述計算未考慮下列項目:

  • 資料分割
    資料分割所造成的空間負擔極小,但要計算的話很複雜。它並不重要,因此不需要加入計算。
  • 配置頁面
    至少會有一個 IAM 頁面用來追蹤配置給堆積的頁面,但是它的空間負擔極小,而且也沒有決定性的演算法可以確切計算出將會使用多少個 IAM 頁面。
  • 大型物件 (LOB) 值
    決定到底要使用多少空間來儲存 LOB 資料類型 varchar(max)varbinary(max)nvarchar(max)textntextxml 以及 image 值的演算法是很複雜的。只要加上預期的 LOB 值平均大小,乘以 Num_Rows,再將此值加上叢集索引總大小,這就足夠。

請參閱

概念

叢集索引設計指導方針
建立索引 (Database Engine)
非叢集索引設計指導方針
估計資料表的大小
估計非叢集索引的大小
估計堆積的大小

其他資源

估計資料庫的大小

說明及資訊

取得 SQL Server 2005 協助

變更歷程記錄

版本 歷程記錄

2007 年 9 月 15 日

變更的內容:
  • 新增捨去或進位的資訊到步驟 2.7。