估计聚集索引的大小

您可以使用下列步骤估计存储聚集索引中的数据所需的空间大小:

  1. 计算存储聚集索引叶级数据所用的空间。

  2. 计算存储聚集索引的索引信息所用的空间。

  3. 对计算出的值求和。

步骤 1. 计算在叶级别存储数据所用的空间

  1. 指定表中显示的行数:

    Num_Rows = 表中的行数

  2. 指定固定长度和可变长度列的数量,并计算存储所需的空间:

    计算每组列在数据行中所占据的空间。列的大小取决于数据类型和长度规定。有关详细信息,请参阅数据类型(数据库引擎)

    Num_Cols = 总列数(固定长度和可变长度)

    Fixed_Data_Size = 所有固定长度列的总字节大小

    Num_Variable_Cols = 可变长度列的数量

    Max_Var_Size = 所有可变长度列的最大字节大小

  3. 如果聚集索引不唯一,则请说明“唯一标识符”列:

    唯一标识符是可为 Null 的可变长度列。在具有非唯一键值的行中,它非 Null 而且大小为 4 个字节。此值是索引键的一部分,用于确保每一行都具有唯一的键值。

    Num_Cols = Num_Cols + 1

    Num_Variable_Cols = Num_Variable_Cols + 1

    Max_Var_Size = Max_Var_Size + 4

    这些修改假定所有值都不是唯一的。

  4. 保留行中称为 Null 位图的部分以管理列的为空性。计算其大小:

    Null_Bitmap = 2 + ((Num_Cols + 7) / 8)

    仅使用上述表达式中的整数部分,而放弃所有余数。

  5. 计算可变长度数据的大小:

    如果表中有可变长度列,请确定在行中存储这些列需使用的空间:

Variable_Data_Size* = 2 + (Num_Variable_Cols x 2) + *Max_Var_Size

添加到 ***Max\_Var\_Size*** 中的字节用于跟踪每个可变列。此公式假设所有可变长度列均百分之百充满。如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整 ***Max\_Var\_Size*** 值,从而对整个表大小得出一个更准确的估计。

<div class="alert">

<table>
<colgroup>
<col style="width: 100%" />
</colgroup>
<thead>
<tr class="header">
<th><img src="images/ms173548.alert_note(zh-cn,SQL.100).gif" title="注意" alt="注意" class="note" /><strong>注意</strong></th>
</tr>
</thead>
<tbody>
<tr class="odd">
<td><p>您可以组合 varchar、nvarchar、varbinary 或 sql_variant 列,使得定义的表的总宽度超过 8,060 字节。对于 varchar、varbinary 或 sql_variant 中的每一列,其长度不能超过 8,000 字节,对于 nvarchar 列,不能超过 4,000 字节。但是,表中这些列的组合宽度可超过 8,060 字节的限制。有关详细信息,请参阅<a href="ms186981(v=sql.100).md">行溢出数据超过 8 KB</a>。</p></td>
</tr>
</tbody>
</table>

</div>

如果没有可变长度列,请将 ***Variable\_Data\_Size*** 设置为 0。
  1. 计算总的行大小:

    Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

    值 4 是数据行的行标题的开销。

  2. 下一步,计算每页的行数(每页有 8096 个可用字节):

    Rows_Per_Page = 8096 / (Row_Size + 2)

    因为行不跨页,所以每页的行数应向下舍入到最接近的整数。公式中的数值 2 是计算行数时引入的行大小余量。

  3. 根据指定的填充因子计算每页保留的空行数:

    Free_Rows_Per_Page = 8096 x ((100 - Fill_Factor) / 100) / (Row_Size + 2)

    计算中使用的填充因子为整数值,而不是百分比。因为行不跨页,所以每页的行数应向下舍入到最接近的整数。填充因子增大时,每页将存储更多的数据,因此页数将减少。公式中的数值 2 是计算行数时引入的行大小余量。

  4. 计算存储所有行所需的页数:

    Num_Leaf_Pages = Num_Rows / (Rows_Per_Page - Free_Rows_Per_Page)

    估计的页数应向上舍入到最接近的整数。

  5. 计算在叶级别中存储数据所需的空间大小(每页共有 8192 个字节):

Leaf_space_used* = 8192 x *Num_Leaf_Pages

步骤 2. 计算存储索引信息所用的空间

您可以使用下列步骤估计存储索引的较高级别所需的空间大小:

  1. 指定索引键中固定长度和可变长度列的数量,并计算存储所需的空间:

    索引键列可以包括固定长度和可变长度列。若要估计内部级别索引行的大小,请计算每组列在索引行中所占据的空间。列的大小取决于数据类型和长度规定。有关详细信息,请参阅数据类型(数据库引擎)

    Num_Key_Cols = 总键列数(固定长度和可变长度)

    Fixed_Key_Size = 所有固定长度键列的总字节大小

    Num_Variable_Key_Cols = 可变长度键列的数量

    Max_Var_Key_Size = 所有可变长度键列的最大字节大小

  2. 如果索引不唯一,则请说明所需的任意唯一标识符:

    唯一标识符是可为 Null 的可变长度列。它将是非 Null 的,在具有非唯一索引键值的行中的大小是 4 个字节。此值是索引键的一部分,用于确保每一行都具有唯一的键值。

    Num_Key_Cols = Num_Key_Cols + 1

    Num_Variable_Key_Cols = Num_Variable_Key_Cols + 1

    Max_Var_Key_Size = Max_Var_Key_Size + 4

    这些修改假定所有值都不是唯一的。

  3. 计算 Null 位图大小:

    如果索引键中有允许为 Null 的列,则索引行的一部分将为 Null 位图保留。计算其大小:

    Index_Null_Bitmap = 2 + ((索引行中的列数 + 7) / 8)

    仅应使用上述表达式中的整数部分,而放弃所有余数。

    如果没有可为 Null 的键列,请将 Index_Null_Bitmap 设置为 0。

  4. 计算可变长度数据的大小:

    如果索引中有可变长度列,请确定在索引行中存储这些列需使用的空间:

Variable_Key_Size* = 2 + (Num_Variable_Key_Cols x 2) + *Max_Var_Key_Size

添加到 ***Max\_Var\_Key\_Size*** 中的字节用于跟踪每个可变长度列。此公式假设所有可变长度列均百分之百充满。如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整 ***Max\_Var\_Key\_Size*** 值,从而对整个表大小得出一个更准确的估计。

如果没有可变长度列,请将 ***Variable\_Key\_Size*** 设置为 0。
  1. 计算索引行大小:

    Index_Row_Size = Fixed_Key_Size + Variable_Key_Size + Index_Null_Bitmap + 1(对应于索引行的行标题开销)+ 6(对应于子页 ID 指针)

  2. 下一步,计算每页的索引行数(每页有 8096 个可用字节):

    Index_Rows_Per_Page = 8096 / (Index_Row_Size + 2)

    因为索引行不能跨页,所以每页的索引行数应向下舍入到最接近的整数。公式中的 2 是计算行数时引入的行大小余量。

  3. 计算索引中的级别数:

    Non-leaf_Levels = 1 + log Index_Rows_Per_Page (Num_Leaf_Pages / Index_Rows_Per_Page)

    将此值向上舍入到最接近的整数。此值不包括聚集索引的叶级别。

  4. 计算索引中的非叶页数:

Num_Index_Pages =∑Level (Num_Leaf_Pages / (Index_Rows_Per_PageLevel))

其中,1 \<= Level \<= ***Non-leaf\_Levels***

将每个被加数向上舍入到最接近的整数。由于是个简单示例,请考虑使用 ***Num\_Leaf\_Pages*** = 1000 和 ***Index\_Rows\_Per\_Page*** = 25 的索引。页级别以上的第一个索引级别存储 1000 个索引行,即每个叶页一个索引行,每页可以包括 25 个索引行。这意味着存储这 1000 个索引行需要 40 页。下一级索引必须存储 40 行。这意味着需要 2 页。最后一级索引必须存储 2 行。这意味着需要 1 页。这就提供了 43 个非叶索引页。如果将这些数用到前面的公式中,结果如下:

***Non-leaf\_Levels*** = 1 + log25 (1000 / 25) = 3

***Num\_Index\_Pages***= 1000/(253)+ 1000/(252) + 1000/(251) = 1 + 2 + 40 = 43,这是上面的示例中所述的页数。
  1. 计算索引的大小(每页总共有 8192 个字节):

Index_Space_Used* = 8192 x *Num_Index_Pages

步骤 3. 对计算出的值求和

对从前面两个步骤中得到的值求和:

聚集索引大小(字节)= Leaf_Space_Used + Index_Space_used

此计算不考虑以下因素:

  • 分区

    分区的空间开销很小,但是计算复杂。是否包括它并不重要。

  • 分配页

    至少有一个 IAM 页用于跟踪为堆分配的页,但是空间开销很小,并且没有算法可以精确地计算出要使用的 IAM 页数。

  • 大型对象 (LOB) 值

    精确确定存储 LOB 数据类型 varchar(max)、varbinary(max)、nvarchar(max)、text、ntext、xml 和 image 值所用的空间量的算法非常复杂。只需加上所期望的 LOB 值的平均大小,再乘以 Num_Rows,然后再加上聚集索引的总大小就可以了。

  • 压缩

    无法预先计算压缩索引的大小。