Unicode 压缩的实现

适用于: SQL Server Azure SQL 数据库 Azure SQL 托管实例

SQL Server 使用 Unicode 标准压缩方案 (SCSU) 算法实现来压缩在行或页压缩对象中存储的 Unicode 值。 对于这些压缩对象,Unicode 压缩对于“nchar(n)”和“nvarchar(n)”列而言是自动的。 数据库引擎将 Unicode 数据存储为 2 个字节,无论区域设置如何。 这称为 UCS-2 编码。 对于某些区域设置而言,在 SQL Server 中实现 SCSU 压缩可节省高达 50% 的存储空间。

支持的数据类型

Unicode 压缩支持固定长度的 nchar(n)nvarchar(n) 数据类型。 存储于行外或“nvarchar(max)”列中的数据值不会被压缩。

注意

nvarchar(max) 不支持 Unicode 压缩,即使数据存储于行内。 但是,此数据类型仍可以从页压缩中受益。

从早期 SQL Server 版本升级

将 SQL Server 数据库升级到 SQL Server 时,将不会对任何数据库对象(无论是压缩的还是未压缩的)进行与 Unicode 压缩相关的更改。 在数据库升级后,对象会受到影响,如下所示:

  • 如果该对象未压缩,则不会进行更改,并且对象继续像以前一样工作。

  • 行或页压缩的对象继续像以前那样工作。 未压缩的数据将一直保持未压缩的形式,直到其值被更新。

  • 插入行或页压缩表的新行使用 Unicode 压缩进行压缩。

    注意

    为了充分利用 Unicode 压缩的优点,将使用页或行压缩重新生成对象。

Unicode 压缩影响数据存储的方式

在创建或重新生成某一索引时,或者在使用行或页压缩进行压缩的表中更改某一值时,只有在其压缩大小小于其当前大小时,受影响的索引或值才以压缩的形式存储。 这样可避免表或索引中的行由于 Unicode 压缩而增大。

压缩节省的存储空间取决于所压缩数据的特性和数据的区域设置。 下表列出了可以为若干区域设置节省的空间。

区域设置 压缩百分比
英语 50%
德语 50%
Hindi 50%
土耳其语 48%
越南语 39%
日语 15%

后续步骤