如何大幅提高DBCC CHECKDB/DBCC CHECKTABLE的性能

 

随着时间的推移,数据库变的越来越大,几百个GB甚至几个TB大小的数据库越来越多。为了检查数据库的完整性,定期运行DBCC CHECKDB/CHECKTABLE是最佳实践。但是随着数据库的增大,如何缩短DBCC CHECKDB/CHECKTABLE的运行时间是DBA常常需要面对的一个挑战。本短文介绍一些方法,可以大幅缩短常规CHECKDB/CHECKTALE 的运行时间。

 

正常情况下,CHECKDB/CHECKTABLE的运行不会对数据库使用排它锁,而是使用内部数据库快照(internal database snapshot)。 这个内部数据库快照实质就是Sparse Filestream, 它使用sparse file,COPY-ON-WRITE技术。详细的工作原理可以参考如下的文档:

 

数据库快照的工作方式

https://msdn.microsoft.com/en-us/library/ms187054(v=SQL.105).aspx

简单说,对数据库快照的读操作如下图所示:

 

如果你想观察DBCC CHECKDB/CHECKTABLE运行时的快照,你可以使用streams.exe工具。我使用它观测到如下的结果:

上图中的 “MSSQL_DBCC10:$DATA”就是附加在testdb.mdf后面的Sparse Filestream。后面的那串数字是数据库加上stream的总的大小,这个和下面的语句观察到的size_on_disk_bytes是一致的:

 

select * from sys.dm_io_virtual_file_stats(5,1)

 

 

但是要注意到,因为sparse filestream并不实际占有磁盘大小,上面的大小只是一个空间的保留,并不是磁盘上真的有这么多的数据存在,并不真正占有磁盘的这么大的空间。

 

言归正传,上面介绍的internal snapshot (也就是sparse filestream)有什么关系呢?

 

先做个实验,运行CHECKDB几次看看运行时间:

 

DBCC CHECKDB(TESTDB)

 

这个运行了大概50秒的时间。然后我使用TABLOCK选项测试几次:

 

DBCC CHECKDB(TESTDB)

withTABLOCK

 

天啊,它只需要大概5秒的时间就跑完了,整整快了10倍!读到这里,你知道了第一个大幅缩短CHECKDB/CHECKTABLE的办法,就是使用TABLOCK。这个hint 告诉SQL server 使用锁来进行检查,但也影响了数据库用户的使用。比如在检查某个table 的时候,就可能无法对这个table进行修改。 那么有没有更好的不影响用户的办法呢?有的,就是使用snapshot 数据库。

 

首先建立一个snapshot 数据库:

 

createdatabase myTESTDB_snapshot

on

( name =TESTDB_Data ,filename='C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\DATA\TESTDB_Data.ss')

asSNAPSHOTOF TESTDB

 

然后对这个snapshot数据库进行CHECKDB:

 

DBCC CHECKDB(myTESTDB_snapshot)

 

结果令人惊讶,它也仅仅使用了5秒,和使用TABLOCK一样的性能! 太令人兴奋了,不影响用户的情况下比原来的CHECKDB快了10倍。你发现了什么问题吗?恩,对,我是对myTESTDB_snapshot进行CHECKDB,而不是TESTDB。这样可以么?可以的, 原因自己思考。可以参考snapshot的工作原理来考虑。

 

那么对CHECKTABLE有什么不一样么? 我测试的结果类似。 就是说, 使用snapshot 数据库来进行CHECKTABLE的性能和使用TABLOCK的性能类似,都能大幅缩短检查的时间。测试的结果如下:

 

DBCC CHECKDB

40-50 seconds

DBCC CHECKDB with TABLOCK

5 seconds

DBCC CHECKDB on snapshot database

5 seconds

DBCC CHECKTABLE Batch

8-12 minutes

DBCC CHECKTABLE Batch with TABLOCK

18 seconds

DBCC CHECKTABLE Batch on Snapshot database

20 seconds