此文章主要向大家探讨的是SQL Server BIT类型占用空间的多少,对于一般的INT、CHAR、tinyint等相关的数据类型,他们所占用的存储空间都是以Byte字节为单位的,但是BIT类型由于只有0和1或者说false和true。
这种情况只需要一个Bit位就可以表示了,那么在SQL Server中BIT类型到底占用了多少空间?是不是由一个Bit位来存储的?或者可能是使用一个字节来存储的?
这两个答案都不正确!实际上BIT类型占用的空间与BIT类型的列所在表的位置有关,有些情况下BIT占用了一个字节,有些情况下BIT实际占用了几个位(几个BIT类型的列共用一个字节)。下面就来具体分析一下:
1. 单独的BIT类型的列将占用一个字节。
所谓单独就是指一个BIT类型的列的左边定长列和右边定长列都不是SQL Server BIT类型的列。例如这样一个表:
CREATETABLEtt ( c1INTPRIMARYKEY, c2BITNOTNULL, c3CHAR(2)NOTNULL )
SQL Server在存储表中的数据时先是将表中的列按照原有顺序分为定长和变长(变长就是长度不固定的数据类型,如varchar,nvarchar,varbinary等)两组。在数据页中存储数据时先存储所有定长的数据,然后再存储变长的数据。这里由于c2列的左边是int类型,右边是char类型,都是定长的,而且不是BIT类型,所以c1和c3之间必须留出一个字节来存储c2,虽然c2只用到了其中的一个位。
下面我们来验证一下是否真是如我所说:
(1)插入一行数据:
INSERTINTOttVALUES(1,1,'aa')
(2)找到tt表数据的***页(也就是刚才插入的这行数据所在页)的文件号和页面号:
SELECTfirst_page FROMsys.partitionsp INNERJOINsys.system_internals_allocation_unitsa ONp.partition_id=a.container_id WHEREOBJECT_IDOBJECT_ID=OBJECT_ID('dbo.tt')
我这里返回的是0x76 00 00 00 01 00,这里需要反转过来看0x00 01 00 00 00 76。其中前两个字节是文件号,后面的是页面号,所以文件号是1,页面号是118(0x76转换成十进制就是118)
(3)使用DBCC page命令查看该页的内部结构:
DBCCtraceon(3604) DBCCpage(TestDB,1,118,3)
这儿DBCC traceon(3604)表示将页面内容直接输出,TestDB是我创建的tt表所在的数据库,1和118前面已经说了。***一个是打印选项。0表示只输出页头;1则不会输出所有内容,只是输出有数据的内容;2表示完整的输出这个页的内容,3则和1差不多,但是要每条记录分别列出列的值。以下是输出的需要关注的内容:
00000000:10000b0001000000016161030000††††††.........aa...
关于数据行的具体格式我就不在这里多说了,在《SQL Server 2005技术内幕 存储引擎》中有详细介绍。我们插入的数据从第5个字节开始,是01000000 016161。这儿01000000就是c1,由于是int类型,所以占用4个字节。接下来01就是c2,在这里占用了1字节。再接下来6161就是c3了。
2.多个BIT类型的列之间使用变长数据类型列分开
则去掉变长列,然后看连续的SQL Server BIT类型列的个数,每列占用一个位,如果多余了8列那就再占用更多的字节。例如创建这样的表:
CREATETABLEvtt ( c1BITNOTNULL, c2VARCHAR(5)NOTNULL, c3BITNOTNULL, c4NVARCHAR(5)NULL, c5BITNULL, c6INTNOTNULL )
这里将变长列筛选出来后就变成了c1、c3、c5、c6,有3个BIT类型列是连续的,所以c1、c3、c5将公用一个字节。接下来就来验证一下:
(1)插入一条示例数据:
INSERTINTOvttVALUES(1,'abc',1,N'xyz',0,1023)
(2)用前面用的SQL语句,同样的方法,找出vtt表的***页为:0xC00000000100,对应的就是文件号1,页号192
(3)查看该页的内部数据:
00000000:3000090003ff03000006000002001500†0.............. 00000010:1b00616263780079007a00†††††††††††††..abcx.y.z.
插入的数据从第5个字节开始03ff…… 这儿03就是c1、c3、c5的数据,03转换成二进制就是00000011。c1列对应***位1,c3对应倒数第二位1,c5对应倒数第三位0。接下来的ff就是c6的值1023。后面的就是列数、NULL位图、变长列等,这里是讨论BIT位占用空间的,所以就不讲解后面这些了。
3.一个表中有多个SQL Server BIT类型的列
其顺序是否连续决定了BIT位是否可以共享一个字节。SQL Server中按照列顺序存储,***列和***一列都是BIT数据类型列,不可以共用一个字节。
也就是说下面的表t1和表t2占用的空间是不同的,t1数据占用了7字节,t2数据占用了8字节。
CREATETABLEt1 ( c1INTPRIMARYKEY, c2BITNOTNULL, c3BITNOTNULL, c4CHAR(2)NOTNULL ) CREATETABLEt2 ( c1INTPRIMARYKEY, c2BITNOTNULL, c4CHAR(2)NOTNULL, c3BITNOTNULL )
但是在下面的t3和t4表中,由于中间是变长数据类型,所以他们的BIT列占用的数据空间是相同的。
CREATETABLEt3 ( c1INTNOTNULL, c2BITNOTNULL, c3VARCHAR(2)NOTNULL, c4BITNOTNULL ) CREATETABLEt4 ( c1INTNOTNULL, c2BITNOTNULL, c4BITNOTNULL, c3VARCHAR(2)NOTNULL )
以上的相关内容就是对SQL Server BIT类型到底占用了多少空间的介绍,望你能有所收获。
【编辑推荐】
- SQL Server 2008 基于策略之管理大全SQL Server 2008数据格式修改时应注意什么?SQL Server存储过程之新手导航SQL Server 2005降级到2000的正确操作步骤SQL Server数据库之查看SQL日志文件大小的命令