日期:2014-05-16  浏览次数:20515 次

数据库字符型字段设计的原则

数据库字符型字段设计的原则

第二章	字符类型字段概述
类型	长度	使用说明	长度说明
char(n) 	
定长	索引效率高 程序里面使用trim去除多余的空白	n 必须是一个介于 1 和 8,000 之间的数值,存储大小为 n 个字节
varchar(n)	
变长	效率没char高 灵活	n 必须是一个介于 1 和 8,000 之间的数值。存储大小为输入数据的字节的实际长度,而不是 n 个字节
text(n)	
变长	非Unicode数据	不用指定长度
nchar(n)	
定长	处理unicode数据类型(所有的字符使用两个字节表示)	n 的值必须介于 1 与 4,000 之间。存储大小为 n 字节的两倍
nvarchar(n)	
变长	处理unicode数据类型(所有的字符使用两个字节表示)	n 的值必须介于 1 与 4,000 之间。字节的存储大小是所输入字符个数的两倍。所输入的数据字符长度可以为零
ntext(n) 
变长	处理unicode数据类型(所有的字符使用两个字节表示)	不用指定长度


2.1		CHAR概述
CHAR存储定长数据很方便,CHAR字段上的索引效率级高,比如定义char(10),那么不论你存储的数据是否达到了10个字节,都要占去10个字节的空间,不足的自动用空格填充,所以在读取的时候可能要多次用到trim()。
2.2		VARCHAR概述
存储变长数据,但存储效率没有CHAR高。如果一个字段可能的值是不固定长度的,我们只知道它不可能超过10个字符,把它定义为 VARCHAR(10)是最合算的。VARCHAR类型的实际长度是它的值的实际长度+1。为什么“+1”呢?这一个字节用于保存实际使用了多大的长度。从空间上考虑,用varchar合适;从效率上考虑,用char合适,关键是根据实际情况找到权衡点。

2.3		TEXT概述
text存储可变长度的非Unicode数据,最大长度为2^31-1(2,147,483,647)个字符。
2.4		NCHAR、NVARCHAR、NTEXT。
这三种从名字上看比前面三种多了个“N”。它表示存储的是Unicode数据类型的字符。我们知道字符中,英文字符只需要一个字节存储就足够了,但汉字众多,需要两个字节存储,英文与汉字同时存在时容易造成混乱,Unicode字符集就是为了解决字符集这种不兼容的问题而产生的,它所有的字符都用两个字节表示,即英文字符也是用两个字节表示。nchar、nvarchar的长度是在1到4000之间。和char、varchar比较起来,nchar、nvarchar则最多存储4000个字符,不论是英文还是汉字;而char、varchar最多能存储8000个英文,4000个汉字。可以看出使用nchar、nvarchar数据类型时不用担心输入的字符是英文还是汉字,较为方便,但在存储英文时数量上有些损失。
以下字符串:我和coffee
如果设计成varchar字段,则占2×2+6=10个字节的存储空间,而nvarchar字段占8×2=16个字节的存储空间。
所以如果字段值只是英文可选择varchar,而字段值如果存在双字节(中文、韩文等)字符时则用nvarchar

综上, 一般来说,如果含有中文字符,用nchar/nvarchar/ntext,如果纯英文和数字,用char/varchar/text。

可以概括成:
CHAR,NCHAR 定长,速度快,占空间大,需处理
VARCHAR,NVARCHAR,TEXT 不定长,空间小,速度慢,无需处理
NCHAR、NVARCHAR、NTEXT处理Unicode码

第三章		何时会出现此问题
正常情况下,我们使用varchar也可以存储中文字符,但是如果遇到操作系统是英文操作系统并且对中文字体的支持不全面时, 在SQL Server存储中文字符为varchar就会出现乱码(显示为??).而且正常情况下,主机都会支持中文的环境,所以如果使用varchar来存储数据,多数情况下,在开发阶段是发现不了的. 
  当然,使用nvarchar存储英文字符会增大一倍的存储空间.但是在存储代价已经很低廉的情况下,优先考虑兼容性会给你带来更多好处的.
  所以在Design的时候应该尽量使用nvarchar来存储数据.只有在你确保该字段不会保存中文的时候,才采用varchar来存储.这个时候才不会有问题.
  但是如果布署的主机是英文操作系统,并且不支持中文环境,那问题就出来了.所有的varchar字段在存储中文的时候都会变成乱码(显示为??).而且一般情况下你不会知道这是因为你采用了错误的数据类型来存储所造成的,你会试着去装中文字体,试着去设置操作系统的语言环境...这些都不能解决问题,唯一能解决问题的是把数据库字段的类型个性为nvarchar(或者nchar或者ntext).对项目管理比较熟悉的朋友应该都知道,到布署阶段再来修改数据库是一个很恐怖的事情.
  使用nvarchar的另一个好处就是在判断字符串的时候可以不需要考虑中英文两种字符的差别.

教参网址:
http://www.cnblogs.com/yelaiju/archive/2010/05/29/1746826.html