日期:2014-05-16  浏览次数:20370 次

Oracle中char类型乱谈
    今天有个朋友问我关于char类型和varchar2类型的取舍问题,我自然推荐他使varchar2。因为我就是这么干的,varchar2灵活且不浪费存储空间就是我的理由,后来就顺手测试了下。这里把测试拿出来,这里重点讨论下char的问题:

在测试的过程中,使用的基本SQL判断语句就是:
     1: 查看数据库的parameters; select * from nls_database_parameters;
     2: 使用dump查看数据的存储情况; select dump(col_name) from dual;
-----------------------------------
步骤一,查看数据库的字符集(NLS_NCHAR_CHARACTERSET),和NLS_LENGTH_SEMANTICS的取值情况,执行完语句:
   
    select * from nls_database_parameters;


后我们可以发现这两个需要注意的PARAMETER的取值:
  
 NLS_NCHAR_CHARACTERSET = UTF8
    NLS_LENGTH_SEMANTICS = BYTE


    其中NLS_LENGTH_SEMANTICS决定了Oracle使用byte还是char来解析 col_name char的含义;因为测试的库中NLS_LENGTH_SEMANTICS的取值为byte,为此col_name char 和col_name(1 byte)是等价的;同时因为NLS_NCHAR_CHARACTERSET的取值为utf8,我测试的结果是在这种情况下col_name char(2 byte) 和col_name(1 char)是一种长度上的等价关系,当然编码
这个问题,这里不再展开考虑,只是指明1 byte = n char 需要考虑NLS_NCHAR_CHARACTERSET后才能有个正确的答案;

步骤二,创建测试数据表并测试

create table test_s_char(id number primary key, char_data_byte char(2), char_data_char char(1 char));
insert into test_s_char(1, 'a', 'a');
insert into test_s_char(2,'安','安');
insert into test_s_char(2,'安','安');

之后查看其存储方式,我们不难发现char_data_byte类型的数据在存储时总是长度为2(定义的长度),而char(1 char)的则不同,其形式等价与varchar2!?
sql>select char_data_byte,dump(char_data_byte) from test_s_char;
--------------------------------------------
a         Typ=96 Len=2: 97,32
安        Typ=96 Len=2: 176,178

sql>select char_data_char,dump(char_data_char) from test_s_char;
--------------------------------------------
a         Typ=96 Len=1: 97
安        Typ=96 Len=2: 176,178


    需要注意的是如果我们使用Oracle自己的length来读取数据的话, 则会发现字符的长度为1,这个可能是length在使用的时候自身处理的结果.
select length(char_data_char), length(char_data_byte) from test_s_char;

    而在使用jdbc的ResultSet来获取char的数据时,使用getString()方法返回的数据总是数据定义的长度,如果不足则使用ASCII取值为32的space来填充,这个是需要注意的地方,同事这个也是我那哥们出岔子的地方,他虽然在表上同一格式化了数据,且使用length得到的数据也是自己期望的,但是程序捣鼓出来的就是不对,症结就在于此。