日期:2014-05-16 浏览次数:20348 次
UTF-8有点类似于Haffman编码,它将Unicode编码为:0x00-0x7F的字符,用单个字节来表示;0x80-0x7FF的字符用两个字节表示;0x800-0xFFFF的字符用3字节表示; 汉字的unicode范围是:0x4E00~0x9FA5 其实这个范围还包括了中,日,韩的字符 方法1 <script language="javascript"> function isChina(str){ if(/.*[\u4e00-\u9fa5]+.*$/.test(obj)) // \u 表示unicode { alert("不能含有汉字!"); return false; } return true; } 方法2 <script language="javascript"> function isChina(s){ var patrn=/[\u4E00-\u9FA5]|[\uFE30-\uFFA0]/gi; // [\u4E00-\u9FA5]表示汉字,[\uFE30-\uFFA0]表示全角 if(!patrn.exec(s)){ return false; } else{ return true; } } 方法3 <script language="javascript"> function isChina(s){ var index = escape(s).indexOf("%u"); if(index < 0){return false;}else{return ture} } 方法3原理:escape对字符串进行编码时,字符值大于255的以"%u****"格式存储,而字符值大于255的恰好是非英文字符(一般是中文字符,非中文字符也可以当作中文字符考虑);indexOf用以判断在字符串中是否存在某子字符串,找不到返回"-1"。