日期:2014-05-16  浏览次数:20434 次

JavaScript的数据类型问题
    ?
javascript的数据类型问题已经讨论过很多次了,但许多人还有许多书仍然沿用着错误的、混乱的一些观点,所以就再细讲一回。
提及这个讨论的原因在于argb<span class="info">同学在我的msn博客(现在变成了wordproess,在这里)上的一段回复,又更早的起源则是两年前关于《javascript征途》一书的大讨论:</span>
从“装b被雷劈讲起
<span class="info">——这个事就让它过去了过去了吧。在讨论中我提及到该书对javascript类型系统介绍的混乱,而argb<span class="info">翻出了这篇历史文章,指我的混乱更混乱。于是我列了以下几个问题给他:</span></span>
=============
?
我想很难很快速地解释你的问题。那么,接着你的思路,我就问几个问题好了:<br>1、函数是不是类型?是什么类型?<br>2、为什么说javascript中的函数是“第一型”的?<br>3、undefined如何“包装成object”?即使你所说的是笔误,那么对于“一切都是对象”的javascript,undefined是什么?<br>4、true与boolean(true)在类型上有什么不同?
最后强调一下你的用词问题:undefined是类型,undefined是值,’undefined’是类型的名称。此外,应留意javascript中存在着值类型与引用类型。
=============
随后argb的回复让我觉得一切已经混乱到不得不讲的地步。因为此前也没有讨论过《javascript征途》中的类型系统问题,于是这干脆就补个功课。下面认认真真地谈谈,也顺便回复了argb<span class="info">同学。</span>
再次感谢argb<span class="info">。若非如此,我这篇功课还要欠很久。有读者与朋友们的关心,总是好的。答疑释解,于人于已,皆成美事。</span>
?
再谈javascript的数据类型问题
=============
首先我们谈两点体会。其一,javascript不是纯粹的面向对象语言,它是混合语言,所以所谓“一切面向对象”既是宣传用语,也是一种语言处理技巧。仅从“面向对象”来理解这个语言的类型,会犯很多错误。其二,ecmascript的描述总是很准确而又迟滞于这门语言的发展。所以要理解一些现象,既要从javascript的历史中去找,也要考虑到javascript现在的发展。ecmascirpt是一个标准的、规范化的参考,但不是全部。
接下来说说类型。javascript既是过程式语言,也是面向对象的语言。这一定程度上,也表现为:它事实上有两套类型系统。第一套类型系统是用typeof来识别,这是这个语言的基本类型系统,只有六种类型,即undefined、number、boolean、string、object与function。我一般也称之为基础类型系统。之所以称为“基础”,是因为第二套类型系统是以它为基础,从object这一种类型中发展起来的,即对象类型系统。
对象类型系统用instanceof来识别,它相当于其它高级语言中的is操作/运算。面向对象的多态主要通过as和is来表达,对于javascript来说,由于是弱类型的(没有强制类型检查),所以不需要as。
对象类型系统与基础类型系统存在映射关系,例如基础类型的string影射到对象系统中的string。但这只是影射,所以本质上来说string类型不是string类型。两者本质上不同。具体来说,undefined,string、number和boolean是“值类型”;object与function是“引用类型”。由于string、number与boolean在基础类型中都属于object类型,是object()的子类,因此是引用类型。function()也是引用类型。所有引用类型都可以看着object()的子类,所以任意函数也是object()的子类。例如"<匿名函数> instanceof object"返回true。
undefined是值类型,它没有对应的对象类型——我们通常可以称之为undefined类型,但它没有对应的构造器。undefined只有一个值,即undefined。准确地说,undefined表明声明(或产生)了但没有值的变量。而null也是一个类型,null是它的惟一值(按照语言规则,null也是一个关键字)。null类型是对象类型,亦即是引用类型。所以null与undefined本质的不同,是它们分属在不同的类型系统中,解释着不同类型系统中的“无”的概念。一般来说,dom中的某个属性或成员如果无值,应该使用null;而javascript运算过程中如果出现无值,应该使用undefined。
上面强调要从“两套类型系统”的角度来理解上述类型。而这两个类型系统在javascript中是可以混用的,实现这一特性的技术被称为“类包装”。这是javascript对java的主要借鉴,也是后来的.net对java的主要借鉴之一——类包装也被称为“装箱”(以及“拆箱”)。javascript中的类包装过程出现然属性存取中,即“.运算符”或“[]运算符”。当这两个运算符发现左操作数x是一个“值类型”数据时,将隐式地调用object(x)过程将它转为对象,因此<br>'abc'.length<br>这个运算实际上就等效于<br>object('abc').length
?
最后,我们回到原始的问题上来。所以我说:<br>====<br>javascript 里面有6种基本类型,对象是其中一种,各种对象是“对象(object)”这一种类型中的子类(类型)。<br>====<br>是没有什么错误的。而朱先生在他的书中说:<br>====<br>- javascript 语言只有 3 种最原始的数据类型:数值型、字符串型和布尔型<br>- javascript 还定义了几个特殊的数据类型,如空类型(null)和未定义类型(undefined)。<br>- 基本数据类型按值传送,而复杂数据类型按引用传送。<br>====<br>这几个观点都不太靠谱。其一,这三种是原始的数据类型没错,但并不是“只有3种”,这个稍后一点我再说。其二,空类型与未定义类型这两种说法都是错的,应该是null类型和undefined类型——小写的,是它们的值;首字母大写才是它们的类型。其三,undefined也是按值传递的,然而在朱先生的分类里头,就不知道如何归属。他起码提到了:原始数据类型,特殊数据类型,值(传递的)类型,引用(传递的)类型。这样复杂的分类,会更容易让读者混淆。
<br>最后说一下“原始的数据类型”。这个用词在ecmascript里面有,称为"primitive types",但这个概念主要是从“primitive values"里面引申出来的,而非单独作为一个类型分类的依据——ecmascript中只提到过一次primitive type,并且也没有称之为“types”。ecmascript用“primitive values"来说明一些类型的原始值,例如boolean? types具有原始值true/false。但这并没有说明boolean对象类型与值类型之间的差异或关系,例如不能表明true与boolean(true)之间有什么不同。
ecmascript中使用“primitive values",并陈述了这些原始值的定义,主要是ecmascript要兼顾javascript语言的实现方案。在ecmascript中相当大的一部分是在描述一个语言的实现,许多地方需要将一个对象转换成“primitive values",或使用“primitive values"这样的名词来讲述它的实际实现——但我必须强调,这与类型系统的定义与规划没什么关系。例如ecma讲述“属性(property)”这一概念时,原文是:<br>“properties are containers that hold other objects, primitive values, or functions. a primitive value is a member of one of the following built-in types: undefined, null, boolean, number, and string; an object is a member of the remaining built-in type object; and a function is a ca