日期:2014-04-26  浏览次数:21006 次

随着Internet的发展,越来越多的信息进入互联网,信息的交换、检索、保存及再利用等迫切的需求使HTML这种最常用的标记言语已越来越捉襟见肘。HTML将数据内容与表现融为一体,可修正性、数据可检索性差,而XML自创了HTML与数据库、程序文语的优点,将内容与表现分开,不只使检索更为方便,更次要的是用户之间数据的交换愈加方便,可重用性更强。

  XML是一种元标记言语,没有许多固定的标记,为WEB开发人员提供了更大的灵活性。当我们使用HTML时,标记只是简单的表示内容的显示方式,而与表示的内容没有任何关联,为文档的进一步处理带来极大的不便。比如要表示团体简历,用HTML的表示方式如下:

<HTML>
<BODY>
<TABLE border=1 cellspacing=0>
<TH>姓名<TD>禹希初<TH>性别<TD>男<TH>生日<TD>1977.5
<TR>
<TH>技能<TD colspan=5>数据库设计与维护、WEB开发
</TABLE>
</BODY>
</HTML>

姓名 禹希初 性别 男 生日 1977.5 技能 数据库设计与维护、WEB开发
上例在浏览器中的样子

  在这里,我们无法从标记TH、TD得知其内容表示什么,如果用XML,相应的文档(文件名:团体简历.xml)就可写成如下方式:

<?xml version="1.0" encoding="GB2312"?>
<resume>
<name>禹希初</name>
<sex>男</sex>
<birthday>1977.5</birthday>
<skill>数据库设计与维护、WEB开发</skill>
</resume>


上例在浏览器中的样子(IE5.0或更新版本)

说明:

  version──规定了XML文档的版本,此处只能是1.0;

  encoding── 此处规定了XML文档的编码类型,此处取值为"GB2312",也就是"简体中文"。

  对比两例,使用XML我们可以做到自定义标记,用标记表明内容的含义。这样在Internet上交流材料时,为用计算机处理文档提供了极大的方便,同时我们阅读源文件时也不会被一大堆格式弄得晕头转向。

  然而,由于XML并没无为标记规定显示方式,如果我们在旅游器中查看以上两个文档(建议使用IE5.0或更新版本),我们将看到xml文档并没有以诸如表格的方式来显示。难道我们就不能像HTML一样显示文档吗?回答能否定的。以团体简历为例,需求另建一个格式文件说明各个标记的显示方式,其内容如下(假设文件名为resume.css):

resume{ display: block;}
name{ display: block; font-size:120%;}
sex{ display:block; text-indent:2em}
birthday{ display:block; text-indent:2em}
skill{ display:block; text-indent:2em}

说明:

  以上均为CSS款式,建议读者参考有关材料熟悉CSS,在当前学习中必须用到,此处由于篇幅关系不作引见。建立文件resume.css后,在团体简历.xml文件的第一行后添加以下文字:

<?xml:stylesheet type="text/css" href="resume.css"?>


上例在浏览器中的样子(IE5.0或更新版本)

说明:

  此处表示援用一个外部CSS款式文件,其中type规定款式类型(可取值为text/css或text/xsl),href规定文件路径。

  保存文件,再以IE5.0打开文件。怎样样?格式有些不一样吧。好象还不令人满意,文档内容是清晰了,但显示效果比HTML编写的文档就差得多了,XML编写的文档就只能以这种方式显示吗?!

提示:

  1. 为了更好的理解与掌握XML,建议大家熟悉HTML 4.0与CSS 2.0语法;掌握JavaScript、VBscript中至少一种;编程经验、对数据库理论与SQL的了解均能使大家在学习XML时获益。

  2. XML文档中标记必须成对出现,如果是空标记也必须有前加"/"的同名标记结束,或使用此种文式<xml_mark/>表示空标记。

  3. XML以及下面将要引见的XSL文档,属性值必须用双引号(")或单引号(’)括起来。

  4. XML文档必须是良构的(XSL文档也是XML文档中一种),也就是说标记必须有结束标记、标记可以嵌套但不可交叉,如:

<outer><inner></inner><inner/></outer>

是合法的,而下面的方式

<outer><inner></outer></inner>

则是错误的。如果XML文档在浏览时出错,多半是违反了上面提到的规则。[page]

上期我们讲到用CSS(层叠款式表)来格式化XML文档,其效果并不很令人满意。实际上CSS用来格式化HTML标记比较合适些,只是由于它简单才在上例中采用。

  XML在更多的时候只是一种数据文件,怎样将它变为我们日常所看到的HTML格式那样的文件呢?如果我们将XML文件比作结构化的原料的话,那么XSL就好像"筛子"与"模子",筛子选取本人需求的原料,这些原料再通过模子构成最终的产品:HTML。

  这个模子大致是这样:我们先设计好表现的页面,再将其中需求从XML中获取数据来填充内容的部分"挖掉",然后用XSL语句从XML中筛出相关的数据来填充。一言以譬之:这XSL实际上就是HTML的一个"壳子",XML数据利用这个"壳"来生成"传统"的HTML。

  XML在展开时是一个树形结构,我们将树形结构中自定义标记称为节点,节点之间存在父子、兄弟关系,我们要访问其中的结点从根结点就要以"/"来层层进入。

  在XSL这个壳中,我们要从原料库XML里提取相关的数据,就要用到XSL提供的模式化查询言语。所谓模式化查询言语,就是通过相关的模式婚配规则表达式从XML里提取数据的特定语句,即我们上面所说的"筛子"。

  参考微软的"XSL开发者指南",我们大致可将模式言语分为三种:

  选择模式:

<xsl:for-each>、<xsl:value-of>和 <xsl:apply-templates>

  测试模式:

<xsl:if> 和<xsl:when>

  婚配模式:

<xsl:template>

  我们如今就分别对之进行引见。

  一、 选择模式

  选择模式语句将数据从XML中提取出来,是一种简单获得数据的方法,这几个标记都有一个select属性,选取XML中特定的结点名的数据。

  1、<xsl:for-each>

  如在XML中有这样的数据:

<author>
<name>小禹</name>
<name>春华</name>
<name>秋实</name>
</author>

  我们要读取这三个作者名字,是一个一个地按"author/name"方法来读取吗,可有多个这样的name呀?如果有一种程序性的语句来循环读取有多好啊!

  想得很对,XSL提供了这样的具有程序文语性质的语句:<xsl:for-each>

  用它读取这三个作者名字的方法如下:

<xsl:for-each select="author/name">
……
</xsl:for-each>

  select,顾名思义,选取,它可以选定XML中特定独一的标记,也可以选择某一类相反的标记,我们称之为结点集。

  语法:

<xsl:for-each