日期:2014-05-02  浏览次数:22669 次

XML文档的一大特点是可以向多种格式的文档进行转换。比如,从一种逻辑结构的XML向另一种逻辑结构的XML转换,或是转换为可浏览的HTML文档等。这种XML文档的数据格式转换功用由可扩展款式单言语(XSL)完成。


北京邮电大学 张剑

--------------------------------------------------------------------------------


一、XML文档转换原理
数据格式转换的重要思想是要把XML文档视为一种树结构,转换的过程就是从源树生成结果树的过程。XSL款式单定义了源树和结果树中对应部分的转换规则,每条规则中包含了一个模板,并对应着一种模式。模板定义了转换的结果,而模式则规定了需求进行转换的元素或属性对象。
XML中援用XSL的语法格式如下:
<?xml-stylesheet type=“text/xsl” href=“Employees.xsl” ?>
如果在声明部分援用了多个XSL款式单,则只要第一个款式单会生效,其余的都会被忽略掉。
XSL的格式转换功用在复杂的电子商务处理方案中大有用武之地。比如,A公司和B公司都是生产机器零件的厂家,在货物清单中都包含了产品序列号以及质量等级评分。A公司的文件格式如下:
<Order>
<OrderItem>
<ItemID>12980-235</ItemID>
<Quantity>200</Quantity>
</OrderItem>
</Order>
而B公司的文件格式有所不同,相关信息都出如今元素的属性中:
<Order>
<OrderLine PartNo=“12980-235” NumRequired=“200”/>
</Order>
这样,虽然两个公司的产品完全一样,但由于文档格式的差异给双方的贸易往来设置了妨碍。而使用XSL款式单可以轻松地把A公司的文档转换成B公司的格式,反之亦然。
二、XML文档转换步骤
XML文档的转换过程分为两步:
● 首先是依据XML文档结构源树,然后依据XSL规则将源树转换为结果树。目前,这种转换协议曾经日趋完善,并从XSL中独立出来,成为W3C正式推荐的标准,称为XSLT(XSL Transformations);
● 生成结果树后,就可以对其进行解释,产生一种适合显示、打印或是播放的格式,这一步称为格式化(Formatting)。  
XSL处理器担任实现转换过程。首先,XML文档被解析成DOM树存放在内存中,接着对文档进行分析,每一个DOM树中的节点都会与一个模式相比较,当二者婚配时,就会按照模板中定义的规则进行转换,否则继续往下婚配。如此循环,直至整个文档处理完毕。
三、XSL文档标准格式
XSL文档的标准格式如下:
<xsl:stylesheet xmlns:xsl=“http://www.w3.org/TR/WD-xsl”>
template rule i
output template
</xsl:stylesheet>
XSL文档本身是格式良好的XML文档,所以在书写时要留意标签的婚配问题。<xsl:stylesheet>既是XSL的声明语句,也是根元素,必须位于文件的首部。通常也要利用xmlns属性指明XSL的名称空间。款式单中所有的模板规则都由标签<xsl:temlplate>标明。模板规则可以说明处理的对象(元素/属性)、处理的方式或是转换的结果。此时,我们可以把该标签类似地理解为编程言语中函数的概念。
四、XSL的语法结构
XSL的逻辑语法结构包括循环和条件判断。这两种结构使用户能够灵活地书写转换规则。循环判断是通过<xsl:for-each>元素实现的,它的可选属性包括select和order-by。循环结构能够遍历整个结果集合,而不必针对每一条结果都单独书写转换规则。它的标准语法格式为:
<xsl:for-each select=“pattern” order-by=“patternlist”>
......
</xsl:for-each>
条件判断结构分为if语句和Case语句两种方式。if语句是简单地对条件进行判断,结果为真就执行条件内部的规则,因此可以把if条件与简单的布尔表达式联合使用。下面这个例子就是对薪水超过100万元的职员输出“Overpaid employee”信息:
<xsl:if match=“.[Salary $gt$ 1000000]”>
Overpaid employee
</xsl:if>
Case语句是对多种情况的分支判断。该语句包括<xsl:choose>、<xsl:when>和<xsl:otherwise>三个元素。下面的例子是对薪水不足1万元的职员输出“No tax”,对超过5万元的职员输出“High tax rate”,对介于其间的职员输出“Normal tax rate”信息:
<xsl:choose>
<xsl:when match=“.[Salary $lt$ 10000]”>  
No tax </xsl:when>
<xsl:when match=“.[Salary $gt$ 50000]”>  
High tax rate </xsl:when>
<xsl:otherwise> Normal tax rate </xsl:otherwise>
</xsl:choose>
五、XSL的模板规则
<xsl:template>标签内的文本内容描述了转换结果的方式,称为输出模板。属性match的取值把模板规则与指定的元素或属性相比较,只要婚配的DOM节点才会被处理,其余的节点将被忽略。整个过程中最先婚配的是树的根节点,根节点用“/”表示:
<xsl:template match=“/”>
output template for root element
</xsl:template>
然后婚配其他节点,此时,只需在引号中指明要处理的元素对象名称即可。如果在引号中出现的是“*”,那么表示该规则适用于所有的未单独指定处理的元素节点。比如下例中的第二个模板就表示要处理除<Employee>元素之外的所有节点:
<xsl:template match=“Employee”>
output template
</xsl:template>
   
<xsl:template match=“*”>
output template
</xsl:template>
此外,XSL中还可以使用路径指示符来指定一些特殊位置的元素与模板相婚配。“//”代表任意深度位置,如<xsl:template match=“//Employee”>用来婚配文档中任何位置的<Employee>元素;而如果是<xsl:template match=“Employee//Name”>,则表明是婚配<Employee>元素的后继节点中所有<Name>元素。另外一个路径指示符是“/”,表示直接的父子节点关系。将刚才例子中的“//”换为“/”,就意味着婚配的是<Employee>元素子节点中的<Name>元素。
很显然,某些树节点在XSL中可能会对应多个模板,在这种情况下,只要最后一个对应模板会生效,前面的模板规则都会被XSL处理器忽略掉。
一、XSL模板的使用
XSL在输出模板中描述输出格式,这些格式可以是各种字符串、标签符号、节点值或者是一些XSL语法结构,如条件判断、循环处理等。在许多使用场合中,输出模板中需求使用节点的取值,此时可以依据需求使用<xsl:value-of>元素输出节点值,最直接的使用方式是<xsl:value-of />,这样可以输出当前节点及其所有后继节点的取值。而如果仅仅是想输出指定节点的取值,可以利用select属性进行限定(select属性可以是任意合法的路径表达式):
<xsl:value-of select = “Name” />
<xsl:value