日期:2014-03-24  浏览次数:21047 次

  差不多每天都有人问“什么是 XML”,“XML 能做什么”,“XML 能不能替我做这个”, “XML 会取代什么” 等等诸如此类的问题。由于最近一段时间稍微对 xml 使用了一下,  我来谈谈本人的感觉。这些经验都很浅显,任何一个用过 xml 的人都有,并且见仁见智, 只不过我算刚刚走过这段路,对本人一开始的困惑,误解还记得清,所以拿出来和大家分享一下。

  我觉得初学者可能会走近的误区:

  1. XML 是不是 HTML 的取代者?

  不是。写得好的 html 应该是一个 well-formed 的 xml 文档,其他方面最好不要把他们放在一个水平线上比较。

  2. XML 是不是数据库的取代者?

  不是。

  3. XML 是不是...的取代者?

  都不是。

  这个结论可能听上去很滑稽:XML 是非常非常重要的东西,但它什么都取代不了。

  但这并不奇怪,有人把它比做 ASCII 标准,他们是一切一切的基础,但并没有(也不需求)取代什么。(但是就好像 ASCII 取代了一些没有成大器的字符集定义,XML 也会取代你在使用中本人定义的一些数据传输规范,但没有什么特别主流的东西。)

  刚开始学 XML (或者说没开始学之前)的时候最爱问的一个问题肯定是:使用 XML 能给我带来什么好处?

  我觉得从某种角度上说,使用 XML 有些象使用 OO 面向对象:

    - 你可以用它,你也可以不用它。
    - 如果你的使用非常简单,用它不一定方便,没准儿用了效果还会更差。
    - 和其他实际东西比如数据库,MTS,Web Server比起来,它更像是一个概念,一种方法
    - 项目越大,它的发挥余地越大,作用越大。
    - 一旦真正理解后,哪怕不用 xml parser,也不妨碍你使用这个概念,好像可以抛开特定言语使用 OO。
    - ......

    好像更笼统,更没谱儿了吧。

  那就随便举个例子。比如你本来想在 bbs 使用中的两个模块之间传一些数据:

    - 发言人
    - 密码
    - 标题
    - 内容

    使用四个参数是不太理想的,由于你随时可能要扩展功用,比如再加上个

    - 表情符号

    等等

    不可能每次加个功用,就重新定义一遍函数。

    所以最简单的方法是把他们合并起来作为一个参数传递给函数。

    在有 xml 之前,你可能会使用分隔符:

    str = "发言人=张三;密码=**;标题=abc;内容=xyz"

    到 server 那边使用 dictionary 或 collection 或 split 等等方法把他们拆开。

    (当然可以本人定义对象啦,结构啦等等,但多数情况下还得是纯字符串--比如另一个模块不是本人开发的。)

    这种传递字符串的方法有几个问题,总结成两个最大的方面就是:

    1. 正确的解析它很麻烦。(比如标题正好是“发言人=张三;”怎样办)
    2. 是平面的,没有层次型结构

    你可以写些函数来处理这些问题,比如确保里面肯定有“发言人”,“密码”等等;

    再写些函数做一下字符本义,再写些函数制造出层次性的效果...

    够了!咱还是用 XML 吧。在我目前浅显的认识里:

    - XML 是用来传递数据的
    - XML 让这些数据有了结构 -- 一个树型结构
    - xml 有全套的操作这种结构的方法
    - xml 规范(或者说的实际点,xml parser)帮你确定你创建的字符串是合法的
    - xml 规范(或者说的实际点,xml parser)中有办法验证这个合法性
    - 对于拿到这个字符串的 server component 来说,可以用 xml 中现成的方法来操作它,这就是 xpath, pattern,类似于 T-SQL 语句。(但记住 xml 是树型结构的)
    - XSLT 使用 xpath 对 xml 进行转换(类似于 DTS),其中一种特例是把 XML 转换成 HTML 输出。