日期:2014-04-25  浏览次数:20952 次

    任务上,有时会遇到系统间数据交互的问题。之前我做过的方法是,源系统将数据导出为文本文件(TXT后缀),然后上传到目标系统,分析、读取。如今好一点,使用web service,编写一个数据接口,在程序里直接调用,而无须再经过人工上传一道工序。并且web service传送的数据,全部是XML格式,可以很方便的读取,不必再本人写分析算法。当然,也由于是XML格式,每个字段值前后各一个标记,并且是明文,如果记录很多,可能需求传送的数据量就比较大了,这可能是不够好的地方。

 由于XML文件只存储数据,并无数据类型描述,因此从XML文件读入数据可能会出现数据类型与原先不符的情况。比如,有一表employee,结构如下:ID(INT),NAME(varchar(50)),在XML里表示为<EMPLOYEE><ID>1</ID><NAME>张三</NAME></EMPLOYEE>。这样,ID的类型本来为整型,而此时系统却以为是字符型!

 由于这个情况我们遇到了点问题。

 数据导入的时候,往往要加以分析,将导入的数据和现无数据比较,以确定是插入、更新还是删除。比较的算法,最简单当然是将两个数据集(DataSet)来个嵌套循环,逐条记录比较。不过这种方法效率不高,可以改进一下,将两个数据集排好序,然后再来比较。

 怎样排序呢?从XML文件里读取数据,存放在数据集dsXml里,而现无数据,存放在数据集dsCur里,每个数据集里都只要一个DataTable。可以用DataTable的Select方法来实现排序,方法如下:

//从XML文件里读取数据

DataSet dsXml = new DataSet(“dsXml”);

DsXml.ReadXml(“employee.xml”);

//从现无数据库中读取数据。GetData是自定义的函数,从现无数据库中提取数据

DataSet dsCur = GetData();

//按照id的顺序排序。

//其中Select第一个参数是过滤条件,这里为空表示所有记录都适合;第二个参数表示排序字段

DataRow[] drsXml = dsXml.Tables[0].Select(“”,”id”);

DataRow[] drsCur = dsCur.Tables[0].Select(“”,”id”);

 然后比较这两个记录集:drsXml与drsCur。

 但是运转的结果却跟原先设想大相径庭。

 什么缘由呢?

 原来就是由于在dsXml里,字段id是字符型。字符型排序不同于数值排序,如果让系统比较,”9”肯定大于”10”。因此,dsXml的排序没有得到我们预期的效果。

 看来要让系统知道id是整型。如何能做到?可以结合XML架构文件。

   dsXml.ReadXmlSchema("employee.xsd");

   dsXml.ReadXml(“employee.xml”,XmlReadMode.InferSchema);

 这样子读出来后,数据结构就跟架构文件employee.xsd里描述的如出一辙了。

 补充一点,本人对架构文件语法不熟悉,是先用从数据库中拿到的数据集dsCur输出来,然后再稍作修正:

dsCur. WriteXmlSchema(“employee.xsd”);