日期:2014-05-17  浏览次数:21080 次

求正则表达式提取XML代码中所需要的信息方法
(在线等)我需要抓取网页中的数据,但是网页源文件是XML格式,我解析到网页源文件后怎么提取我所需要的信息?(C#写要提取的就是网页上的文字)

网页源文件是:
网页解析 C#

------解决方案--------------------
不该用正则的,应该用XMLDocument读入,遍历各节点,取出TEXT即可。
------解决方案--------------------

            //在窗体上加入dataset控件,name修改为dsXML
        String H_sender; 
        String H_receiver ; 
        String H_name ; 
        String H_time ; 
        String H_event ;   

        dsXML.ReadXml("test.xml");
        H_sender = dsXML.Tables["Header"].Rows[0]["Sender"].ToString();
        H_receiver = dsXML.Tables["Header"].Rows[0]["Receiver"].ToString();
        H_name = dsXML.Tables["Header"].Rows[0]["ServiceName"].ToString();
        H_time = dsXML.Tables["Header"].Rows[0]["TimeStamp"].ToString();
        H_event = dsXML.Tables["Header"].Rows[0]["EventId"].ToString();[code=text]

 text.xml
<xml version="1.0" encoding="UTF-8">
<Header>
    <Sender>MES</Sender>
    <Receiver>JK</Receiver>
    <ServiceName>MESSendBOM</ServiceName>
    <TimeStamp>2013-06-24 12:00:00</TimeStamp>
    <EventId>550E8400-E29B-11D4-A716-446655440000</EventId>
</Header>
</xml>