日期:2014-05-17  浏览次数:20888 次

将网页源代码转换为xml
我现在需要将网页的源代码转换为xml,可是网页中有img这种不是成对出现的标签,所以我想请教大家如何处理呢。
我的思路是for循环查找然后在img标签后面添加一个</img>使其闭合,可是问题来了,因为html不小所以循环的话非常吗,所以请问大家有其他的办法吗?

------解决方案--------------------
探讨
引用:

引用:

引用:

<img />
最后有个斜杠也就闭合了啊
在xml里面除非标签没有附加的属性,不然是没法这样简写的。img标签里面有title,border等属性,所以必须要有对应的标签闭合

有属性也一样
<add name="Northwind_LGLYBConnectionString" connection……