日期:2014-05-18  浏览次数:20397 次

!!!!!求一解析html代码,望各位高手帮帮忙,分马上结~~(北京的请吃饭 ~哈)
就一个现成的中华英才   HTML的简历,怎么把它解析出来(个项基本信息),用SGMLReader就算了,呵呵     求代码....   (各位高手别嫌麻烦,北京请客哈~~)     谢谢各位了~~

------解决方案--------------------
占个沙发先~
------解决方案--------------------
一个个找就好了。
如姓名:
当然前提是已经读取到了html的源码。
string yuanma;
string name = yuanma.Substring(IndexOf( "姓名 "), 10);
然后再慢慢分析,取值,就可以了啊。
------解决方案--------------------
参考

http://topic.csdn.net/t/20061212/20/5225944.html


另一种方法就是用正则来解析,不过要求所要提取的内容符合一定的规律
------解决方案--------------------
哪吃?哈
------解决方案--------------------
你在中华英才干?
------解决方案--------------------
那总得有个规律吧,没有规律如何提取

每个简历都用不同的模板,那是没办法写出一个通用方法来解析的
------解决方案--------------------
看人家用正则取过一次!!
RegEx.replace(string, " <.*> ", ", ")
然后用substring把他解析出来。有点麻烦,而且一定要是纯html代码!

------解决方案--------------------
找找那些布局,没有table肯定还有其他的Div
------解决方案--------------------
同意找规律,不可能没规律
------解决方案--------------------
模板固定,那就用正则,给出实例,说下要提取的内容,要详细说明
------解决方案--------------------
用正则。

------解决方案--------------------
............不懂
------解决方案--------------------
用正则表达式。