!!!!!求一解析html代码,望各位高手帮帮忙,分马上结~~(北京的请吃饭 ~哈)
就一个现成的中华英才 HTML的简历,怎么把它解析出来(个项基本信息),用SGMLReader就算了,呵呵 求代码.... (各位高手别嫌麻烦,北京请客哈~~) 谢谢各位了~~
------解决方案--------------------占个沙发先~
------解决方案--------------------一个个找就好了。
如姓名:
当然前提是已经读取到了html的源码。
string yuanma;
string name = yuanma.Substring(IndexOf( "姓名 "), 10);
然后再慢慢分析,取值,就可以了啊。
------解决方案--------------------参考
http://topic.csdn.net/t/20061212/20/5225944.html
另一种方法就是用正则来解析,不过要求所要提取的内容符合一定的规律
------解决方案--------------------哪吃?哈
------解决方案--------------------你在中华英才干?
------解决方案--------------------那总得有个规律吧,没有规律如何提取
每个简历都用不同的模板,那是没办法写出一个通用方法来解析的
------解决方案--------------------看人家用正则取过一次!!
RegEx.replace(string, " <.*> ", ", ")
然后用substring把他解析出来。有点麻烦,而且一定要是纯html代码!
------解决方案--------------------找找那些布局,没有table肯定还有其他的Div
------解决方案--------------------同意找规律,不可能没规律
------解决方案--------------------模板固定,那就用正则,给出实例,说下要提取的内容,要详细说明
------解决方案--------------------用正则。
------解决方案--------------------............不懂
------解决方案--------------------用正则表达式。