新浪微博页面源代码 解析
如题,我想解析新浪微博页面源代码,即html文件。但是源代码里面关于微博内容部分不是用html写的,比如类似<script>FM.view({"pid":"pl_content_hometip","js":[],"css":[],"html":""})</script>。
但是我想用htmlparser来解析html内容。
所以是否有现成的方法来解决这个问题?谢谢
------解决方案--------------------http:///www.cnblogs.com/xwsk/archive/2011/11/14/2248857.html
http://www.cnblogs.com/idealing/archive/2013/05/25/3098409.html
http://www.cnblogs.com/nevergiveupblog/archive/2011/06/23/2088139.html
------解决方案--------------------读取源文件 然后用正则表达式去解析吧。