日期:2014-05-17  浏览次数:20520 次

通过htmlParser抓取百度的相关内容

最近这两天我做了个最新电影网的视频网站,主要是从土豆抓取来的.所以内容页就是框架,不便于搜索的抓取。所以我就想加些相关内容,像这样的内容
????? 由于我就是通过百度搜索关键字来填充内容。下面就是我通过htmlParser抓取的代码。

public?class?BaiduResultAction?extends?BaseAction?{

????
public?static?final?Logger?logger?=?Logger
????????????.getLogger(BaiduResultAction.
class);

????
/**?*//**
?????*?组装新闻
?????*?
?????*?
@param?url
?????*?
@return
?????
*/

????
public?String?compNews(String?url)?{
????????String?returnContent?
=?null;
????????
try?{
????????????ParserModel?parserModel?
=?new?ParserModel();
????????????
//table?的抓取标签
????????????String?content?=?"border=\"0\"