日期:2014-05-18  浏览次数:20711 次

上机面试题,帮忙看下
登陆一个网站获取它里面的所有广告的信息,麻烦大家跟我细讲一小,代码具体怎么写啊
面试题

------解决方案--------------------
获取他的广告的接口
------解决方案--------------------
为什么还要登录?
直接解析标记不可以吗
------解决方案--------------------
首先登陆我不知道怎么解决。现在登陆都是有验证码的,验证码识别我不知道怎么搞。如果没有的话直接生成一条url请求就解决了。
至于获取广告,下面是我写好的一个工具类,直接获取页面所有代码,然后根据广告标记用正则提取就行了。。
以前我从网站上爬图片就是这么干的
// 获得html模板
public static String getHtml(String urlpath) {
StringBuffer sb = new StringBuffer();
try {
URL url = new URL(urlpath);
BufferedReader br = new BufferedReader(new InputStreamReader(
url.openStream()));
String s = null;
while ((s = br.readLine()) != null) {
sb.append(s);
}
br.close();
} catch (Exception e) {
e.printStackTrace();
}
return sb.toString();
}