日期:2014-05-18  浏览次数:20719 次

用java如何获取别人网页上的信息??
现在我要做这样一件事:编写一个程序,希望通过我的程序能从其他人的网站上面提取有用的信息。
      比如现在有一个彩票网站,公布20选5的结果,而我希望通过我写的程序可以直接从彩票的网站上获取20选5的数据,而且要及时更新
      以我目前的水平,用java没一点头绪,希望大家可以提供一些思路,方法。在此先谢谢各位!!

------解决方案--------------------
public static String sendGet(String url, String param) {
String result = " ";
String urlName = " ";
try {
urlName = url + param;
URL U = new URL(urlName);
URLConnection connection = U.openConnection();
connection.connect();

BufferedReader in = new BufferedReader(new InputStreamReader(
connection.getInputStream()));
String line;
while ((line = in.readLine()) != null) {
result += line;
}
in.close();
} catch (Exception e) {
System.out.println();
System.out.println( "与服务器连接发生异常错误 : " + e.toString());
System.out.println( "连接地址是 : "+urlName);
}
return result;
}
------解决方案--------------------
<%@ page language= "java " pageEncoding= "UTF-8 "%>
<%@ page import= "java.io.*,java.net.URL "%>
<%
URL url = new URL( "http://www.itpub.net ");//建立URL对象,并实例化为url,获得要抓取的网页地址
BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream(), "GB2312 "));//建立BufferedReader对象,并实例化为reader,这里的GB2312是要抓取的网页编码格式
while(reader.ready())
{
out.println(reader.readLine());
}
reader.close();
%>

URL url = new URL( "http://www.itpub.net ");//http://www.itpub.net就是你想抓的网页地址
reader 对象就是读取到该网页的内容,下面是循环输出,你可以进行过滤找到你需要的内容,

小偷程序其实就是远程读取文件

out.println(reader.readLine());
这时你看到的网页内容实际上已经是你本机的代码了,而不是itpub上的主页了,图片显示不出来就是这个原因,现在就好办了,它的代码你都得到了,那么你想要什么东东就可以把它找出来了