新手怎么从一个网站页面按一定要求抓取出自己想要的数据-Java教程-爱易网页

新手怎么从一个网站页面按一定要求抓取出自己想要的数据

日期：2014-05-20　浏览次数：21108 次

新手求助如何从一个网站页面按一定要求抓取出自己想要的数据？
比如http://www.appannie.com/top/iphone/united-states/games/这个页面，我想把FREE一栏的游戏排位上升大于30的游戏名称都抓取出来，该怎么办呢？貌似可以用jsoup，不过我找了很多例子，看不太懂。。。

------解决方案--------------------
jsoup这种连接即断开的方式很容易被认为是网络攻击，所以会报503错误，像LZ说的这个网站就不能用jsoup直接抓取，不过可以先用HttpClient将网页保存到本地，然后再用jsoup来分析

Java code


//先保存到本地硬盘
        HttpClient client = new HttpClient();
        String htmlurl = "http://www.appannie.com/top/iphone/united-states/games/";
        System.out.println(htmlurl);
        HttpMethod method = new GetMethod(htmlurl);
        try
        {
            client.executeMethod(method);
            System.out.println(method.getStatusLine());
            String html = method.getResponseBodyAsString();
            FileWriter fw = new FileWriter("C:\\download\\Top Charts - iPhone - United States - Games  App Annie.htm" );
            fw.write(html);
            fw.close();
        } catch (HttpException e)
        {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (IOException e)
        {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

新手怎么从一个网站页面按一定要求抓取出自己想要的数据

相关资料更多>

推荐阅读更多>

新手 怎么从一个网站页面按一定要求抓取出自己想要的数据

相关资料更多>

推荐阅读更多>

新手怎么从一个网站页面按一定要求抓取出自己想要的数据