日期:2014-05-17  浏览次数:20933 次

如何用正则表达式截取网页内容的问题!
比如页面内容如下:


页面开始
<!-- 从这里开始截取 -->
需要被截取出来的部分
<!-- 截取到这里 -->
页面其他部分
页面结束


如何用正则表达式 截取出 "<!-- 从这里开始截取 -->" 到 "<!-- 截取到这里 -->" 之间的内容?
(页面换行因素也得考虑进去啊)
谢谢

------解决方案--------------------
Java code
            String str="页面开始" +
                    "<!-- 从这里开始截取 -->" +
                    "需要被截取出来的部分" +
                    "<!-- 截取到这里 -->" +
                    "页面其他部分页面结束";
            Pattern p = Pattern.compile("<!-- 从这里开始截取 -->(.*?)<!-- 截取到这里 -->");
            Matcher m = p.matcher(str);
            while(m.find()){
                System.out.println(m.group(1));
            }

------解决方案--------------------
探讨

Java code
String str="页面开始" +
"<!-- 从这里开始截取 -->" +
"需要被截取出来的部分" +
"<!-- 截取到这里 -->" +
"页面其他部分页面结束";
……