求一条正则表达式的写法,该怎么解决-Java教程-爱易网页

求一条正则表达式的写法,该怎么解决

日期：2014-05-20　浏览次数：20790 次

求一条正则表达式的写法

本帖最后由 u014301433 于 2014-05-05 10:06:44 编辑

<div class="RTit clearfix">
          <em>掌趣科技(300315)分红派息记录</em>
          <span class="zjTit cGray"><a href='tab_fhpxya.php?symbol=300315'>分红派息预案</a></span>
        </div>
       <table width="706" border="0" cellspacing="0" cellpadding="0" class="tab01">

这段网页源码中，我想抓取 “掌趣科技(300315)分红派息记录” 这个文本。因为<em>和</em>在整个网页源码中不是唯一的，所以需要将上下两行的<div class="RTit clearfix">和 <span class="zjTit cGray">加入到正则表达式中。这个跨行的正则该怎么写？
------解决方案--------------------

引用:

Quote: 引用:

<div class="RTit clearfix">
          <em>掌趣科技(300315)分红派息记录</em>
          <span class="zjTit cGray"><a href='tab_fhpxya.php?symbol=300315'>分红派息预案</a></span>
        </div>
       <table width="706" border="0" cellspacing="0" cellpadding="0" class="tab01">

这段网页源码中，我想抓取 “掌趣科技(300315)分红派息记录” 这个文本。因为<em>和</em>在整个网页源码中不是唯一的，所以需要将上下两行的<div class="RTit clearfix">和 <span class="zjTit cGray">加入到正则表达式中。这个跨行的正则该怎么写？

对正则表达式不是很熟悉，不过写了个示例，自己参考下吧：
示例：



import java.io.BufferedReader;

import java.io.File;

import java.io.FileInputStream;

import java.io.InputStreamReader;

import java.util.regex.Matcher;

import java.util.regex.Pattern;



public class RexTest {



	public static void main(String[] args) {

		String str = getOneHtml("E:/test.html");

		Pattern p = Pattern.compile("(?<=<div class=\"RTit clearfix\"><em>).*(?=</em><span class=\"zjTit cGray\">)");

		Matcher m = p.matcher(str);

		while (m.find())

			System.out.println(m.group());



	}



	public static String getOneHtml(String htmlFile){

        String temp;

        StringBuffer sb = new StringBuffer();

        try {

            File file = new File(htmlFile);

            BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(file), "utf-8"));

            while ((temp = in.readLine()) != null) {

                sb.append(temp.trim());

            }

            in.close();

        }catch (Exception e){

            e.printStackTrace();

        }

        return sb.toString();

    }



}



<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

<html>

<head>

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

<title>Insert title here</title>

</head>

<body>

<div class="RTit clearfix">

          <em>掌趣科技(300315)分红派息记录</em>

          <span class="zjTit cGray"><a href='tab_fhpxya.php?symbol=300315'>分红派息预案</a></span>

        </div>

       <table width="706" border="0" cellspacing="0" cellpadding="0" class="tab01">

       </table>

</body>

</html>

你的代码用截取的网页源码片断测试可以，但输入完整的URL测试不成功。
我的测试URL是：http://app.finance.ifeng.com/data/stock/tab_fhpxjl.php?symbol=300315
麻烦你帮我看下

你改下程序就可以访问网页，你用下面的方法替换：



public static String getHtmlFromURL(String htmlFile){

        URL url;

		String temp;

        StringBuffer sb = new StringBuffer();

        try {

            url = new URL(htmlFile);

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

求一条正则表达式的写法,该怎么解决

相关资料更多>

推荐阅读更多>