正则表达式提取两个点号之间的文本解决办法-Java教程-爱易网页

正则表达式提取两个点号之间的文本解决办法

日期：2014-05-20　浏览次数：21482 次

正则表达式提取两个点号之间的文本
如何构造正则，抽取两个“.”号之间的内容？
原文件格式如下：
1..test.major information.http://www.abcdefg.com.2012
2...http://www.abcdefg.com/index.html.2011
3.Mike, G..this is for test.2012
4.Bob, E. J..make a mark.2010，15(2)：60-71
……

每一行我想要的数据是两个“.”号之间的
如：
第一行：""，test，major information，http://www.abcdefg.com，2012
第二行：""，""，http://www.abcdefg.com/index.html，2011
第三行：Mike, G.，this is for test，2012
第四行：Bob, E. J.，make a mark，2012

Note:
1、点号可能有三种含义，①表示内容的分割符，②外国名字的缩写，③URL的组成
2、表示分割符时，如果两个点号之间没有内容，表明需要截取出的是空串""

如何构造相应的正则表达式进行匹配？

------解决方案--------------------
这个用正则来做不是很完美，因为每个[.]代表的意义不一样，没法区分，所以最好是先按每种意义把[.]转成其它字符，再分割，再把字符转成[.]
这里给出一段不是很完美的正则做法

Java code

String[] sa = { //测试字符串
    "..test.major information.http://www.abcdefg.com.2012",
    "...http://www.abcdefg.com/index.html.2011",
    ".Mike, G..this is for test.2012",
    ".Bob, E. J..make a mark.2010，15(2)：60-71"
};
for (String s : sa) {
    //把URL以外的[.]转成[|]，再把名字缩写的[|]转成[.]，再按[|]分割
    String[] ss = s.replaceAll("(?<!www)[.](?!(html|com))", "|").replaceAll("(?<=[A-Z])[|]", ".").split("[|]"); 
    System.out.println(Arrays.toString(ss));
}

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

dispaly tag在struts中翻页和排序的有关问题

关于Microsoft SQL Server 2000 Driver for JDBC 的有关问题

更新数据库有关问题(急可以加分)

javaBean运行环境解决方法

java关闭窗口的疑惑,该如何解决

高手们来看看：一个画小球简单程序的N多疑问<先县尝70分，全部解答出来者再补100分>解决方案

int m= Integer.parseInt(str.charAt(i))？解决办法

基于ssh，关于用户消费如何实现（就是每进入一次消费一个金币）

JSP程序怎么采集网站下所有页面的标题,特急立即加分

正则表达式提取两个点号之间的文本解决办法

相关资料更多>

推荐阅读更多>