日期:2014-05-20  浏览次数:20785 次

求教一个相近字符串的问题。。没有分在技术区发了。。
比如在一堆字符串里,想找出一个和主字符(比如:farmerama)串相近的
候选的有:
farmearma(差一个字母)
farmersma(差一个字母)
farmeramaa(多一个字母)
farmrama(少一个字母)
(上面的都算对的,)
(下面的都是不对:)
aaaaerama(前四个都不对)
farmeraabb(后面四个都不对)
ooxxooxx(根本就没什么关系)
123123123123123123(根本就没什么关系)
eramafarm(顺序颠倒太多。不考虑)
然后通过程序,把前面的四个找出来,下面的过滤掉就可以了

没有分在技术区发了。。

可以做到吗?

------解决方案--------------------
汗,你只剩下 10 分了啊,晕

送给你 2000 分,请查收,你能收到 1800 分(CSDN 要扣 10% 的税)。


------解决方案--------------------
实在太主观化了,四个不对就不对了?
------解决方案--------------------
主字符(比如:farmerama)
farmearma(差一个字母)

为啥是差一个字母啊?我咋感觉是差两个字母?
farmerama
farmearma

如果你说置换可以算一个的话,那么:
farmearma
aarmearmf
是否也算只差一个字母?
------解决方案--------------------
相似度算法,你可以参考下。
Java code

public class SimilarityUtil {
    private static int min(int one, int two, int three) {
        int min = one;
        if(two < min) {
            min = two;
        }
        if(three < min) {
            min = three;
        }
        return min;
    }
    
    public static int ld(String str1, String str2) {
        int d[][]; //矩阵
        int n = str1.length();
        int m = str2.length();
        int i; //遍历str1的
        int j; //遍历str2的
        char ch1; //str1的
        char ch2; //str2的
        int temp; //记录相同字符,在某个矩阵位置值的增量,不是0就是1
        if(n == 0) {
            return m;
        }
        if(m == 0) {
            return n;
        }
        d = new int[n+1][m+1];
        for(i=0; i<=n; i++){//初始化第一列
            d[i][0] = i;
        }
        for(j=0; j<=m; j++){//初始化第一行
            d[0][j] = j;
        }
        for(i=1; i<=n; i++) { //遍历str1
            ch1 = str1.charAt(i-1);
            //去匹配str2
            for(j=1; j<=m; j++) {
                ch2 = str2.charAt(j-1);
                if(ch1 == ch2) {
                    temp = 0;
                } else {
                    temp = 1;
                }
                //左边+1,上边+1, 左上角+temp取最小
                d[i][j] = min(d[i-1][j]+1, d[i][j-1]+1, d[i-1][j-1]+temp);
            }
        }
        return d[n][m];
    }
    
    public static double sim(String str1, String str2) {
        int ld = ld(str1, str2);
        return 1 - (double) ld / Math.max(str1.length(), str2.length());
    }

    public static void main(String[] args) {
    
        String str1 = "farmerama";
        String str2 = "aaaaerama";
        System.out.println("ld="+ld(str1, str2));
        System.out.println("sim="+sim(str1, str2));
    }
}

------解决方案--------------------
 
每天回帖即可获得10分可用分!