日期:2014-05-16  浏览次数:20853 次

这样的一个SQL需求你们遇到过吗?
本帖最后由 strive_bo 于 2012-09-04 14:52:31 编辑
今天要实现一个功能,查询一个表字段中相近的词,没有指定需要查询的词,比如有一张表中有个字段中有111,222,2,333,1那么就需要查询出111,1,222,2这4列,因为333没有相近的词所以不能查询出来。
like 跟 instr 还有正则都需要匹配具体的条件,而这个不存在指定的条件。想利用sql语句来解决,希望高手给点意见。

建表语句如下:


              
CREATE TABLE  test_col (col_name VARCHAR2(100));
              

INSERT INTO TEST_COL (COL_NAME) VALUES ('爱特优科新信息技术(北京)有限公司');

INSERT INTO TEST_COL (COL_NAME) VALUES ('爱特优科信息技术(北京)有限公司');

INSERT INTO TEST_COL (COL_NAME) VALUES ('安那络器件(中国)有限公司');

INSERT INTO TEST_COL (COL_NAME) VALUES ('安那络器件(中国)有限公司');

INSERT INTO TEST_COL (COL_NAME) VALUES ('百润时代网络技术(北京)有限公司');

INSERT INTO TEST_COL (COL_NAME) VALUES ('百润时代网络技术有限公司');

INSERT INTO TEST_COL (COL_NAME) VALUES ('北京艾克赛利科技有限公司');

INSERT INTO TEST_COL (COL_NAME) VALUES ('北京艾克赛利微电子技术有限公司');

INSERT INTO TEST_COL (COL_NAME) VALUES ('百度集团');

INSERT INTO TEST_COL (COL_NAME) VALUES ('新浪集团');

我要实现的结果如下:


1 爱特优科新信息技术(北京)有限公司
2 爱特优科信息技术(北京)有限公司
3 安那络器件(中国)有限公司
4 安那络器件(中国)有限公司
5 百润时代网络技术(北京)有限公司
6 百润时代网络技术有限公司
7 北京艾克赛利科技有限公司
8 北京艾克赛利微电子技术有限公司

最好是挨着的,把相近的显示查询出来




------解决方案--------------------


SQL> select * from test_col;

COL_NAME
--------------------------------------------
1
2
22
33
1
中国
日本
米国
韓国

9 rows selected

SELECT n.col_name
  FROM (SELECT m.col_name,
               m.keyword,
               COUNT(*) OVER(PARTITION BY m.rid, m.keyword) cnt1,
               COUNT(*) OVER(PARTITION BY m.keyword) cnt2
          FROM (SELECT t1.ROWID rid,
                       t1.col_name,
                       SUBSTR(t1.col_name, t2.rn, 1) keyword
                  FROM test_col t1,
                       (SELECT ROWNUM rn,
                               max_len
                          FROM (SELECT MAX(LENGTH(col_name)) max_len
          &nb