日期:2014-05-16 浏览次数:20421 次
1):Oracle的row_number() over函数消除重复的记录
例子:
1.select d.id,d.outer_code from dict_depts_source d order by outer_code(查看重复数据)
2.select d.id,d.outer_code,row_number() over(partition by outer_code order by outer_code) row_flag from dict_depts_source d(标识重复数据)
3.delete from dict_depts_source where id in(
select id from(select d.id,d.outer_code,row_number() over(partition by outer_code order by outer_code) row_flag from dict_depts_source d)t
where t.row_flag > 1)(删除重复数据)
3.select d.id,d.outer_code,row_number() over(partition by outer_code order by outer_code) row_flag from dict_depts_source d(检查删除效果)
?row_number() over ([partition by col1] order by col2) ) as 别名
表示根据col1分组,在分组内部根据 col2排序
而这个“别名”的值就表示每组内部排序后的顺序编号(组内连续的唯一的),[partition by col1] 可省略。
2)
下面先来看看例子:
table表
字段1 字段2
id name
1 a
2 b
3 c
4 c
5 b
库结构大概这样,这只是一个简单的例子,实际情况会复杂得多。
比如我想用一条语句查询得到name不重复的所有数据,那就必须使用distinct去掉多余的重复记录。
select distinct name from table
得到的结果是:
?
----------
name
a
b
c
好像达到效果了,可是,我想要得到的是id值呢?改一下查询语句吧:
select distinct name, id from table
?结果会是:
----------
id name
1 a
2 b
3 c
4 c
5 b
distinct怎么没起作用?作用是起了的,不过他同时作用了两个字段,也就是必须得id与name都相同的才会被排除。。。。。。。
我们再改改查询语句:
select id, distinct name from table
?
很遗憾,除了错误信息你什么也得不到,distinct必须放在开头。难到不能把distinct放到where条件里?能,照样报错。
------------------------------------------------------------------------
下面方法可行:
select *, count(distinct name) from table group by name
?结果:
id name count(distinct name)
1 a 1
2 b 1
3 c 1
最后一项是多余的,不用管就行了,目的达到。。。。。
group by 必须放在 order by 和 limit之前,不然会报错
?
?项目中实际用到的? 例如从重复记录里面只取一条记录
1.SELECT PACTGOODID,PACTID,ORDERCODE,ORDERID,GOODNAME,ROW_NUMBER() OVER(PARTITION BY PACTID ORDER BY PACTID) ROW_FLAG FROM ENTRUST_PACT_GOODS
2.SELECT * FROM (SELECT PACTGOODID,PACTID,ORDERCODE,ORDERID,GOODNAME,ROW_NUMBER() OVER(PARTITION BY PACTID ORDER BY PACTID) ROW_FLAG FROM ENTRUST_PACT_GOODS GOODS) WHERE ROW_FLAG = 1
??