日期:2014-05-16  浏览次数:20454 次

对大表中数据去重的一种方法

?

为了情节重现,先创建一个表为test01 ,很简单的两列。

?

create table shenwei.test01
(
A               VARCHAR2(20)
B               VARCHAR2(20)
);

?

我们往里插入几条数据

SQL> select * from shenwei.test01
  2  ;
 
A                    B
-------------------- --------------------
1                    A
2                    B
3                    C
4                    D
5                    F
3                    C
2                    B
 
7 rows selected
?

限制这张表就类比大表,现在要想要里面重复的数据删除,(当然,如果是小表,我们可以直接delete)但是如果是大表就很慢了,

所以新建一张表,把数据筛选出来后,插入表中

?

create table SHENWEI.TEST021 nologging as
select A, B
  from (select A,
               B,
               row_number() over(partition by A, B order by B desc) rn
          from SHENWEI.TEST01)
 where rn = 1

?

然后创建索引,收集新表统计信息,确保SELECT查询采用正确高效率的执行计划。

如果没有问题就把表修改成log模式

?

alter table shenwei.test01 logging;

最后把表rename,搞定

?

alter table shenwei.test02 rename to shenwei.test01;
?

?