oracle 查寻、删除重复记录-数据库教程-爱易网页

oracle 查寻、删除重复记录

日期：2014-05-16　浏览次数：20477 次

oracle 查找、删除重复记录

假设表名为Tbl，表中有三列col1，col2，col3，其中col1，col2是主键，并且，col1，col2上加了索引。

　　1、通过创建临时表

　　可以把数据先导入到一个临时表中，然后删除原表的数据，再把数据导回原表，SQL语句如下：

　　creat table tbl_tmp (select distinct* from tbl);

　　truncate table tbl;//清空表记录

　　insert into tbl select * from tbl_tmp;//将临时表中的数据插回来。

　　这种方法可以实现需求，但是很明显，对于一个千万级记录的表，这种方法很慢，在生产系统中，这会给系统带来很大的开销，不可行。

　　2、利用rowid

　　在oracle中，每一条记录都有一个rowid，rowid在整个数据库中是唯一的，rowid确定了每条记录是oracle中的哪一个数据文件、块、行上。在重复的记录中，可能所有列的内容都相同，但rowid不会相同。SQL语句如下：

　　delete from tbl where rowid in (select a.rowid from tbl a, tbl b where a.rowid>b.rowid and a.col1=b.col1 and a.col2 = b.col2)

　　如果已经知道每条记录只有一条重复的，这个sql语句适用。但是如果每条记录的重复记录有N条，这个N是未知的，就要考虑适用下面这种方法了。

　　3、利用max或min函数

　　这里也要使用rowid，与上面不同的是结合max或min函数来实现。SQL语句如下

　　delete from tbl a where rowid not in (select max(b.rowid) from tbl b where a.col1=b.col1 and a.col2 = b.col2);//这里max使用min也可以

　　或者用下面的语句

　　delete from tbl a where rowid < (select max(b.rowid) from tbl b where a.col1=b.col1 and a.col2 = b.col2

　　4、利用group by，提高效率

　　平时工作中可能会遇到当试图对库表中的某一列或几列创建唯一索引时，系统提示 ORA-01452 ：不能创建唯一索引，发现重复记录。

　　下面总结一下几种查找和删除重复记录的方法(以表CZ为例)：

　　表CZ的结构如下：

　　SQL>?desc?cz
　　Name?Null??Type
　　-----------------------------------------?--------?------------------
　　C1?NUMBER(10)
　　C10?NUMBER(5)
　　C20?VARCHAR2(3)

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

oracle 查寻、删除重复记录

相关资料更多>

推荐阅读更多>