distinct跟group by 去掉重复数据分析-数据库教程-爱易网页

日期：2014-05-16　浏览次数：20458 次

distinct和group by 去掉重复数据分析

用distinct关键字只能过滤查询字段中所有记录相同的（记录集相同），而如果要指定一个字段却没有效果，另外distinct关键字会排序。?

select distinct name from t1 能消除重复记录，但只能取一个字段，现在要同时取id,name这2个字段的值。?

select distinct id,name from t1 可以取多个字段，但只能消除这2个字段值全部相同的记录?

所以用distinct达不到想要的效果，用group by 可以解决这个问题。?

例如要显示的字段为A、B、C三个，而A字段的内容不能重复可以用下面的语句：?

select A, min(B),min(C),count(*) from [table] where [条件] group by A?

having [条件] order by A desc?

为了显示标题头好看点可以把select A, min(B),min(C),count(*) 换称select A as A, min(B) as B,min(C) as C,count(*) as 重复次数?

显示出来的字段和排序字段都要包括在group by 中?

但显示出来的字段包有min,max,count,avg,sum等聚合函数时可以不在group by 中?

如上句的min(B),min(C),count(*)?

一般条件写在where 后面?

有聚合函数的条件写在having 后面?

如果在上句中having加 count(*)>1 就可以查出记录A的重复次数大于1的记录?

如果在上句中having加 count(*)>2 就可以查出记录A的重复次数大于2的记录?

如果在上句中having加 count(*)>=1 就可以查出所有的记录，但重复的只显示一条，并且后面有显示重复的次数----这就是所需要的结果，而且语句可以通过hibernate?

下面语句可以查询出那些数据是重复的：?

select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1?

将上面的>号改为=号就可以查询出没有重复的数据了。?

PS：关于group by和distinct到底哪个性能好，我还是不敢太赞同网上的一些说法，自己测试才是王道。

未完，待续。。。

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。