今天继续讨论SELECT TOP N问题. 1. DB2的M 2 在前一篇讨论中提到,由于DB2的SUBQUERY不支持ORDER BY子句,因此无法结构M2. 实际上,DB2提供了一组新的函数,称为 OLAP FUNCTIONS, 可以很好的支持TOP N问题. M2: SELECT * FROM ( SELECT MYKEY,RANK() OVER (ORDER BY ORD_COL DESC) AS MYRANK FROM MYTABLE ) AS RANKED_TABLE WHERE MYRANK<=N
利用OLAP函数,除了上一篇中所提方法,DB2的M1又可以表示为: SELECT * FROM ( SELECT MYKEY,ROW_NUMBER() OVER (ORDER BY ORD_COL DESC) AS MYRANK FROM MYTABLE ) AS RANKED_TABLE WHERE MYRANK<=N
2. 除了M1, M2两种TOP N外,还有一种被DB2称为 DENSE_RANK, (M3). 通过下例分别说明. M1: TOP 3 -- 1(4,101), 2(5,101), 3(1, 100) 或者1(4,101), 2(5,101), 3(2, 100) M2: TOP 3 -- 1(4,101), 1(5,101), 3(1, 100), 3(2, 100) M3: TOP 3 -- 1(4,101), 1(5,101), 2(1, 100), 2(2, 100), 3(3,99) 在DB2中, M3如此实现: SELECT * FROM ( SELECT MYKEY,DENSE_RANK() OVER (ORDER BY ORD_COL DESC) AS MYRANK FROM MYTABLE ) AS RANKED_TABLE WHERE MYRANK<=N
3. 为避免DBMSs的方言问题, M2,M3可以有如下标准(SQL 92)表示: M2: SELECT * FROM MYTABLE M1 WHERE N> ( SELECT COUNT(*) FROM MYTABLE M2 WHERE M2.ORD_COL>M1.ORD_COL); 留意: 两个比较符都是 > M3: SELECT * FROM MYTABLE M1 WHERE N> ( SELECT COUNT(DISTINCT M2.ORD_COL) FROM MYTABLE M2 WHERE M2.ORD_COL>M1.ORD_COL); 留意: 与M2的不同在于DISTINCT的使用 至于M1, 我目前还没有想到合适的标准写法,请补充.
4. 关于MYSQL 绝对于各主流RDBMS来说,MYSQL要简单,老练地多. 在运转MYSQL时发现竟然不支持SUBQUERY. 因此MYSQL中的TOP N问题要复杂一些. SELECT * FROM MYTABLE, MYTABLE M2 WHERE M2.ORD_COL>=M1.ORD_COL GROUP BY M1.MYKEY HAVING COUNT(M2.ORD_COL) <=N 但是,这个语句是有问题的. 一个极端的例子: 当所有的ORD_COL的数值都一样时. 如果哪位想到了如何处理这个问题,请补充.
---------------------------------------------------------------------------------- 各语句曾经测试过, EXAMPLE: create table mytable(mykey int, ord_col int); insert into mytable values(1, 100); insert into mytable values(2, 100); insert into mytable values(3, 99); insert into mytable values(4, 101); insert into mytable values(5, 101);