日期:2013-10-06  浏览次数:20483 次


面向集合的结构化设计。这一点很多人都知道,可真正能够活用的就太少了。举一个简单的例子:
例1-3:有一个简单的数据表Orders,存储某商店的订单信息:
CREATE TABLE [dbo].[ORDERS] (
[ID] [int] IDENTITY (1, 1) NOT NULL ,
[CustomerID] [int] NOT NULL ,
[OrderDate] [datetime] NOT NULL
) ON [PRIMARY]
GO
CREATE CLUSTERED INDEX [CU_INX_OrderDate] ON [dbo].[ORDERS]([OrderDate]) WITH FILLFACTOR = 50 ON [PRIMARY]
GO
ALTER TABLE [dbo].[ORDERS] WITH NOCHECK ADD
CONSTRAINT [PK_ORDERS] PRIMARY KEY NONCLUSTERED([ID])
ON [PRIMARY]
GO
表中如今有以下数据:
ID CustomerID OrderDate
----------- ----------- ------------------------------------------------------
1 1 1999-1-4
2 10 1999-3-5
3 22 1999-5-2
4 2 1999-6-7
5 2 2000-3-6
7 101 2001-5-3
8 10 2001-6-5
6 101 2002-4-2
那么,我们如何生成一个1999-2002的年度订单数报表呢(四年只要8个订单?我为了演示方便才这样做的,这并不代表真实的情况:P)?如今,我给出实际报表的数据格式,读者们请先试一下这个语句的写法
CustomerID 1999 2000 2001 2002
-------------- ------ ------ ------ ------
1 1 0 0 0
2 1 1 0 0
10 1 0 1 0
22 1 0 0 0
101 0 0 1 1
最直观的想法,是在前台,用其它言语实现这一功用。不过有一个办法,可以用SQL言语来实现它。而且不一定比你想像的更复杂:
SELECT CustomerID,
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 1999 THEN 1 ELSE 0 END) AS "1999",
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 2000 THEN 1 ELSE 0 END) AS "2000",
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 2001 THEN 1 ELSE 0 END) AS "2001",
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 2002 THEN 1 ELSE 0 END) AS "2002"
FROM ORDERS
GROUP BY CustomerID
我想这时会有朋友提出InterBase不支持Case的问题。不过即便如此,我还是要向大家推荐这种写法。由于它优美、简约,不只我们读着好懂,还可以很方便地写出程序来自动生成它。理想上,Case关键字已是SQL标准之一,大势所趋,会有越来越多的数据库系统支持它的。
那么它又是怎样来的呢?我在设计这个语句时是这样的思路:
1、我们需求一个同时在时间和客户两个坐标轴上展开的报表;
2、纵向上,我们要为每一位客户建立一行数据,这个比较好办,我们首先确定了这个语句会有一个基本框架
SELECT CustomerID,
………………
FROM ORDERS
GROUP BY CustomerID
如果不区分年度,已下语句就是我们要的结果
SELECT CustomerID,
COUNT(ID) AS ORDERS_COUNT,
FROM ORDERS
GROUP BY CustomerID
3、设所有订单为一全集,那么这个集合的总数用以下语句来统计:
SELECT COUNT(ID) FROM ORDERS
横向上,我们为每一年度的订单数定义一列,以1999年为例,取年份为1999年的订单子集的元素数为
SELECT SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 1999 THEN 1 ELSE 0 END) AS "1999"
FROM ORDERS
其它年份依此类推,我们得到每一年的订单数:
SELECT SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 1999 THEN 1 ELSE 0 END) AS "1999",
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 2000 THEN 1 ELSE 0 END) AS "2000",
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 2001 THEN 1 ELSE 0 END) AS "2001",
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 2002 THEN 1 ELSE 0 END) AS "2002"
FROM ORDERS
其前往结果如下:
1999 2000 2001 2002
----------- ----------- ----------- -----------
4 1 2 1

 

(所影响的行数为 1 行)
4、顾及到关系型数据库“诡异”的NULL值问题后,综合2、3步,我们得出最终的语句:
SELECT CustomerID,
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 1999 THEN 1 ELSE 0 END) AS "1999",
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 2000 THEN 1 ELSE 0 END) AS "2000",
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 2001 THEN 1 ELSE 0 END) AS "2001",
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 2002 THEN 1 ELSE 0 END) AS "2002"
FROM ORDERS
GROUP BY CustomerID
如今这个报表结构清晰明白。扩展性极强。比如明年我们需求2003年的统计数据,只需再依葫芦画瓢,来一列
SUM(CASE WHEN YEAR(isnull(OrderDate, 0)) = 2003 THEN 1 ELSE 0 END) AS "2003"
加在最后就可以了,它是全集中的2003年数据的子集。还有,用来判断空值的isnull函数不一定所有的数据库都有,没关系,只需在Case的分支里加一行
WHEN OrderDate is NULL THEN 0
就可以了。基于这个思想,我们可以很容易地写出一个存储过程,只需给定起讫年份,就可以生成一个完整的年度报表。由于所有的运算都在服务器端运转,并且是随着数据检索一次就完成了。它的速度快于客户端的报表。而且传输的数据量也少,可以无效减轻网络负载。
在《SQL Server6.5技术内幕》中,有一个类似的例子。不过作者使用的语句结构比我的复杂,他的例子中,From关键字是从一个子查询导出表中选择的数据,这让我百思不得其解。也许6.5版的MS SQL Server还不支持我的写法,也许那样写功用更好。作者并没有说明,我也不断没无机会接触到MS SQL Server6.5。
对于InterBase,我还没有办法用足够优雅的语句生成这个报表。这次要是由于InterBase不支持Case。不过,如果你对语句的功用和美感要求不高的话,下面这个语句可以实现与以上的SQL Server版本相反的功用:
SELECT O.CUSTOMERID,
(SELECT COUNT(I.ID)
FROM ORDERS I
WHERE (I.CUSTOMERID = O.CUSTOMERID)
AND (EXTRACT(YEAR FROM I.ORDERDATE) = 1999))
as COUNT_1999,
(SELECT COUNT(I.ID)
FROM