日期:2013-10-12  浏览次数:20460 次


树状结构的存储与管理,是每一个在关系型数据库平台上任务的程序员早晚都要遇到的问题。说大不大,怎样都能处理,说小不小,处理不好,有的是麻烦等着你。仁者见仁,智者见智,公说私有理,婆说婆有理(谁用机箱砸我?机箱是个好东西,乱丢会摔坏硬盘的,你看我话没说完你又把显示器丢了……),咳咳,好吧,闲话少说,我们从最大路的处理风格谈一谈吧。这里面的大部分内容并非我的独创,从很久很久以前,数据库程序员们就这样做啦。

树状表的结构化表达

    在一切开始前,我们先就树状表的表示方式达成一个共识。在关系型数据库中,我们当然没有办法这样直接表示一个树:

a

b  c

d e f g

    相应的,我们会把它变形为平面表,这种变形让我想起拓扑几何:

r      n1    n2

a      b     d

a      b     e

a      c     f

a      c     g

存储结构

稍有经验的朋友,大概都不会试着把树状结构一层一列的存进去了吧。这样做的问题是不言而喻的:与表中存储的信息结构不同,表的结构应该是绝对固定的,不能随便改动。而对于层数不能固定的普通树状结构,这是不可思议的。没有必要讨论过多的错误,我们选择一个绝对正确的方式――把树状结构笼统成适合关系数据库的方式。

只考虑某一个节点的话,和这个节点相关的信息是:它的独一标识、父节点、子节点、数据信息。这其中只要子节点的数目不定。不过如果每一个节点都确定了本人的父节点,显然可以省略子节点。这样一来,一个节点需求存储三部分信息――它的独一标识、父节点、数据信息。一个理想的TreeView表只需求三个节点就可以了,用SQL语句来表达就是

CREATE TABLE [dbo].[TreeView] (

       [ID] [char] (10) PRIMARY KEY,

       [PID] [char] (10) FOREIGN KEY REFERENCES [dbo].[TreeView],

       [DATA] [char] (10) 

)

       ID是当前节点的独一标识号,显然它该当是主键;我们建立的是一个自闭的存储结构,每一个节点的父节点也该当出自表中存储的节点,所以PID列援用ID作为外键;至于DATA,它是节点中的信息,通常和树的结构没有绝对关系。我把这三列全设成Char(10),是为了后面做演示更方便,当然也有人喜欢用自动标识列来做主键,在这种场合,也自有其优点。为了维护数据的完整性或存储、检索等方面的考虑,实用中我们可能会采用更复杂的结构,不过骨干就这样子了。这个结构从数学上讲很简约,而且是自洽的。如果一个节点没有父节点,那么它的PID就等于它本人的ID。这并不违反我们关于主外键的定义。

信息的管理与使用

       树表的结构确定后,问题就集中在如何读写其中的数据。

       添加节点:添加一个叶节点很简单,只需指定这个节点的父节点,把它“挂接”到TreeView中。从递归的角度来看,我们可以反复这一步骤,真到插入一个完整的子树。绝对而言,比较麻烦的是,如何把一个子节点插入到现有的树两头,而不是最末端。比如存在一个节点N,它的根为R,如今要在R和N之间插入一个新节点N’,我们可以这样做:把N’挂在R下面,作为它的子节点,然后把N的父节点指定为N’即可。

       修正节点:这里指修正树结构,改变某一节点的父节点,在这种结构中,修正是很方便的,只需调用标准的update就可以。

       删除节点:删除节点时要留意这个节点下面还有没有子节点,如果有,我们通常以两种方式处理,一是把相关子节点全删掉,如果是MS SQL Server 2000这样的系统,你可以很简单的在建表时将外键约束指定为支持级联删除,本人写一个级联删除比较麻烦,不过也不是不可能,重点在于,为这个过程建立递归。简要示例如下:

--定义存储过程

CREATE PROCEDURE DeleteNode

       @NodeID Char(10)

AS

BEGIN

       --以当前节点的子节点作为记录集建立游标

       DECLARE ChildNodes CURSOR

       READ_ONLY

              FOR SELECT ID FROM TreeView WHERE PID = @NodeID

       DECLARE @ChildNode VARCHAR(40)

       OPEN ChildNodes

       FETCH NEXT FROM ChildNodes INTO @ChildNode

       WHILE (@@fetch_status <> -1)--判断记录集能否成功打开

       BEGIN

              IF (@@fetch_status <> -2)

              BEGIN

                     --递归调用

                     EXEC DeleteNode @ChildNode

              END

              FETCH NEXT FROM ChildNodes INTO @ChildNode

     &n