在动态网站的设计中,数据库设计的重要性不言而喻。如果设计不当,查询起来就非常费劲,程序的功用也会遭到影响。无论你使用的是mySQL或者Oracle数据库,通过进行正轨化的表格设计,可以令你的PHP代码更具可读性,更容易扩展,从而也会提升使用的功用。 简单说来,正轨化就是在表格设计时,消弭冗余性和不协调的从属关系。在本文中,我将通过五个渐进的过程来通知你在设计中应该了解的正轨化技巧。从而建立一个可行而且效率高的数据库。本文也会详细分析一下可以利用的关系类型。
这里假定我们要建立一个用户信息的表格,其中要存储用户的名字、公司、公司地址和一些团体的收藏夹或url。在开始时,你可能定义一个如下的表格结构:
零形状方式
users name company company_address url1 url2 Joe ABC 1 Work Lane abc.com xyz.com Jill XYZ 1 Job Street abc.com xyz.com
由于没有进行任何的正轨化处理,我们将这种方式的表称为零形状方式的表。留意其中的url1和url2字段---如果我们在使用中需求第三个url呢?这样你就要在表格中多加一列,很明显,这不是一个好办法。如果你要创建一个富有扩展性的系统,你就要考虑使用第一个正轨化的方式,并且使用到该表格中。
第一级正轨化方式
1.消弭每个表格中反复的组 2.为每套相关的数据建立一个独立的表格 3.使用一个主键来标识每套相关的数据
以上的表格明显违反了上面第一条的规定,那么第三条的主键又是什么意思呢?很简单,它只是在每个记录中加入一个独一的、自动添加的整型值。通过这个值,就可以将两个姓名一样的记录区分开来。通过使用第一级正轨化方式,我们得到了以下的表格:
users userId name company company_address url 1 Joe ABC 1 Work Lane abc.com 1 Joe ABC 1 Work Lane xyz.com 2 Jill XYZ 1 Job Street abc.com 2 Jill XYZ 1 Job Street xyz.com
如今我们的表格可以说曾经处在第一级正轨化的方式了,它曾经处理了url字段的限制问题,不过这样的处理后又带来了一个新的问题。每次在user表中插入一条记录的时候,我们都必须反复所有的公司和用户数据。这样不只令数据库比以前大了,而且很容易出错。因此还要经过第二级正轨化处理。 第二级正轨化方式
1.为使用在多条记录的字段建立独立的表格 2.通过一个foreign key来关联这些表格的值
我们将url的值放在一个独立的表格中,这样我们就可以在当前加入更多的数据,而无需担心产生反复的值。我们还通过主键值来关联这些字段:
users userId name company company_address 1 Joe ABC 1 Work Lane 2 Jill XYZ 1 Job Street
urls urlId relUserId url 1 1 abc.com 2 1 xyz.com 3 2 abc.com 4 2 xyz.com
如上所示,我们创建了独立的表格,users表中的主键userid如今与url表中的foreign keyrelUserId关联。如今的情况好象曾经得到了明显的改善。不过,如果我们要为ABC公司加入一个员工记录呢?或者更多,200个?这样我们就必须反复使用公司名和地址,这明显不够冗余。因此我们将使用第三级正轨化方法:
第三级正轨化方式
1.消弭不依赖于该键的字段
公司名及地址与User Id都是没有关系的,因此它们使用拥有本人的公司Id:
users userId name relCompId 1 Joe 1 2 Jill 2
companies compId company company_address 1 ABC 1 Work Lane 2 XYZ 1 Job Street
urls urlId relUserId url 1 1 abc.com 2 1 xyz.com 3 2 abc.com 4 2 xyz.com
这样我们就将companies表中的主键comId和users表中名字为relCompId的foreignkey关联起来,就算为ABC公司加入200个员工,在companies中也只要一条记录。我们的users和urls表可以不断地扩大,而无需担心插入不必要的数据。大部分的开发者都认为经过三步的正轨化就足够了,这个数据库的设计曾经可以很方便地处理整个企业的负担,此看法在大多数的情况下是正确的。
我们可以留意一下url的字段--你留意到数据的冗余了吗?如果给用户用户输入这些url数据的HTML页面是一个文本框,可任意输入的话,这并没有问题,两个用户输入同样收藏夹的概率较少,不过,如果是通过一个下拉式的菜单,只让用户选择两个url输入,或者更多一点。这种情况下,我们的数据库还可以进行下一级别的优化--第四步,对于大多数的开发者来说,这一步都是忽略的,由于它要依赖一个很特别的关系--一个多对多的关系,这在我们的使用中是还没有遇到过的。 数据关系
在定义第四个正轨化的方式前,我想首先提一下三种基本的数据关系:一对一,一对多和多对多。我们回头看一下经过第一个正轨化的users表。要是我们将url的字段放在一个独立的表中,每次在users表中插入一个记录,我们就会在urls表中插入一行。我们将得到一个一对一的关系:用户表中的每一行,都将在urls表中找到相应的一行。对于我们的使用来说,这既不