日期:2014-05-16  浏览次数:20711 次

数据库学习二:数据库设计三范式

一.第一范式(确保字段的原子性)

  1. 定义:表里面的所有字段都是原子的,不可拆分的。
  2. 这里面有两个意思。一是可以拆封时,一定要拆分;二是不要乱拆分。
    1. student_id 地址
      这样的设计不符合原子性,我们在存放"地址"的时候,会插入一个很长的字符串。往往我们将"地址"划分为更小的不可拆分的单位。修改某个地址时,只需修改一个或者多个字段。
      学生id 省份 市 街道
    2. student_id course_id1 score1 course_id1 score2...
         1              5           60         数学      70 ?
      
      这样的设计就是乱拆分了。这样做理解起来很容易,一个学生语文多少分,数学多少分...但数据表的设计不仅仅是建立在容易理解的基础上的。在更新一个学科的分数时或者删除一个学科的分数时,你都会死翘翘。正确的做法当然是:
      student_id course_id score
          1              5          60
          2              6          80 ?
      
      ?

二.第二范式(确保所有字段和主键相关)

  1. 定义:一个表里面的字段必须和主键相关;如果是联合主键,则必须与两个主键都相关。这里有"类"的意思,一类数据的集合,两类数据的交集。
  2. student_id course_id  score student_name student_otherinfo
         1             5           60         eason             ... 
    
    ?student_id和course_id是联合主键,score与两个主键都相关,但student_name仅仅与student相关,违背了第二范式。正确的做法:
    student_id course_id  score 
         1             5           60    
    ?
    student_id student_name 
         1               5          

三.第三范式(确保所有字段和主键直接相关, 不能间接相关)

  1. 确保所有字段和主键直接相关,不能间接相关。消除表之间的依赖传递。
  2. student_id(主键) student_name department_id(外键) department_name
    student_id----->student_name department_id department_name,满足第二范式。但student_id----->department_id, department_id----->department_name,存在非关键字段"department_name"对关键字段"student_id"的传递函数依赖。正确的做法:
    student_id(主键) student_name department_id(外键)
    ?
     department_id department_name
    ?

四.灵活运用

???? 虽然有数据库设计三范式这么一说,但实际操作中还要看具体环境,需要"逆范式"的时候就大胆的逆。

  1. 数据库非常庞大的时候,使用外键会带来非常大的性能损失。
  2. 考虑这样一个场景:一分钟500个网吧服务器向核心服务器发送hearbeat,核心服务器处理hearbeat后将网吧上座率存入数据库,以便以后做成日志图形。一个小时就有3W条记录,一天就有72W条记录。后来我们这么设计,每一分钟来的hartbeat我们存入内存数据库,下一分钟我们update到内存数据库,直到一个小时了,我们将内存数据库的记录同步到MyISAM数据库,这样一天只会产生1.2W条。MyISAM表如下,t1_att表示第一分钟来的数据。

?