浅谈Redis数据库的键值设计
NoSQL带给我们的东西很多,高性能,水平扩展性,还有不一样的思维方式。本文来自@hoterran的个人博客运维与开发,作者列举了几种常用的应用场景,分别描述了其关系型数据库和Redis下的不同存储设计方法。值得参考。
丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样,DEV和DBA需要深度沟通,review每行sql语句,也不像memcached那样,不需要DBA的参与。redis的DBA需要熟悉数据结构,并能了解使用场景。
下面举一些常见适合kv数据库的例子来谈谈键值的设计,并与关系型数据库做一个对比,发现关系型的不足之处。
用户登录系统
记录用户登录信息的一个系统, 我们简化业务后只留下一张表。
关系型数据库的设计
mysql> select * from login; +---------+----------------+-------------+---------------------+ | user_id | name?????????? | login_times | last_login_time???? | +---------+----------------+-------------+---------------------+ |?????? 1 | ken thompson?? |?????????? 5 | 2011-01-01 00:00:00 | |?????? 2 | dennis ritchie |?????????? 1 | 2011-02-01 00:00:00 | |?????? 3 | Joe Armstrong? |?????????? 2 | 2011-03-01 00:00:00 | +---------+----------------+-------------+---------------------+user_id表的主键,name表示用户名,login_times表示该用户的登录次数,每次用户登录后,login_times会自增,而last_login_time更新为当前时间。
REDIS的设计
关系型数据转化为KV数据库,我的方法如下:
key 表名:主键值:列名
value 列值
一般使用冒号做分割符,这是不成文的规矩。比如在php-admin for redis系统里,就是默认以冒号分割,于是user:1 user:2等key会分成一组。于是以上的关系数据转化成kv数据后记录如下:
Set login:1:login_times 5 Set login:2:login_times 1 Set login:3:login_times 2 Set login:1:last_login_time 2011-1-1 Set login:2:last_login_time 2011-2-1 Set login:3:last_login_time 2011-3-1 set login:1:name ”ken thompson“ set login:2:name “dennis ritchie” set login:3:name ”Joe Armstrong“这样在已知主键的情况下,通过get、set就可以获得或者修改用户的登录次数和最后登录时间和姓名。
一般用户是无法知道自己的id的,只知道自己的用户名,所以还必须有一个从name到id的映射关系,这里的设计与上面的有所不同。
set "login:ken thompson:id" ? 1 set "login:dennis ritchie:id"??? 2 set "login:?Joe Armstrong:id"? 3这样每次用户登录的时候业务逻辑如下(python版),r是redis对象,name是已经获知的用户名。
#获得用户的id uid = r.get("login:%s:id" % name) #自增用户的登录次数 ret = r.incr("login:%s:login_times" % uid) #更新该用户的最后登录时间 ret = r.set("login:%s:last_login_time" % uid, datetime.datetime.now())如果需求仅仅是已知id,更新或者获取某个用户的最后登录时间,登录次数,关系型和kv数据库无啥区别。一个通过btree pk,一个通过hash,效果都很好。
假设有如下需求,查找最近登录的N个用户。开发人员看看,还是比较简单的,一个sql搞定。
select * from login order by last_login_time desc limit NDBA了解需求后,考虑到以后表如果比较大,所以在last_login_time上建个索引。执行计划从索引leafblock 的最右边开始访问N条记录,再回表N