从浅到深理解索引的实现(1)-数据库教程-爱易网页

从浅到深理解索引的实现(1)

日期：2014-05-16　浏览次数：21039 次

由浅入深理解索引的实现(1)

转自?? 由浅入深理解索引的实现(1)

00 – 背景知识

- B-Tree & B+Tree

??http://en.wikipedia.org/wiki/B%2B_tree
??http://en.wikipedia.org/wiki/B-tree

- 折半查找(Binary Search)

??http://en.wikipedia.org/wiki/Binary_search_algorithm

- 数据库的性能问题

? A. 磁盘IO性能非常低，严重的影响数据库系统的性能。
? B. 磁盘顺序读写比随机读写的性能高很多。

- 数据的基本存储结构

? A. 磁盘空间被划分为许多大小相同的块（Block）或者页(Page).
? B. 一个表的这些数据块以链表的方式串联在一起。
? C. 数据是以行（Row）为单位一行一行的存放在磁盘上的块中,如图所示.
? D. 在访问数据时，一次从磁盘中读出或者写入至少一个完整的Block。

?????????????????? Fig. 1

01 – 数据基本操作的实现

??基本操作包括：INSERT、UPDATE、DELETE、SELECT。

- SELECT

??A. 定位数据
??B. 读出数据所在的块，对数据加工
??C. 返回数据给用户

- UPDATE、DELETE

??A. 定位数据
??B. 读出数据所在的块，修改数据
??C. 写回磁盘

- INSERT

??A. 定位数据要插入的页（如果数据需要排序）
??B. 读出要插入的数据页，插入数据.
??C. 写回磁盘

如何定位数据？
- 表扫描(Table Scan)

??A. 从磁盘中依次读出所有的数据块，一行一行的进行数据匹配。
??B. 时间复杂度是O(n)，如果所有的数据占用了100个块。尽管只查询一行数据，
???? 也需要读出所有100个块的数据。
??C. 需要大量的磁盘IO操作，极大的影响了数据定位的性能。

因为数据定位操作是所有数据操作必须的操作，数据定位操作的效率会直接影响所有的数据操作的效率。
因此我们开始思考，如何来减少磁盘的IO？
- 减少磁盘IO

? A. 减少数据占用的磁盘空间
?????压缩算法、优化数据存储结构
??B. 减少访问数据的总量
?????读出或写入的数据中，有一部分是数据操作所必须的，这部分称作有效数据。剩余的
???? 部分则不是数据操作必须的数据，称为无效数据。例如，查询姓名是‘张三’的记录。
???? 那么这条记录是有效记录，其他记录则是无效记录。我们要努力减少无效数据的访问。

02 – 索引的产生

- 键(Key)

??首先，我们发现在多数情况下，定位操作并不需要匹配整行数据。而是很规律的只匹配某一个
??或几个列的值。例如，图中第1列就可以用来确定一条记录。这些用来确定一条数据的列，统?
??称为键(Key) .

??????? Fig. 2

- Dense Index

? 根据减少无效数据访问的原则，我们将键的值拿过来存放到独立的块中。并且为每一个键值添
??加一个指针，指向原来的数据块。如图所示,

??????????? Fig. 3

? 这就是‘索引’的祖先Dense Index . 当进行定位操作时，不再进行表扫描。而是进行
? 索引扫描(Index Scan) ，依次读出所有的索引块，进行键值的匹配。当找到匹配的键值后，
??根据该行的指针直接读取对应的数据块，进行操作。假设一个块中能存储100行数据，
??10,000,000行的数据需要100,000个块的存储空间。假设键值列（+指针）占用一行数据
??1/10的空间。那么大约需要10,000个块来存储Dense索引。因此我们用大约1/10的额外存储

上一篇： CCNP_route札记6 关于OSPF中的hello和DBD顺序

下一篇： (转)《阿里巴巴数据库标准操作手册》索引

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

分布式数据库mnesia治理

oracle批改排序内存及批量插入数据

了解Oracle数据字典

数据库的一部分成操作

Oracle数据导入导出imp/exp下令：转

共享锁跟排它锁

Percona Server 5.1.47-11.1 试工手记

DB2解由于LOAD引起的LOAD暂挂状态锁

替表的主键建立一个自增的sequence

从浅到深理解索引的实现(1)

相关资料更多>

推荐阅读更多>