MySQL目录聚集索引-MySQL教程-爱易网页

MySQL目录聚集索引

日期：2014-05-16　浏览次数：21047 次

MySQL索引聚集索引

如果你想了解MySQL索引查询优化，你首先应该对MySQL数据组织结构、B-Tree索引、聚集索引，次要索引有一定的了解，才能够更好地理解MySQL查询优化行为。这里主要探讨MySQL InnoDB的聚集索引。

InnoDB数据存储结构

1.MySQL将所有数据都逻辑地存放在ib_data1文件中，我们称之为表空间。当然，你也可以一个表对应一个物理文件,将innodb_file_per_table设置成ON即可。
2.表空间又划为成段，有数据段(leaf node segment)，索引段(none-leaf node segment)，回滚段(rollback segment)。表空间由这些段和页组成，比如32页碎片页。
3.每段又划为成区，InnoDB每次最多可以申请4个区，即4M的存储空间。
4.每个区又划为成页，一个区划分成64页，每个页的大小是16KB，大小不能够改，这也固定了一个区的大小为4M。页是MySQL操作的最小逻辑单位。
5.InnoDB是面向行的，这就意味着数据行存放在页中，每页最多能记录7992行数据。
6.MySQL定义了不同作用的页类型，比如B-Tree Page, Undo Log Page等，我们最关心的是B-Tree Page(数据页)。实际数据就以这样的页逻辑实体存在于表空间,总是以B+树结构索引组织的。
7.换句话就说，实际数据一行一行地存放在B-Tree页中，这些页都放在数据段leaf node segment中。B-Tree Page是B+树的叶子节点。
8.一个B-Tree树，由7部分构成

8-1.File Header，这里记录了页在表空间的一些信息，比如上一页，下一页，属于哪个表空间等等
8-2.Page Header, 这里记录了页本身的一些存储信息。比如第一个记录的位置，记录数，最后插入记录行的位置，该页的索引ID等等
8-3.Infimum & Supermum Records, MySQL虚拟的二个行记录，用来界定记录的边界。分别代表此页中任何pk值还小的值和任何pk值还大的值。
8-4.user records, 实际存储的行记录。
8-5.free space,空闲空间，同样是链表结构。当一个数据记录删除后，就会加入到空闲链表中
8-6.page directory, 存放了记录的相对位置。注:聚集索引本身找不到具体的一条记录。而是通过聚集索引找到该记录所在的页，然后再通过Page Directory进行二分查找找到具体数据。
8-7.File Trailer, MySQL InnoDB利用它来保证页完整地写入磁盘。

B-Tree索引查找数据

B+树，由B树和索引顺序访问方法演化面来的一种数据结构，较为复杂，常用于磁盘等存储设备的一种平衡查找树(所谓平衡，请查阅二叉树和平衡二叉树)。在B+树中,所有记录节点都按键值的大小顺序存放在同一层叶子节点中，各叶节子节点指针进行链接，每个叶子节点到达根节点的距离都是一样的。下图分别演示了G和H记录查询过程。

MySQL InnoDB一般按照每张表的主键构造一颗B+树，存放在表空间，其中整张表的行记录就是这颗B+树的叶子节点，存放在表空间的数据段(leaf node segment)。这就意味着数据行在表空间存储是有序的。MySQL通过B+树查找算法能够加速数据的访问，避免扫描整个表，大大减少了I/O逻辑操作。MySQL InnoDB查找某行数据的时候，通常先从root节点，找到子节点，直到找到叶子节点。叶子节点就是数据页，即(B-Tree类型页)，然后通过该页的Page Directory进行二分查找，找到数据行(上文有提到过，MySQL是不能通过B-Tree索引找到用户数据行)。

执行select * from user where uid = 92这样的一句查询。MySQL依照主键uid建立的B+树索引，MySQL从这颗B+树的根节点查找，一直找到叶子页的上一层节点，比较键值92>91(右边)最终找到数据叶，在数据叶中找到数据行。当然，也有可能找不到数据行(数据行根本不存在)。

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。