日期:2014-05-16  浏览次数:20741 次

Linux内核的malloc实现(Oracle的cache buffer影子)

本文原创为freas_1990,转载请标明出处:http://blog.csdn.net/freas_1990/article/details/12845059

 


本文介绍一下malloc的原理,对mm感兴趣(或者对Oracle internal实现感兴趣)的同学能在本文找到感兴趣的内容。

malloc主要由两个结构体做支撑。

struct bucket_desc { /* 16 bytes */
 void   *page;
 struct bucket_desc *next;
 void   *freeptr;
 unsigned short  refcnt;
 unsigned short  bucket_size;
};

这个结构体是一个bucket descriptor。所有的object会通过链表链接起来。 

struct _bucket_dir {	/* 8 bytes */
	int			size;
	struct bucket_desc	*chain;
};

这是bucket的目录。

我画了两个图来描述一个page(页面;4k)如何被这两个结构体描述。

 

一个4k的页面被分配到若刚个16 bytes大小的bucket中

 

 

一个4k的页面被分配到若刚个32 bytes大小的bucket中

那么,这些数据结构是如何被初始化的呢?

首先,在内核代码里,硬编码了如下数据。

struct _bucket_dir bucket_dir[] = {
	{ 16,	(struct bucket_desc *) 0},
	{ 32,	(struct bucket_desc *) 0},
	{ 64,	(struct bucket_desc *) 0},
	{ 128,	(struct bucket_desc *) 0},
	{ 256,	(struct bucket_desc *) 0},
	{ 512,	(struct bucket_desc *) 0},
	{ 1024,	(struct bucket_desc *) 0},
	{ 2048, (struct bucket_desc *) 0},
	{ 4096, (struct bucket_desc *) 0},
	{ 0,    (struct bucket_desc *) 0}};   /* End of list marker */

定义了粒度从16起的次方增长。

我写了简化的伪代码来描述整个流程。

malloc的伪代码

	procedure:
		get the bucket_desc with object size(for example 16 bytes)
		if(search bucket_desc list for free space){
			return  bdesc->freeptr
		} else {
			if(init_bucket_desc){
				return  bdesc->freeptr
			} else {
				panic("init_bucket_desc error")
			}
		}
		init_bucket_desc:
			if(page = get_one_page){
				sepreated the page(4k) with dir->size
				link all the pieces
			} else {
				panic("get page error")
			}
	end procedure


free的伪代码

procedure:
		get the bucket_desc with object size(for example 16 bytes)
		if(search bucket_desc list for the related bucket_desc){
			erase bdesc->freeptr
			bdesc->refcnt--
			if(bdesc->refcnt == 0){
				if(whole page NULL){
					if(!free_page(bdesc->page)){
						panic("free_page error")
					}
				}
			}
		} else {
			panic("input pointer not right")
		}
end procedure


关于数据结构性能的思考:

       这里的主要数据结构就是单向链表,查找的时间复杂为O(N),属于暴力查找。

       用了10个元素的数组做分拆,当内存使用过大的时候,这个数据结构就不能承载了。

       或许采用一个hash或者树形结构能解决问题。

       不过,对于20年前的内存来说,完全能应付了:)
 

 

 

1楼u0119604021小时前
两张图画的蛮清晰的