日期:2014-05-16  浏览次数:20743 次

《linux 内核完全剖析》 笔记 由逻辑地址转换成线性地址代码分析

一开始由这段代码引发的纠结

get_base(current->ldt[1])

下面是各个相关的代码,摘自不同的header files。。。

current是指向当前task的指针


struct desc_struct ldt[3];


struct desc_struct {
unsigned long a,b;
} ;



#define _get_base(addr) ({\
unsigned long __base; \
__asm__("movb %3,%%dh\n\t" \
"movb %2,%%dl\n\t" \
"shll $16,%%edx\n\t" \
"movw %1,%%dx" \
:"=d" (__base) \
:"m" (*((addr)+2)), \
"m" (*((addr)+4)), \
"m" (*((addr)+7))); \
__base;})




#define get_base(ldt) _get_base( ((char *)&(ldt)) )



          事实证明(说的直接点就是代码看不懂),前面的8086保护模式编程是相当重要的,是理论基础。我现在越来越理解汤老师的话,只有坚实的理论基础,才能更好的实践。


不复习分页保护模式,这段代码是看不懂的,而且一开始我特别纠结

 :"m" (*((addr)+2)), \
 "m" (*((addr)+4)), \
 "m" (*((addr)+7))); \


为什么取addr的偏移量偏偏就是2 4 7 



通过ldt(locale descriptor table)可以找到它映射的物理地址空间。


struct desc_struct {
unsigned long a,b;
} ;


这个结构体里面的 a b 是unsigned long类型,8 byte长, 32位

对应的是段描述符, 贴图吧。。





ldt[1],是代码段,ldt[2]数据段,ldt[0]为空,至于为什么,现在。。。我也布吉岛。。。

get_base传参的方式有点技巧,他传递了ldt的地址

然而这里的ldt其实是一个指针current->ldt[1] ,于是这里的addr是一个指针,这个对于理解为什么addr偏移2 4 7“至关重要”。。。

#define get_base(ldt) _get_base( ((char *)&(ldt)) )



但是我觉得赵炯博士的解释说明图和具体代码对应的时候,是有点问题的。


我纠结了很久这里的addr+2 addr+4 addr+7究竟指向哪儿了。

事实上

addr+2是指向那个有16位长度的base address的(0-15)