日期:2014-05-20  浏览次数:20935 次

C#的栈和堆
一个程序集的内容在内存中应该被分为两个部分进行存放:代码和数据。一般CPU都会把数据和代码放到两个相对隔离的内存区域,这样能保证安全和便于管理。哈弗体系结构的计算机,数据存储器和代码存储器都是物理分开的,例如ARM。(到现在没有看到有书或视频讲这个问题,只是根据我汇编语言和C语言的知识做此推测。)代码被加载到代码区,包括类的方法和构造函数。数据被加载到数据区。
    当程序集刚被加载到内存中时,只有代码占用了内存空间,在代码区。数据要等代码执行后才会分配相应的内存空间,值类型的被放到栈上,引用类型的被放到堆上。
  值类型并不是都被分配到栈上的,如果一个类的成员变量是值类型的,那么这个成员变量应该被分配到堆上。
  引用类型对象的建立是通过类型元数据建立的。

  以上为个人见解,欢饮大家拍砖。


    问题一:所有进程都共用一个堆和栈吗? 


------解决方案--------------------
事实上,x86架构是冯诺伊曼(普林斯顿)结构的,而不是哈佛结构。但是现在x86的L1缓存则借鉴了哈佛结构。说远了。.NET CLR相当于一台虚拟机,所谓虚拟机,和硬件是无关的。

.NET虚拟机类似RISC和哈佛结构,但是JIT为x86而优化。

.NET CLR 使用了特别的方法来管理托管内存,事实上,多个.NET程序实例,甚至不同CLR版本的程序,都可以拥有同一个进程宿主。但是这并不说明所有进程共用同一个堆和栈。

堆栈以托管进程为单位存在。同一个程序内部的线程倒是共用线程。
------解决方案--------------------
探讨
引用:
值类型并不是都被分配到栈上的,如果一个类的成员变量是值类型的,那么这个成员变量应该被分配到堆上。

这句歧义很大...后面的对,前半句不加修饰就是错的...

.NET的堆栈管理非常复杂,是以AppDomain为单位而不是以程序集或进程为单位管理的...

------解决方案--------------------
你说的固然没错。但是我觉得比较满意的答案是从程序的边界角度来看待这个问题。

比如说一个程序,使用了 IoC,那么进程的边界就是装配在一起的全部程序集的边界。
而程序集的边界,是程序集本身和它所引用的程序集。

如果你搞三层开发,或者插件系统,或者可以重用的组件,那么这是相当关键的概念。相反什么清单、类型数据这些倒是没什么要紧的,虽然教科书里面都反复写这些。

比如说你配置个 NHibernate、Spring.NET、EnterpriseLib 之类的,或者开发过 WCF、WF等等,有没有实际的项目经验和体会。
------解决方案--------------------
栈,就是那些由编译器在需要的时候分配,在不需要的时候自动清楚的变量的存储区。里面的变量通常是局部变量、函数参数等。
堆,就是那些由new分配的内存块,他们的释放编译器不去管,由我们的应用程序去控制,一般一个new就要对应一个delete。如果程序员没有释放掉,那么在程序结束后,操作系统会自动回收。
自由存储区,就是那些由malloc等分配的内存块,他和堆是十分相似的,不过它是用free来结束自己的生命的。
全局/静态存储区,全局变量和静态变量被分配到同一块内存中,在以前的C语言中,全局变量又分为初始化的和未初始化的,在C++里面没有这个区分了,他们共同占用同一块内存区。
常量存储区,这是一块比较特殊的存储区,他们里面存放的是常量,不允许修改
 
一般认为在c中分为这几个存储区:
1. 栈 --有编译器自动分配释放 
2. 堆 -- 一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收 
3. 全局区(静态区) -- 全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域,未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。程序结束释放。 
4. 另外还有一个专门放常量的地方。程序结束释放 
在函数体中定义的变量通常是在栈上,用malloc, calloc, realloc等分配内存的函数分配得到的就是在堆上。在所有函数体外定义的是全局量,加了static修饰符后不管在哪里都存放在全局区(静态区),在所有函数体外定义的static变量表示在该文件中有效,不能extern到别的文件用,在函数体内定义的static表示只在该函数体内有效。另外,函数中的"adgfdf"这样的字符串存放在常量区。 比如:
代码: 
int a = 0; //全局初始化区 
char *p1; //全局未初始化区 
main() 

int b; //栈 
char s[] = "abc"; //栈 
char *p2; //栈 
char *p3 = "123456"; //123456\0在常量区,p3在栈上。 
static int c = 0; //全局(静态)初始化区 
p1 = (char *)malloc(10); 
p2 = (char *)malloc(20); 
//分配得来得10和20字节的区域就在堆区。 
strcpy(p1, "123456"); 
//123456\0放在常量区,编译器可能会将它与p3所指向的"123456"优化成一块。 

还有就是函数调用时会在栈上有一系列的保留现场及传递参数的操作。 
栈的空间大小有限定,vc的缺省是2M。栈不够用的情况一般是程序中分配了大量数组和递归函数层次太深。有一点必须知道,当一个函数调用完返回后它会释放该函数中所有的栈空间。栈是由编译器自动管理的,不用你操心。 
堆是动态分配内存的,并且你可以分配使用很大的内存。但是用不好会产生内存泄漏。并且频繁地malloc和free会产生内存碎片(有点类似磁盘碎片),因为c分配动态内存时是寻找匹配的内存的。而用栈则不会产生碎片。 
在栈上存取数据比通过指针在堆上存取数据快些。 
一般大家说的堆栈和栈是一样的,就是栈(stack),而说堆时才是堆heap. 栈是先入后出的,一般是由高地址向低地址生长。
------解决方案--------------------
有关进程与计算机结构的如此高深的问题我没有发言权,但楼主的问题有些资料可以参考
1. c#堆栈的分配问题,肯定是与线程有关的,参见微软的说明http://msdn.microsoft.com/en-us/library/5cykbwz4(v=VS.80).aspx,但是否存在线程也有栈,进程也有栈的事情,需要考证,因为线程间要有同步及数据调用的问题,其解决机制是什么样子的,是通过堆还是使用进程的共享栈,希望有研究这方面的专家给出答案。

2. C#与系统的关系问题,我研究过WDK(window内核编程技术), 在x86系统中内存访问权限分4层(R0、R1、R2、R3)但windows实际只使用了R0,R2, R2是我们的用户层,R0是内核层,R2不能访问内核层的内存。而整个.net framework都是工作在用户层的,因此不可能进行内核驱动开发。
------解决方案--------------------