日期:2014-05-16  浏览次数:20615 次

Linux系统计算机死机的故障原因
系统出现死机,一般分为两种情况:一是硬件问题;二是软件问题。
  一、硬件问题

  可以考虑分析以下几点:

  1、不要超频CPU,如果已经超频的先回复到原来的频率

  虽然平时运行没有问题,但可能在高负载的使用中就会出现不可预料的故障了。特别是linux系统在某些应用上,是可以把硬件的性能发挥到极限的,但这样的硬件运行Windows可能是没有问题的。

  2、确认电源供电充足

  必须确保在高负载的状态下,电源可以满足负载。

  3、使用memtest86检查内存状态

  4、恢复BIOS到默认状态

  对于服务器,可以使用自带的监测工具进行测试,也是一个不错的排错方法。

  二、软件问题

  如果已经基本排除硬件问题,那我们就必须考虑从软件上去获得死机状态的系统信息了。

  1、运气足够好的话,系统死机不一定是完全死掉(此时键盘可能还能响应),那我们就可以使用Sysrq大法。

  前提是我们必须先打开sysrq功能:

  #echo "1" > /proc/sys/kernel/sysrq

  #setterm -blank

  这样,当系统出现问题的时候,我们可以使用:

  引用

  Alt+Sysrq-T 获得进程系统堆栈信息

  Alt+Sysrq-M 获得内存分配信息

  Alt+Sysrq-W 获得当前寄存器信息

  更多的热键可以参考系统上的/usr/src/linux/Documentaion/sysrq.txt

  其中,setterm -blank可以关闭字符下定时黑屏保护,方便记录屏幕信息。