【人在运维囧途_07】GNU/Linux 系统资源监控神器--collectl【重点推荐】
对系统资源的监控、是运维人员的一个必备的技能
从 OS 角度讲、包括 CPU/IO/Network/FS 等
从 DB 角度讲,包括 Active Sessions/ON CPU/Disks/Top Segments/Top SQL 等等
而 DB 对资源的利用也反映在 OS 一级上,对 OS 计算资源的充分均衡利用是我们的目标
众多监控工具中、collectl支持的性能数据种类应该是最全的一个
包括 IO/CPU/Network/NFS/Infiniband/Lustre/Process/Slabs等等
㈠ 安装:
# perl -MCPAN -e shell
cpan> install Time::HiRes
cpan> install Compress::Zlib
cpan> quit
下载collectl
# tar -zxv -f collectl-3.1.3.src.tar.gz
# cd collectl-3.1.3
# ./INSTALL
㈡ 使用: # collectl -s+m
更多的使用:官方文档
㈢ 应用:
collectl 不局限于 OS、可以用它 monitor DB、如 Oracle MAA 环境
在机房里的所有机器上安装collectl,然后把性能信息实时发送到一个监控机器,实现grid control
以下是 Oracle Exadata 上的一次监控