Oracle 10g RAC中的DRM有关问题及关闭-数据库教程-爱易网页

Oracle 10g RAC中的DRM有关问题及关闭

日期：2014-05-16　浏览次数：20603 次

Oracle 10g RAC中的DRM问题及关闭

在RAC环境中，Oracle使用GRD（Global?Resource?Service）来记录各个RAC节点的资源信息，具体通过GCS（Global?Cache?Service）和GES（Global?Enqueue?Service）这两个服务进行管理。
??????由于在RAC中每个节点都有自己的SGA和buffer?cache，为了保证Cache资源的一致性和提高性能，GCS和GES会指定RAC中的一个instance来管理Cache，这个节点这时就是Resource?Master。
??????在10g以前，Cache资源是不能在各个节点间移动的，除非重启或者某节点因为其他异常被RAC驱逐等情况。而10g的DRM就解决了这个问题，它可以保证cache能够被remaster到频繁访问这部分数据的节点上，从而提高RAC的性能。DRM的全称是 Dynamic?Resource?Mastering，metalink上的Doc?ID:??390483.1文档详细介绍了DRM的信息。?

??????从理论上讲，利用此项技术，非master节点对所需资源有频繁访问需求时，可以提升为master节点，从而减少大量后续的跨节点资源访问需求。
??????但是，首先从根本上说，一个好的RAC应用设计，本就应该极尽所能的取避免同一资源的多节点访问，如果不存在同一资源的多节点访问，则DRM所要解决的问题，就根本不存在。其次，DRM本身是需要消耗资源的，并且存在诸多bug，对于一个设计较差的系统而言，频繁的DRM，也会引发 Libary?cache?lock而导致实例挂住。
??????更严重的，在10.2.0.3系统上，曾经遇到一个case，电信行业的巨型数据库，rac的2号节点由于批量处理作业在非业务时间段，首先cache了一张40G的表，而到了业务时间段后，rac的1号节点的OLTP业务需要频繁访问该表，此时，故障发生了，由于DRM的介入，2号节点开始将内存内的40Gcache数据向1号节点传输，心跳网段千兆带宽被耗尽，RAC陷入僵死阶段，足足维持了40分钟。
??????事后检查网络流量图，该时段内，私有网络流量持续保持在90M/s的峰值水平。
??????根据metalink确认，该问题确实由DRM机制引起，最终解决方案，使用隐含参数，将DRM特性屏蔽：
_gc_affinity_time=0??
_gc_undo_affinity=FALSE?

??????因此，从根本上来说，drm的出现，只是在理论上的一种缓解，而并不能在实际的大型应用中发挥其作用。就类似于Oracle自己针对 RAC推出的自动负载平衡一样，只是一种看起来很美的东西，如果真的有人用了，呵呵，那就只能等死吧。或许压力极小的数据库无所谓，但我没遇到过，话又说回来，压力极小，又何必上RAC呢。
??????为了技术而技术，不是我们的最终目的，科技以人为本，技术也一样，人，才是最重要的决定因素。

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

Oracle 10g RAC中的DRM有关问题及关闭

相关资料更多>

推荐阅读更多>