日期:2012-05-14 浏览次数:20569 次
广州SEO陈永继续为大家讲解搜索引擎判断网站如何判断网站是否作弊的原理,上节讲解完TrustRank算法,这一节将详细讲解BadRank算法。
BadRank据传是Google采用的反链接作弊算法。它是一种典型的不信任传播模型,即首先构建作弊网页集合,之后利用链接关系来讲这种不信任分值传递到其他网页。
BadRank包含的基本假设是:如果一个网页将其链接指向作弊页面,则这个网页也很可能是作弊网页:而如果一个网页被作弊网页指向,则不能说明这个网页是有问题的,因为作弊网页也经常将其链接指向一些知名网站,所以BadRank的基本思路:找到那些有链接关系指向已知作弊网页的页面,这些页面很可能也是作弊网页。
BadRank首先收集一批已经确认的作弊网页形成的作弊网页集合(黑名单),黑名单内网页赋予较高的不信任分值,而不被信任分值是通过网页的链接关系来进行传播的,其计算过程与PR基本相同,与PR不同的是,PR是根据网页的出链来进行权值传播的,而BadRank是按照入链来进行权值传播的,所以将BadRank理解为首先将网页之间的链接关系反转,假设页面A有链接指向页面B,则将链接反转为由B指向A,之后按照PR的计算方法进行计算。
PR的计算思路是非常有代表性的,后续提出的ParentPank及Anti-Trust PageRank的整体思路上与BadRank是一致的,基本上都是不信任传播模型的具体实现实例。
BadRank的计算思路很明显和TrustRank是互补的,一个方法是从黑名单出发传播不信任关系,另外一个是从白名单出发传播信任关系,所以两者有天然互补性。
BadRank算法讲解完了,搜索引擎判断网站是否作弊的原理分析(四)将详细讲解SpamRank算法,有兴趣的朋友可以到我的博客进行交流。
文章原创于http://www.30ly.com/?p=249
转载请留下转载地址
搜索引擎判断网站是否作弊的原理分析(二)