日期:2012-05-08  浏览次数:20441 次

   大家都知道网站改版,同IP网站出现问题,或是自己的网站被攻击等都会让自己的网站降权,但还有一个因素同样会影响网站的权重,那就是网站的重复内容,网站中如果充斥较多的重复内容必然会影响到网站的权重以及排名,所以做好这方面的防备是做好SEO的重要举措。

  什么情况会产生重复内容?

  1 采集内容。这点大家都容易理解,很多站长为了省下写内容的时间,就去别的网站采集一些内容来填充自己的网站,这样做肯定会造成网站之间重复内容增加,而且对于这样做的后果大家是心知肚明,但还有很多站长存在侥幸心理,不过对此笔者建议大家可以适当的伪原创一下,在文章中加入自己的理解,总比直接的复制粘贴,更让蜘蛛喜欢。

  2 api站点造成的重复内容。这个原因主要是针对淘宝客网站,因为api站点在更新之后会产生很多的重复内容,这些内容都具有同质化趋向,不过现在大家不用担心了,因为淘宝已经禁止了淘宝客网站使用api推广。

  3 排序功能造成内容的重复化呈现。像一些大型的购物导航网站,在首页上都会出现“按销量排名”、“按热度排名”等栏目条,这些不同的排序一般情况下都是基于URL动态参数上完成的,试想一下一个热度高的产品很有可能是销量高的产品,所以这就造成了不同的URL组合,这样的产品一旦多了,对于网站优化就是相当不利的,因为会产生很多两两交叉的URL地址。

  4 在第三点上我说过很多像小说、歌曲下载的网站都会存在同质化的内容走向,其实对于电商B2C行业这种情况同样很多见,也许您会说电商网站的内容很少,图片较多,不太可能出现这种状况,然而恰恰是图片的原因致使网站重复性倍增,因为大家都知道蜘蛛不识别图片,这时候大家会使用alt标签对图片进行标注,但这并不能保证减少重复页面的收录,因为alt标签毕竟标记的是较少的文字,大不多图片的URL地址仍然是一样的,所以仍难避免网站重复页面的收录。

  5 网站程序设置问题,在建站网站的过程中,有时候站长相对网站达到一个预览的效果,就自己在后台制造了一部分动态页面,,但是因为这些动态页面都被忽略了,所以蜘蛛在爬行目录的时候仍然会收录,一来二去就造成了网站重复内容的出现。

  6 生成的RSS订阅。关于RSS订阅大家都很熟悉,对于一些大型新闻网站或是个人博客之类的网站都会利用RSS订阅来生成个人站点的内容,然而这些个人站点的内容必然会被他人转载,这就会造成原始源信息和其他网站内容造成重合,蜘蛛重复收录也就成了可能。

  7 错误代码导致的重复页面。大家都知道错误页面返回代码唯一只能是404状态码,其他状态码都不对,打个比方,如果你使用的是状态码200,那么你在删除一个页面的时候,就会在另一面告诉蜘蛛这个页面的请求成功,这样就会造成网站内容的再次收录,一样的道理,如果要对错误页面进行指引,就必须使用404状态码,否则一定会给网站造成重复内容。

  重复内容在蜘蛛看来就是一种作弊的行为,所以网站重复度过高的话就会造成网站权重的下降,那么我们在平常的网站建设以及维护中应该怎么预防呢?

  1 减少采集内容的频率,这点很容易理解,世上没有不劳而获的东西,如果网站的发展要依靠采集的话,那么这个网站也就没有了继续生存下去的希望。

  2 每一个页面都配上独特的标题。这是一个很重要的地方,因为标签是网站优化很重要的一部分,它的加入可以让蜘蛛分辨出这个页面的独有性,对于用户体验也是一个很好的提高,尤其是栏目页,一个独特的标签可以让内页权重得到一定的优化优势。

  3 修改meta标签。一个好的描述对于蜘蛛的收录判断起着重大的影响作用,但是现在很多站点采用的都是CMS程序,无论大规模的实现meta标签独立化,所以笔者建议大家手动修改一部分meta标签,至少比全部网页共用一个描述效果要好很多,当然这也是无奈之举。

  4 对于文章进行修改、伪原创。让大家不去采集文章也比较难,这点笔者可以理解,毕竟做过网站的站长都知道,每天都要写一定的文章,纵使自己的是文豪,也扛不住天天写,但是对于采集来的文章,我们一定要进行修改,最好是用自己的话再说一遍,文章中间加入自己的意见以及理解,这对于蜘蛛都是一种讨好的做法。

  5 修改CSS样式表。很多新手站长为了减少自己建设网站的难度,有时候就会去下载别人的网站主页或是内容页,然后稍微修改一下就放到自己的网站中了,但是新手站长不要忘了,下载下来的样本页中有很多相似的CSS样式表,如果不加修改必然会让网站重复度升高,当然就我个人而言,我不赞同大家仿照别人的网页,修改样式表,毕竟做网站要有自己的特色。

  6 减少无效或是重复的URL。在我们从网站开始的建设过程当中就尽可能的使URL统一,切勿使用动态页面进行连接,因为就蜘蛛的角度想问题,它是不喜欢动态页面的。

  7 减少无效内容之间的链接。很多时候我们会对之前的网站结构或是内容页进行修改,无形中就会遗留下一部分被删除的内容,对于这些东西大家要及时的清理,利用管理员工具去掉这些无效的链接,以免蜘蛛重复抓取,从而形成类似于状态码200的情况。

  网站建设就像是人体一样,任何一个方面的疏漏都有可能造成“疾病”,所以当网站出现降权或是排名下降,不要总认为是友链、网站改版等造成的,也有可能是重复内容造成的,对于这点大家也不能掉以轻心,短期内可能看不到坏处,但日积月累,网站发展的稳定性可就没有了保证。本文由痔疮偏方http://www.cqtaihai.com/ 网编发表,转载请注明,谢谢。