日期:2014-05-03  浏览次数:23018 次

巧妙地措置内容频频

比来,搜索引擎计谋会议在严寒的芝加哥进行。良多谷歌加入者老是被问及关于频频内容的问题。对于这个话题,我们发现有良多破裂的而且有些杂乱的理解,我们想在此予以澄清。

什么是内容频频?
频频的内容一般是指在分歧域名间存在大量的不异或相似的内容。良多时辰,它并非居心或至少本无恶意。譬如说,有些论坛会生成一些专为手机屏幕显示设计的页面;商铺物品被显示在(有时甚至是链接到)多种分歧的 URL 上,等等。但有些时辰,一些网站为了独霸搜索引擎排名,获得更多风行或长尾查询的访谒量,大量地从其他网站复制内容。

什么不是频频内容?
固然谷歌网站有便利易用的翻译功能,我们的算法不会把有着不异内容的英文版和西班牙文版看作内容复制。同样,你不用担忧我们把你文章中对其他文章小片段的引用认定为频频内容。

为什么谷歌关心频频内容?
谷歌用户利用 Google 时凡是但愿看到多样化的原创内容。若是他们找到的都是内容不异的一堆搜索功效,可以想见那是何等烦人。此外,网站打点员不愿意看到 Google 给出象 example.com/contentredir?value=shorty-george⟨=en 一样复杂的 URL 。他们往往更喜好近似example.com/en/shorty-george.htm 的 URL。

谷歌做了些什么?
Google 在抓取网页和获得搜索功效时,老是力图索引并显示内容分歧的页面。这种过滤意味着,譬如说,若是你的网站有文章的正常版和打印版,而且你没有在 robots.txt 里设定 noindex 标识表记标帜,谷歌就只会选择一个版本显示给谷歌用户。对于狡计操纵复制内容来操控排名,棍骗谷歌用户的少数情况,我们会对相关页面的索引和排名作出恰当调整。当然,我们更愿意把重点放在过滤而不是排名调整上,是以,在绝大大都情况下,最坏的功效就是原创者看到了不愿看到的版本呈此刻我们的索引里。

网站打点员若何自动措置内容复制问题?
* 恰当阻止搜索引擎访谒:与其让我们的算法来确定一个文件的“最佳”版本,你也许但愿指引谷歌拔取你的首选版本。譬如说,若是你不想我们索引你网站文章的打印版,你可以在你的 robots.txt 文件中写上目录名或正则表达式来禁止谷歌对那些打印版的抓取。

* 利用 301 重定向:若是你已经重构你的网站,请在你的原网站的 .htaccess 中利用 301 重定向(永远性重定向)来重定向你的用户、Google 爬虫以及其他搜索引擎蜘蛛等。

* 链接要一致:尽力使你的内部链接连结一致, 不要既有 /page/ ,又有 /page 和 /page/index.htm 的内部链接。

* 利用顶级域名:为了让我们老是利用最合适的文件版本,请尽可能利用国家特定的顶级域名。与诸如 example.com/de 或 de.example.com 的 URL 对比,谷歌必定更清楚地知道 example.de 是以德文为焦点的内容。

* 小心辛迪加式的连系供文:若是你为其他网站上也供给你的内容,请在每一个其他网站的文章中包罗连回原文章的链接。注重:即使是这样,对一个查询,谷歌老是显示我们认为是最适合的(没被网站禁止的)版本,它可能是也有可能不是你所想要的版本。

* 利用谷歌网站打点员工具的首选域功能: 若是其他网站链接你的 URL时 既利用 www 版本又利用无 www 的版本,你可以用谷歌网站打点员工具让我们知道你想要哪种索引体式格局。

* 削减模板网页上的频频内容:拿版权声明来说,你有两种选择,一种是在你的每一个页面底部都有一个冗长的版权声明;另一种是设立一个专门的版权具体声明页,然后在每页底部写一个很是简短的总结,并链接到版权声明页。

* 避免发布无内容页:用户不喜好看到无现实内容的页面,要尽量避免空架页。以房地产网页为例,不要发布(或至少要阻止)没有点评的点评网页,或者没有房地产列表的房地产枚举网站等。只有这样,网站用户(以及 Google 爬虫)才不会看到无限多的写着“以下是在【某城市名】中不成错失踪的待租房列表……”但其实根柢没有什么列表的网页。