日期:2014-05-17  浏览次数:20419 次

请帮推荐一篇实现“相关文章”功能的文章或思路
要能适合大型文章系统的
我在网上找到一篇 “(MS SQL)如何实现相关文章功能(多关键字匹配)改进版”http://blog.csdn.net/chenggongit/archive/2008/11/19/3335296.aspx

感觉不太好,因为每个关键词都要占一条记录,如果我们1千万篇文章,每篇文章有3个关键词, 那就有3千万条关键词记录,个人感觉这对服务器是不好的压力

能不能说说更好的思路

------解决方案--------------------
非常简单的事,用一个表保存某个关键字的对应的文章id。
到时候查询到相关的几个关键字就得到一大片id,这些都是相关文章了。
------解决方案--------------------
通过分词提取相关关键字
添加到关键字表,多关键字查询

------解决方案--------------------
在文章存储的表里加个字段存储这篇文章的关键字或者用SQLServer全文搜索
------解决方案--------------------
探讨
老兄们,这些我都知道,但我要的是一个高性能的,能适合大型网站的方法

------解决方案--------------------

------解决方案--------------------
大型网站都要用服务器群集吧,单台服务器是承受不了的.