请帮推荐一篇实现“相关文章”功能的文章或思路
要能适合大型文章系统的
我在网上找到一篇 “(MS SQL)如何实现相关文章功能(多关键字匹配)改进版”http://blog.csdn.net/chenggongit/archive/2008/11/19/3335296.aspx
感觉不太好,因为每个关键词都要占一条记录,如果我们1千万篇文章,每篇文章有3个关键词, 那就有3千万条关键词记录,个人感觉这对服务器是不好的压力
能不能说说更好的思路
------解决方案--------------------非常简单的事,用一个表保存某个关键字的对应的文章id。
到时候查询到相关的几个关键字就得到一大片id,这些都是相关文章了。
------解决方案--------------------通过分词提取相关关键字
添加到关键字表,多关键字查询
------解决方案--------------------在文章存储的表里加个字段存储这篇文章的关键字或者用SQLServer全文搜索
------解决方案--------------------
------解决方案--------------------
------解决方案--------------------大型网站都要用服务器群集吧,单台服务器是承受不了的.