搜索引擎中字符串的分割问题!
自己想做个系统来用用,碰到一个问题没头绪解决.老鸟提点!
比如我数据库中有个字段值是"中国人民解放军" ,然后我用"中国解放军"模糊查询也能检索到这条记录.
也就是将关键字"中国解放军"进行分割,分割成"中国","解放军",分割后的字符串仍然有意义.能够将一些没意义的词去掉.如"怎么样,为什么等...
好像常见的搜索引擎就是这么做的是吗?
希望老鸟给指个思路,或者给个相关文章的地址.
还有,我进行搜索的时候用这样的语句进 where ... like '%中国' . 这样做的效率是不是很低呢? 怎么样才可以提高检索效率?
------解决方案--------------------
这个问题是一个知识库的问题,先建一个搜索的知识表,里面是很多检索词条。当检索的时候,把检索关键字
在知识表中进行推理匹配,然后检索匹配度高的。
------解决方案--------------------
http://blog.csdn.net/jnsuyun/archive/2006/07/18/933875.aspx
这个可以参考
------解决方案--------------------用lucene效率不错,是先生成索引!