日期:2014-05-16  浏览次数:20863 次

像百度、google出来一个新词是怎么做到马上就能准确搜索到的呢?
现在我使用的搜索框架是solr,如果出现新词,肯定是搜的不准确的,那这时候就只能往词库里填数据了。
但是有个问题,修改了词库,肯定得重启服务器才能生效,那百度、google是怎么做到这一点的呢?
个人比较费解,有没有大牛知道啊。求解释

------解决方案--------------------
百度那种搜索不是依赖的词库
而是用类似爬虫的方式,用千千万万的小爬虫,尝试请求网页以及网页里面的每一个链接,获取到响应,当你搜索时就可以解析这些内容,看是否包含搜索内容