日期:2014-05-18  浏览次数:20950 次

信息检索有什么新的技术请大家共享一下???
1,像现在的google把一些网页收录到自己数据库里,然后用户在搜索时找到自己想到的东西,但这些信息不是时时更新.
2.自己在做一些项目时,最多的就是操作数据库,检索信息.当然这肯定是时时更新了.

以上说的两种实现检索的不同机制,针对不同的情况.我想问各位高手,有没有见过一个例子或自己做过一个同时用这两个东西的项目,或是怎么能找到这两种一个平衡点?

请大家把自己的想法,或一些这方面文章发上来....大家share一下.谢谢!

------解决方案--------------------
这类问题包含的概念太多了

一般小型项目数据怎么采集 怎么查询 怎么处理都简单

但是对于google以及其他搜索公司 所面临的是海量的 数据存储 查询 更新
这就需要非常极端的数据库了
而且是集群的概念架设
同时分布式存储

一个简单的查询在海量数据库中的操作都是非常谨慎的
同时 数据库的簇概念 索引建设 多层索引 以及排序都是非常严格要求的

同简单的小型项目有非常巨大的差别

据说他们的数据库系统是是自己设计的
分为各种索引 加快访问的效率
同时使用分布式
Master-Slave数据库模式
Master 负责更新
Slave负责查询

并使用均衡器做分布式管理

可以看看
Mysql Cluster的源码 可能对你 有帮助
------解决方案--------------------
另外可以看看我的博客

会对你有很大的帮助