日期:2014-05-20  浏览次数:20681 次

lucene 多目录索引和单目录索引——查询效率如何提升
海量数据下lucene 单索引和多索引的查询效率如何提升。。。。。

希望有朋友不吝赐教。。。

我在单索引目录下 索引2.7亿条数据,22GB左右的大小的 文件,查询单一的中文词,用时平均 7秒左右。。当然2.7亿数据全命中的状态下。

使用多目录索引 2.7 亿条数据,用了14个索引目录,每个目录为1GB左右, 按照单索引目录模式下的关键词查询,平均用时6-7秒。其中(ParallelMultiSearcher,MultiSearcher)这两种查询的效率差不多。

不知道有什么方法提升这个查询效率呀。。。。。。。。。

------解决方案--------------------
这个帮顶一下。

有没有考虑用多线程技术进行搜索呢?

参考http://hbluojiahui.blog.163.com/blog/static/31064767201051152849976/

希望对楼主有所帮助
------解决方案--------------------
探讨
首先,感谢楼上的回帖。。。

你给的这个BLOG,我看了,基本上说的上如何索引的问题。。。

为想问的,查询索引的问题。。。效率,如何提升。。。。。。

而且 ParallelMultiSearcher 这个类正是 lucene的一个多线程查询类。。。。

------解决方案--------------------
通过红黑树~~~来处理,这样不知道能不能行~我觉得你要尝试去改索引的方式,从这个角度来提高命中~