日期:2014-05-19  浏览次数:20733 次

学习研究 Lucene.Net 的请进
我想做一个索引htm文件的功能.需求是这样的:

我采集下来的页面是放在一个文件夹中的.我要对这个文件夹中的htm文件进行索引.当前是用一个按钮来控制索引的.我想做成一个服务.不停的监测文件夹目录,当有文件修改或者添加新的文件,删除文件时执行索引(这里我是重新索引,追加索引也可以).当前这个功能这可以实现.

问题是:可不可以只对修改的文件进行追加索引或者只修改那个索引.删除的时候就去删除相应的索引.另个可不可以做个索引的管理.
初学   lucene.net 希望会的朋友或正在研究的朋友可以发表意见或加我联系方式:
QQ:422763595
msn:selfxd@msn.com



------解决方案--------------------
帮你看看吧。
可不可以只对修改的文件进行追加索引或者只修改那个索引.删除的时候就去删除相应的索引.
这2个是可以的
最后一个就不懂你的意思
------解决方案--------------------
建议LZ建索引是分文件夹,并且根据一个数据库里的ID来分,这样更新索引时只更新修改过的
------解决方案--------------------
> > 问题是:可不可以只对修改的文件进行追加索引或者只修改那个索引.删除的时候就去删除相
> > 应的索引.另个可不可以做个索引的管理.

lucene使用的数据结构决定了修改和真删除操作的复杂度,这也是为了支持快速的查询操作。
在lucene中更新文件的唯一办法是先把这个文件删除掉(假删除,只是做了一个无效标志而已),然后在重新添加。

删除文件的时候重新索引太浪费了。lucene支持文件删除的啊。
------解决方案--------------------
不知道大家讨论的是不是这个效果
http://www.qiyesucha.com
------解决方案--------------------
1、针对个别修改过的文件更新索引是可以实现的,方法是第一步找出需要更新索引的关键字(ID),然后删除原来针对这条记录建立的索引,第二步就是将更新后的文件添加到索引中
2、不太清楚,也是出学

另外,我现在也想要将索引做成服务,定时执行,不需要人为干预,谁懂方法?