日期:2014-05-18  浏览次数:20598 次

关于批量替换的算法,大家来看一下,顺便散分。
有没有效率高的批量替换的算法,

      环境是:

      被替换的是一篇短文,可能就百个字,

      而需要要替换的字符有很多,可能有好几百或上千组。

      实例就是我有一个积累下来的字库,字库里放着要替换的词组的对应表(很多)。

      然后用这个字库里的所有词组去检查短文的内容,如果有就替换为对应的词语。


      大家有没有好的办法?



------解决方案--------------------
看看关于全文搜索的资料
------解决方案--------------------
http://www.xrss.cn/Info/11330.Html
------解决方案--------------------
支持下
------解决方案--------------------

关注一下,最近也想做个类似的东东。


希望CSDN的牛人能有好的办法。 或是大家集思广益也可能会有启发的。
------解决方案--------------------


@CathySun118(斯年):


我看了你的程序,是个不错的东东,


我想要做的东东是比方说有一篇短文 ,可能也就是200~2000个字之间吧,不大的。


现在我要在这个短文中把用的错别词语替换成正确的。

如何确定是正确的还是错误的呢?我有一个词库,里面有一些常用的词语正误对应的词条。如果短文中有错误的就替换成 词库中相应正确的。(只考虑词库中存在的错误词)。

词库可能有上千条之多,笨方法是用循环每个词条去文件中替换 ,但估计效率不太好,不知道大家有没有好的想法。


期待中~~~~~


------解决方案--------------------
末有做过
------解决方案--------------------
如果有一千个词组的话就要做一千次循环然后用正则来替换文章中的所有,同理一万个词组的话就要一万次,真不知道速度会如何
------解决方案--------------------
帮顶。 我是来学习的。。给楼主一朵小红花 好人啊 散分的都是好人
------解决方案--------------------
没搞过,如果循环再替换的话,那效率肯定是个问题。

我想至少要有一方面有类似索引的东西才好,比较可能的就是你的词库,怎么能快速检索到相应的条目,而不需要循环所有的。

这样可以循环文章中的所有字,每个字都通过这个索引的东西查找是否有匹配。
------解决方案--------------------

------解决方案--------------------
如果循环的话,那效率肯定是个问题

但是不循环又怎么找到要替换的东西呢?
------解决方案--------------------
循环一遍文章。
循环所有的关键字