日期:2014-05-20  浏览次数:20891 次

单词统计 求助
有个题目要求统计一个英文文本中各单词的出现次数。
问题来了,内容是文本但是标点符号却是中文的。
不知道各位大神有没有什么解决方法。

------解决方案--------------------
引用:
符号是中文还是英文有什么区别啊?  遍历这个文档,每次出现了英语那就是一个单词开始,出现了别的 ,一个单词结束。  然后统计下

看了你的题目 感觉怎么统计不是难点 难点是时间和内存要求吧。
时间的话 建议采用多线程。  这样IO 操作和逻辑操作可以同步进行
内存的话 不要把所有信息放一个MAP 这样显然是最耗内存的办法啦。