怎么用java实现文本的关键字提取?
本人要实现一个功能,从一个文章里面把主要的关键字提取出来,如写qq的日志后,就有一个提取关键字的功能,这要怎么用JAVA实现?
------解决方案--------------------用滚雪球的方法,前提是有足够的搜索量。
初期建立基础关键字时可以找本词典把所有的词导一遍,权值放最低。
然后就有办法提取文章的关键字了。
等有足够的搜索量时,自然就有新的关键字,这样雪球越滚越大...
难道楼主在做google? (*^__^*)
------解决方案--------------------他的意思是,标签不是自己写,发表文章后,自动分析标签。。
呵,要是不使用第三方框架,实现起来还真不容易。涉及到很多方面。。
Lucence的中文分析器好像还不错,可以试一下。