请问自动提取Tag算法的实现
比如csdn和sina的blog上的自动提取标签,他们是怎么实现的呢?
------解决方案--------------------http://www.cnblogs.com/onlytiancai/archive/2008/04/29/1176981.html
------解决方案--------------------是的, 他的那个算法就是一个简单的词频统计.
如果你想比较准确的话, 那你必须要做语义分析, 根据语义来提取.
不考虑语义的话, 那么在分词时, 给与标题远大于正文的权重值.
另外. 文中的分词结果, 只保留名词.