日期:2014-05-18  浏览次数:20792 次

请问自动提取Tag算法的实现
比如csdn和sina的blog上的自动提取标签,他们是怎么实现的呢?

------解决方案--------------------
http://www.cnblogs.com/onlytiancai/archive/2008/04/29/1176981.html
------解决方案--------------------
是的, 他的那个算法就是一个简单的词频统计.

如果你想比较准确的话, 那你必须要做语义分析, 根据语义来提取.

不考虑语义的话, 那么在分词时, 给与标题远大于正文的权重值.

另外. 文中的分词结果, 只保留名词.