日期:2013-08-06  浏览次数:20826 次

前几天看到千鸟的一篇博客《标签的言语粒度》,颇有收获,不由来谈谈本人对标签的一些看法。

标签和关键词的异同

不得不承认,不管标签(Tag)多么时髦,关键词(Keyword)多么老土,这两者之间的基本意义都是分歧的,都是用来描述一个事物的多重属性。以致于,如果有用户问我标签是什么东西的时候,我仍然会通知他:“就是以前常说的‘关键词’,换一种时髦的叫法而已”。

当然,我这么说只是方便普通用户容易理解,两者之间仍然有重要差异。

标签,是一种分类的工具,标签的出现是为了处理浏览时的难题。在浏览网站的时候,如果内容太多太杂,我们可以使用标签来对内容进行过滤,只看本人想看的标签。用标签浏览时,通常会按照发表的时间新旧顺序陈列。

而关键词,是用来辅助搜索的工具,关键词是用来描述一个东西和本人想要找的东西婚配程度的高低。用关键词搜索时,搜索引擎会依据网页和查询关键词的婚配度来提供搜索结果。排在最前的,是最精确的,而不是最新的。

所以,flickr会给每一个关键词都提供一个RSS源允许用户订阅某个tag,而google不会给关键词提供RSS,由于没人会每天都去搜同一个词,看看有什么新网页(SEO专家除外)。

标签的适用范围

标签是web2.0的时髦特征之一。老外写的web2.0书里,总是喜欢拿出flickr的tag的例子来吹嘘一番,说tag如何如何处理问题。好像只需用了tag,分类问题就迎刃而解了。可惜,tag的初衷虽然美好,但实际情况要复杂得多。

不论是中文还是英文,都会有大量的同义词、近义词、单复数等等,语义相近,但表达方式不同的情况。这种言语的随意性,大大影响了标签的使用效果,局限了标签系统的适用范围。

我整理了一下,标签系统在下面三种情况下是比较合适的:

1.标签数量无限,事先设定
我们每天使用的gmail就把标签运用得恰到好处。gmail一方面把收件箱、垃圾邮件等概念,全部用特殊标签来处理。另一方面,gmail的标签并不是让用户在邮件后面随意输入的,而是需求事后创建,然后在常用标签列表中选择。标签的数量非常无限,每个标签具有不同的颜色,便于整理归类。由于标签都是事先创建的,就避免了设置标签时的随意性。
2.团体使用
如果一个分类系统有很多人在使用,可能每团体都会有一套本人的常用词汇表,必然导致同一语义的表达方式差异。又要举gmail的例子,由于邮箱服务是针对单个用户的。一团体对各种语义的表达通常比较稳定,因此不容易出现多重表达方式的情况。
除此团体使用之外,如果是人数不多的多人使用,或者是有彪悍管理员的多人使用,也能基本控制住标签的随意性。
3.海量内容,且对精确度要求不高
与团体使用绝对的,在另一个极端,海量数据的情况下,tag也能发挥作用。比如豆瓣的标签分类系统,虽然在设置标签的时候缺乏约束力。但是由于用户极多,标签极多,总有人加了合适的标签。再加上用户在搜索一个标签的时候,或者是豆瓣依据标签给用户推荐内容的时候,对精确度的要求都不高,因此标签仍然很好用。

总之,要么想方设法约束标签的随意性,要么就是有海量的数据,可供挖掘整理,否则标签的威力会由于标签的随意性而大打折扣,相反语义的不同表达方式,会让用户产生更多的困惑。在内容数量不多的情况下,标签往往不如分类系统来得无效。