日期:2014-04-01 浏览次数:21239 次
By Jakob Nielsen, 用研组编译
摘要:即便实证研讨的数据非常少(如:少到只观察了2位用户),但也能极大的协助我们做出正确的UI设计决策。
前言
在设计某一产品时,你该当让用户自定义字体大小,还是仅允许软件自动控制?某一天设计团队里开始讨论这一问题(由于这是真实的案例,所以下面都不会涉及到真实姓名)。
这12个设计师对此争论不休。其中大多数只是简单的提供一些团体看法,比如他们团体比较喜欢哪一种。·这里我们要留意,虽然所有人都对本人的偏好有绝对发言权,但是他们最终提出了6个意见,指出哪种设计对于大多数用户比较好。
这些意见的2/3纯粹是团体猜测,然而有1/3是基于他们在观察中所获得的某种实证性数据。
下面是这些意见的例子:
猜测的:
*译者注:为阅读流畅和将留意力聚焦在次要理念的学习上,全文是意译。技术类名词有改动 |
“那些最想调理字体大小的人大多都在65岁以上,他们是用户群体中最不可能掌握计算机设置的一类人。”(对的)
基于数据的:
数据优于猜测
目前关于这一问题普遍的准绳是:给予用户一定的空间去自定义字体大小,但是同时也将字体的缺省值设为较大,易读。这是由于大量的观察证明,大部分的年老用户都不会自定义字体大小。
在我们上面的例子中,
更吓人的是,猜测的设计师们有75%做出了错误的结论,你甚至扔一枚硬币来做决定都比问这些人要好得多。
在这个简单的例子里,仅仅是通过一些最基本的实证观察就能够将做出正确决策的概率提高4倍。
这里总结一下:虽然观察你的父母比完全没无数据要好,但是我并不推荐你依托观察家人来做设计决策,由于他们有可能比大多数用户聪明(由于你比较聪明,由于你懂什么是可用性,呵呵)。另外在我们的研讨中,儿童或者少年们在使用网站时也会有更大的困难。
测试2名用户也比靠猜要好
同样令人惊讶的是,在刚才的那个例子中,那些做出正确决策的设计师只是用了如此少的观察样本。下面我们举另外一个例子,这里会使用更多的研讨样本。
我们将152名用户分为2组,分别展现2种不同的银行帐号信息栏设置。我们让用户去做一些比如检查账户余额,找出目前的利率的任务,这些结果如下表所示:
可用性目标 | 设计A | 设计B |
成功率(四个任务平均值) | 56% | 76% |
完成时间 | 5:15 | 5:03 |
客观满意度(5点量表,5最满意) | 2.8 | 3.0 |
在所有的这些可用性目标中可以看出,设计方案B的数值都较高,(虽然只在成功率上有明显性的差异)。总的来说,毫无疑问方案B更好。
(同时需求指出的是,有的时候2种设计在这些统计目标上会各有优劣,比如说,一个设计会让用户成功率更高,而另一个让他们完成速度更快。这时候,你就需求对这些目标做权衡,或者做出第三个具有两方面有点的设计来看看。)
在这之后,我又将设计A和设计B交给21位交互设计师,讯问他们应该向银行推荐哪一种设计。他们依据本人的经验做出猜测,结果有50%的人得出了正确的结论。对,50%,和扔硬币是一样的概率(这样看来找个硬币来抛比找这些人做顾问要好的多,你还可以省下顾问费)。
然后,我又讯问了另外38团体同样的问题。这38团体也参与了上面提到的测试,所不同的是,这些人仅仅观察了2位用户的行为(被试内单要素设计)。他们做出正确决策的概率为76%。
我们可以看到,仅仅观察2名用户的行为就可以将决策的错误率从50%减为24%——降低了一半之多。然而,就算是24%的错误率也不能称作是一个高水平的设计决策,所以我们显然应该在测试中使用2个或以上的用户(我推荐5名)。
虽然这是一个将数据极度缩减的研讨,但是测试2名用户相比抛硬币般的猜测,仍然可以极大的提高提出设计意见和决策的正确率。
(在这一研讨中,这两个版本的视觉效果都很好,这很重要。由于如果是一个粗糙的原型和一个良好优化界面的产品做比较,可能会使人们的行为产生偏差)。
什么时候猜测可以让你错的离谱?
从以上的2个例子可以看出,猜测可以让你得到最差的表现。在设计自定义字体大小的时候,依据猜测可能让你在3/4的时候都是错的;在银行的例子中,有1/2的时候会出错。
为什么这些凄惨的猜测者们会做出这样的猜想呢?答案是他们往往基于以下的论述: