【交互干货】方案可用性测试方法-技术圈

点击 ▲ 三分设关注，和 10 万设计师一起成长

三分设 x ZXD用户体验设计部

正文共：3472 字 19 图预计阅读时间：10 分钟

简介：在实际企业体验设计过程中，利用简单有效且信度可靠的标准化流程和问卷，快速验证设计方案的可用性，前置发现设计方案中的问题，避免上线后踩坑～

01什么是可用性测试？

可用性测试的概念

让一群具有代表性的用户对产品进行典型操作，同时观察员和开发人员在一旁观察，聆听，做记录。该产品可能是一个网站，软件，或者其他任何产品，它可能尚未成型。测试可以是早期的纸上原型测试，也可以是后期成品的测试。

什么是「可用性」？

国际标准ISO 9241-11将可用性定义为“特定的用户在特定的使用情景下，有效、有效率、满意的使用产品达到特定的目标”。

有效性（effectiveness）：用户使用系统完成各种任务所达到的精度（accuracy）和完整性（completeness）；

效率（efficiency）：用户按照精度和完整度完成任务所耗费的资源，资源包括智力、体力、时间、材料或经济资源；

满意度（satisfaction）：用户使用该系统的主观反应，描述了使用产品的舒适度和认可程度。

引用：

可用性最早来源于人因工程（human factors）。人因工程又称工效学（ergonomics），起源于二战时期，设计人员研发新式武器时研究如何使用机器、人的能力限度和特性，从而诞生了工效学，这是一门涉及多个领域的学科，包括心理学、人体测量学、环境医学、工程学、统计学、工业设计、计算机等。

02可用性测试的作用

当我们在实际生产研发过程中，设计产品，需要让它质量过关，除过流程体验、功能完整以外，可用性是很重要的，需要用“以用户为中心”的价值观去设计和测试。可用性测试在实际工作中能够发挥哪些作用：

了解真实用户如何与产品进行交互-「避免产品和设计YY」

了解真实用户是否能够完成指定任务-「避免方案“逻辑自洽”」

了解真实用户完成指定任务需要多久-「避免简单任务花太长时间」

了解真实用户对产品与竞品的满意度-「拉出来“赛赛马”」

确定改进产品可用性问题所需的修改-「有问题还有救」

定性分析可用性并查看是否符合目标-「避免路跑偏了」

让设计和开发团队在开发前发现问题-「提前发现“锅”并甩掉它」

03可用性测试的分类

探索性可用性测试：在发布新产品之前，探索性可用性测试可以确定新产品应包含哪些内容和功能，以满足用户的需求。在产品开发早期，探索性可用性测试可以评估初步设计或原型的有效性和可用性。

评估性可用性测试：在发布前或发布后对最新版本的测试，通过评估性可用性测试向用户介绍新设计，以确保其直观使用并提供良好的用户体验。评估性可用性测试的目的是——确保在产品推出之前突出并修复任何潜在问题。

比较性可用性测试：比较两种或更多种产品或设计的可用性，并区分各自的优缺点，以确定哪种设计能提供最佳的用户操作体验。

04可用性测试的标准化问卷

我们在做产品或系统的可用性测试中，除了定性的研究结果之外，还有定量的可用性问卷，这些可用性问卷是标准化的，不仅可以科学地量化用户体验，也方便相关方之间有效沟通。常见的标准化可用性问卷有整体评估问卷、任务评估问卷和网站感知可用性评估问卷：

在实际工作中，对于设计侧进行可用性测试，SUS 量表和 ASQ 量表是比较常用的两种标准化问卷帮助我们进行相对客观的可用性测试。

4.1 SUS系统可用性量表

系统可用性量表（SUS，System Usability Scale）最初发表于1986年，总共包括10个项目，包括5积极描述和5个消极描述。其中8个项目归类于“可用性（Usable）”，另外2个项目为“可学性（Learnable）”。SUS的总体信度为0.92，其中可用性项目的信度为0.91，易学性项目的信度为0.7。量表的全部项目采用从‘强烈不同意’到‘强烈同意’的5点评分。用户的最终作答将被转化为一个百分制的分数。

翻译成中文：

SUS的优点

SUS量表是通过大量实验为基础的量表设计，也是现在全球使用最多的整体性可行性评价量表。

- 正反语气间隔，使答案客观。SUS问卷中大家可以发现奇数问题是正面语气，偶数问题是负面语气，这样减少了被测试者的依从性，从而使结果更加客观。

- SUS是最快达到想要结论的量表。通常来讲，一个量表所测量出的结果与用户真实的意向具有一定的偏差，**经研究SUS量表能够在不超过15个样本得到该系统的真实评价，所以该量表具有相当的灵敏性。**

- SUS量表包含易学性与可用性。其中4和9是易学性，其余的表示可用性。这个两个方面代表了整体评价的2个主体方面。具体的题设数量设计，是通过大量的样本研究发现后得出的。

SUS的计算方法

得分计算：范围在 0-4，每题进行转化分值；奇数题（正面）：原始分减去 1（x-1）；偶数题（负面）：5 减去原始分（5-x）

SUS 总分= 所有转化过的分值相加*2.5, 多样本算 SUS 总分均值

可用性总分=所有转化过的可用性分数相加*3.125

易用性总分=所有转化过的易用性分数相加*12.5

当得到分数后，我们评估产品或者方案的可用性呢？如某个界面的SUS分数为76，这代表着什么？AT&T Labs的Bangor等人在2009年发了一篇文章来解决这个问题，通过以下参照来衡量对照自身产品的可用性程度。

4.2 ASQ任务场景后问卷

场景后问卷（After-Scenario Questionnaire，ASQ）由 PSSUQ 和 CSUQ 的作者 Lewis（1993）发表。总共包括三个项目，分别测量用户在三个方面的满意度：任务难度、完成效率和帮助信息**。场景化问卷探测整体上完成任务的难易度、完成时间和支持信息的满意度。ASQ的项目采用从1（强烈同意）到7（强烈不同意）的7点计分。ASQ分数即是3个项目得分的平均分。据相关研究指出ASQ分数与场景任务的成功率也存在r=-0.4的显著相关。该问卷一般用于单一任务场景后，用户评估该任务的可用性。

05可用性测试流程