可用性测试

服务 > 可用性测试

用用户研究和可用性测试评估数字产品

以用户为中心的设计的一个关键组成部分是对数字产品进行评估,评估对象为目标人群中的真实用户。根据项目的具体目标、发展阶段和复杂性,有多种方法和途径可供使用。

在开发产品的过程中,进行可用性测试来评估产品是有很强的商业理由的。改变的成本很小,而设计方案的数量却很高,因此原型用户研究构成了开发过程的一个关键部分。

用户研究的属性

有许多不同的方法来提供用户测试,都包含以下基本属性。

  • 它们涉及要求用户尝试与他们在现实世界中尝试的任务相似的任务。
  • 用户在某种程度上代表了客户的目标受众
  • 用户尽可能自然地与原型互动,并提供反馈,一般是通过使用大声思考的协议
  • 对观察结果进行分析,并提出建议以迭代原型。

考虑到这些核心要素,将不同方法区分开来的是。

  • 在哪里? 研究的发生
  • 与 有多少用户
  • 什么是 研究对象
  • 什么数据 我们要捕捉的是

可用性评估

一个标准的可用性评估包括根据目标客户的情况招募5到12名参与者,参加一对一的会议(有时被称为 "深度"),持续45到60分钟。参与者将与一位用户体验研究员(不是用户体验设计师)一起度过这段时间,该研究员将主持会议,在大多数情况下,他们之前已经准备好了。

研究过程

进行这种类型的定性研究(可用性评估)的方法包括以下内容。

  • 招聘。 招募的参与者 对照客户指定的目标配置文件
  • 准备工作。
    • 测试脚本和讨论指南 旨在促进参与者与设计的互动
    • 设施 来进行研究
    • 装备 设置记录会议和参与者使用的设备(即平板电脑、智能手机、PC)。
  • 研究会。
    • 熟练 节制 的每一次会议
    • 观察和记录 的问题
  • 分析与报告

参加者人数和会议长度


参与者图标

当我们进入设计测试阶段时,我们通常会在所有的平台上进行可用性评估--智能手机、平板电脑和PC。但根据我们的经验,我们不需要在每个平台上进行5次测试,因为我们通常已经在前几轮测试中冲掉了严重的问题。

在大多数情况下,我们运行 在两天的研究中进行十次(约60分钟)会议,内容如下 跨平台分割:

  • 智能手机=4名参与者
  • PC = 4名参与者
  • 平板电脑=4名参与者

我们通常发现,平板电脑可以从智能手机和PC上的发现中获得信息,但我们喜欢运行几个会议,以避免我们错过一个明显的问题,并在折叠下面的休息点和关键信息。

研究设施和观察

研究设施提供 通过单向镜或屏幕观看 这样,设计团队和利益相关者就可以直接看到参与者是如何进行设计的。由于观看的人与主持人在同一地点,所以有 有机会讨论他们在两次会议之间观察到的情况,并开始计划更新和改变.
这也是设计团队和利益相关者合作的机会,讨论他们所看到的东西,因为研究设施的观察室往往是隔音的。

然而,研究设施是有成本的,而且 另外,该研究几乎可以在任何地方进行 - 在会议室、参与者的家里、客户的办公室等。我们可以在互联网上串流会议,因此 远程直播观看 是可能的。

然而,也有 局限性 其中包括:

  • 只有设备的屏幕是可见的,而不是参与者的面部表情。
  • 由于视频的高带宽特性,在互联网上长时间观看视频可能有点不可靠。
  • 屏幕分辨率可能使其难以查看精细的细节

另一种方法是回顾我们录制的高清会议视频,并上传到共享的Dropbox文件夹。在带宽允许的情况下,我们会在上传这些视频的同时,立即分享一个链接,这样你就能在大约一个小时的时间内观看。

测试设备

我们提供运行用户研究会议所需的所有技术。

这包括。

  • ǞǞǞ 测试笔记本电脑 装有专业软件,用于记录画中画。
  • 高清晰度视频 参与者正在使用的屏幕加上他们的面部表情。
  • ǞǞǞ 软件 需要连接智能手机和平板电脑设备,以便我们能够记录屏幕。

我们用于记录移动的设置使用了一种硬件和软件配置,这意味着智能手机只需插上电源线。参与者可以拿起手机,自然地握住并与之互动,不需要任何架空摄像机的附件,也不需要摇篮,或者将设备固定在桌子上。

我们为测试提供了一系列设备,包括iOS和Android智能手机、平板电脑和微软电脑。如果你需要,我们很乐意使用你的设备,并且一般来说可以轻松地连接到它们。

测试脚本、调控、分析和报告

分析图标

我们所有的项目都是由我们团队中的一位经验丰富的用户体验顾问来操作的,他们都经过了独立的评估和奖励。 认可的从业人员 状态。我们的顾问都有至少5年的经验,有必要的资格,还有进行这种设计研究的能力。

测试脚本

在与客户的讨论中,我们的用户体验顾问将 制定测试脚本,其中包括指导参与者互动的任务和情景。再加上你需要通过研究回答的任何问题。

我们将其记录在一个 研究计划其中包含所有其他有关研究的细节,并与您分享,以便进行迭代和签署。一个典型的会议结构可能是这样的。

  • 在他们开始之前
    • 讨论使用的背景,目前的行为和对研究对象的态度。
  • 任务
    • 我们将创建涵盖关键旅程、互动、特征和功能的任务,以便进行评估。
    • 与任务有关的问题,主持人必须确保这些问题得到回答。
  • 结业面试
    • 对他们的经验进行讨论

节制

我们所有的顾问都有多年从事这类研究的经验,除非另有要求。 我们的节制方法 详见下文。

  • 以口头方式向参与者传达任务,避免形式化
  • 要让用户与原型自由互动,而不是引导他们
  • 只有在用户犹豫不决或感到困惑时才打断他们,如果这不会导致失去任务的动力或从他们的行为中获得潜在的学习。
  • 必要时在任务或子任务结束后向他们提问

有时,我们被其他客户要求采用更正式的调节方法,如果需要,我们很乐意改变我们的风格。

在用户测试过程中,主持人将观察会话并做笔记,以便日后用于分析。这些可能是带有时间戳的笔记,以便他们以后可以参考,并回顾会议的视频。

分析与报告

研究结束后,他们将进行分析并开始创建报告--如果这是需要交付的成果。如果需要报告,我们将遵循用户体验最佳实践报告标准。

我们利用了一个 交通灯报告计划 至 对观察结果进行分类并对严重程度进行评级 如下图所示。

交通灯报告计划

交通灯报告计划

案例研究。

在为一家连锁酒店进行的生成性研究中,我们在重新设计过程之前审查了一个现有的应用程序。我们从整个用户群中招募参与者,包括企业和消费者用户、团体和个人。浏览和搜索过程被严格测试,但支付、账户管理、电子邮件信息和忠诚度计划也是如此。这项研究还包括对竞争对手应用程序的访问,以便用户能够识别他们喜欢的领域,并在重新设计中加以参考。

这项研究是在一个研究机构中进行的,因为客户希望听到第一手的反馈意见,但是这个阶段的研究在用户家中进行也是很常见的,就像我们为一家保险比较公司在重新设计之前所做的那样,或者在客户的办公室或会议室进行。一般来说,决定权在于成本、是否能在办公室外呆上几天以及用户的位置。会议视频总是被提供(由我们免费提供),所以即使你不能参加,你仍然能够看到发生了什么。

过程设计测试

流程设计测试在任何交互式媒介创建之前进行,以确保工作流程和流程步骤支持预期的用户互动。它涉及到用户参加一对一的定性研究会议,并与为代表流程或旅程的每个方面而创建的彩色编码流程卡进行互动。

为研究做准备

流程测试的方法与用于可用性测试的方法非常相似,都有核心要素。

  • 测试资产
  • 参与者
  • 研究的地点
  • 准备、调制、分析和报告。

最大的 差异 在过程测试中,必须创建测试资产,而报告通常是以修改过程设计的形式进行。

流程设计可以以用户旅程图、用例工作流程、流程图等形式交付给我们。这些资产解释了流程将如何工作,可能的互动,错误路径,替代流程,成功标准等等。但是,它们不能以这种形式摆在用户面前,因为它们只会让用户感到困惑。

流程卡。

我们采取的方法是开发彩色编码的流程卡,代表流程中的不同属性。

最近的一个项目包括以下卡片类型。

通常的情况是,仅在这个阶段就会抛出一些问题和流程上的遗漏,而这些问题和遗漏可以在用户测试发生之前得到纠正。出于这个原因,我们建议在项目中为这个阶段留出额外的时间,以经历几轮的 迭代。

进行测试

如果你在研究机构的观察室里观察过可用性测试,你已经对过程测试的情况有了相当好的了解。参与者是根据目标用户特征(persona)招募的,他们自己参加一个45到60分钟的会议,并由一位高级用户体验顾问主持。在他们坐下后,通过一些开场问题让他们感到放松,我们开始进行过程测试。

每套流程卡代表一个用户旅程或子旅程,其中的第一张卡是用户故事。参与者被递给用户故事卡,并被要求阅读它。卡片上可能写着这样的内容。

- 你想登录你的网上银行账户

  • 你搜索bank.co.uk来查看你的账户,然后点击进入登录界面。
  • 你无法记住你的登录信息,网站建议你联系支持部门。

你将如何进行?

用户在卡片上会有一些选择,这些选择会通过相关的卡片导致不同的流程路线。

我们的研究目标是了解这个过程是否支持用户希望以自然的方式进行互动的方式.通过观察他们的行为,倾听他们口头表达的思维过程和反馈,我们可以完善和优化这些过程。

分享研究结果

分享过程测试结果的最佳方式是提供 修订流程图或流程 作为主要的可交付成果。A 报告 提供叙述,说明为什么该过程已经改变或被改变的方式。它将采取每个过程中的每一个步骤,并确定哪些是有效的,哪些是无效的,以及它需要如何改变或调整。

这些可交付的成果将告知我们应该如何设计线框或原型以支持用户的旅程和过程。

可用性比较测试

当有一个以上的原型设计方案需要评估的时候,就会进行比较性的原型测试。这发生在设计团队为一个特定的用例或需求提出了不止一个解决方案的时候。用户测试是确定应该选择哪种方法的方式之一。

平衡。

为了确保对多个原型的评估是无偏见的,我们使用了一种叫做平衡的方法。我们不是让每个用户以相同的顺序与原型互动,即原型 "a",原型 "b",然后是 "c",以此类推,而是交替进行,使每个原型以相同的次数和顺序互动。

以下是一个真实的测试协议,来自一个项目,其中有 三个原型版本 (两个只在智能手机上)和三个平台上。

 日子/参与人  桌面               碑文                   智能手机             
 第1天  录像:Vs1 ǞǞǞ  ǞǞǞ  录像:Vs1  ǞǞǞ  ǞǞǞ   录像:Vs1  ǞǞǞ
 1  第一届 第2次   第三届  第六届  第五届  第四届    
 2  第2次  第三届  第一届  第四届  第六届  第五届    
 3  第三届  第一届 第2次   第五届  第四届  第六届    
 4        第一届  第2次  第三届  第五届  第四届
 5        第2次  第三届  第一届  第五届  第四届
 6     第三届 第一届  第2次  第四届 第五届 
 第2天  录像:Vs1 ǞǞǞ ǞǞǞ 录像:Vs1  ǞǞǞ  ǞǞǞ  录像:Vs1  ǞǞǞ
1  第五届  第四届 第三届         第一届  第2次
2 第三届 第五届 第四届 第2次 第一届
3 第四届 第三届 第五届 第一届 第2次
4 第一届 第2次 第三届 第五届 第四届 第三届
5 第一届 第2次 第三届 第五届 第四届
6 第五届 第四届 第三届 第一届 第2次

                                                 测试协议示例

这种类型的测试有赖于主持人有条不紊的组织和良好的笔记,除了主持人之外,有一个记录员来记录版本和顺序是非常有用的。

基准评估

基准评估是指我们将一个原型与现有的替代品进行评估。我们所做的项目包括只有现场的网站或现场的网站加上竞争对手。目的是评估开发中的原型是否解决了现场的任何感知上的不足,或与竞争对手一样好。

开展评价工作

ǞǞǞ 测试设置 这是很简单的,因为要使用的任务和场景在原型和现场都是相同的。我们将使用一种反平衡的方法,以确保消除任何偏见,并使现场和原型版本在第一和第二时间看到相同的次数。

参与者将与每个人互动,一个接一个地尝试相同的任务并提供 口头反馈加观察行为.

进行比较的标准需要经过深思熟虑,任务和测试方案也要相应地规划。参与者不可能总是从原型到实际情况的飞跃,因此他们的反馈可能是基于不公平的判断。

如果我们准备得很好,就可以忽略这些,把注意力放在关键领域,如。

  • 互动性
  • 用户旅程
  • 特征的功能 

这些将成为 基准和打分/报告格式 我们已经与你达成一致。

案例研究。

我们的一个酒店客户正在开发一个新的应用程序,并要求我们对开发中的原型应用程序与现有的实时应用程序进行基准评估。我们使用了平衡法,以确保6名参与者按照1:2的顺序平等地与原型和实时应用程序进行互动。交付的成果包括一个详细的现场与原型的优点和缺点的比较基准。

心中有一个项目吗?