跳过正文
hci速记-2025-12-30T16:30:15+08:00

hci速记-2025-12-30T16:30:15+08:00

·13909 字·28 分钟· loading · loading · ·
StudyBase 笔记 人机交互 谁有多余往年卷?
目录
考前复习-hci - 这篇文章属于一个选集。
§ 0: 本文

1人机交互概述
#

(2:34) 在第一部分,交互概述部分, (2:38) 我们当然学了一个学期, (2:40) 你首先得知道人际交互是什么。 (2:43) 什么是人际交互? (2:45) 我上午的时候有个同学不讲, (2:47) 我们有一年的时候就考大家有一道填空题。 (2:50) 我们去年没有填空题, (2:52) 但是今年有没有还不知道,也说不定会有。 (2:56) 填空题当时就让大家填人际交互的英文全称是什么。 (3:02) 这就是我本来是说是送分的题目, (3:05) 但是真的有将近,我印象中不说多了, (3:08) 至少有20%的同学这两分是没有拿到。 (3:13) 我觉得这个就有点不应该了。 (3:18) 你得去理解,这个不一定会考, (3:21) 但是我觉得学过了之后你得知道, (3:24) 人际交互,用户体验,交互设计, (3:27) 包括我们还讲到的可用性, (3:29) 它们之间到底是个什么关系。 (3:31) 其实在第一部分大家可以看PPT内容还蛮多的, (3:35) 但是其实你自己看的时候, (3:38) 适合拿来考试的东西不多, (3:40) 我们也举了大量的例子, (3:42) 目的是让大家去界定一下, (3:44) 人际交互到底什么工作属于人际交互的研究范畴。 (3:49) 希望大家去理解这么一件事情。 (3:58) 后面我们给出的是一些实践当中常用的东西。 (4:03) 然后就是交互的重要性, (4:08) 这些都很简单的概念性的问题。 (4:12) 概念性的问题可能考吗?可能会考, (4:15) 但是就像刚才前面看到的那个选择题一样, (4:21) 都是比较简单的。

术语
#

  • HCI:Human-Computer Interaction(人机交互)
    • 定义:是一门涉及交互式计算系统的设计、评估和实施,以及围绕这些现象进行研究的学科。
  • UCD: User-Centered Design(以用户为中心的设计)
    • 核心:以用户需求为核心,在开发的每一个阶段都让用户参与。
  • UX:User Experience(用户体验)

HCI 的核心逻辑:解决“最后一公里”
#

效率 ➡ 体验: 以前的 HCI 关注的是怎么让机器跑得快(效率),现在的 HCI 关注的是怎么让人用得舒服(体验)。

角色转变 过去的交互对象:热爱技术的专业人员 。 现在的交互对象:缺乏耐心的消费者

核心术语辨析:这几个词的区别
#

Usability(可用性):偏客观指标。包括易学性、效率、易记性、少出错。 UX(用户体验):偏主观感受。包括愉悦感、成就感、满意度。 关系:可用性是用户体验的基础,但光有可用性不代表用户体验好(比如一个计算器很好用,但长得巨丑,UX 就一般)。

为什么要学 HCI?
#

  • 市场 角度:用户对低劣设计的容忍度降低。
  • 企业 角度:提高员工生产效率,降低开发和后续支持成本。
  • 用户 角度:减少时间、金钱损失,甚至减少生命损失
  1. 请写出 HCI 和 UCD 的英文全称。
  2. 在可用性(Usability)和用户体验(UX)中,哪一个是偏向主观感受的?
  3. 根据 PPT 1 第 21 页,对于企业来说,良好的 HCI 设计可以降低哪两类成本?

2人机交互历史
#

(4:22) 然后在人际交互历史部分, (4:25) 你至少学完了之后你能够理解, (4:27) 人际交互的历史是什么样子的, (4:29) 分为几个阶段。 (4:31) 自己是不是能够想起来, (4:33) 每个阶段当中, (4:34) 其实这个跟我们后面介绍到的那种不同的界面的类型, (4:40) 大家可以对照着去看, (4:41) 各种不同的界面形式, (4:43) 它有什么样子的优缺点。 (4:51) 历史部分, (4:52) 基本上你知道交互的几个发展阶段各自有什么优缺点, (4:56) 其实这部分也就没有了。 (4:59)

为什么要学习历史?
#

新的界面变革包含了上一代界面(比如现在的图形界面里依然可以打开命令行窗口),旧的交互方式仍有其存在的必要性,因为以前的用户从未消失,特定场景下旧方式更高效。

交互发展的四个主要阶段
#

  1. 批处理阶段 (Batch Processing) —— 40-50年代
  2. 联机终端/命令行时代 (CLI - Command Line Interface) —— 60-70年代
    • 优点是专家用户效率极高 ,缺点是“依赖回忆”,对新手不友好,必须记忆很多指令与细节用法
  3. 图形用户界面时期 (GUI / WIMP) —— 80年代至今
    • WIMP: Windows (窗口)Icons (图标)Menus (菜单)Pointing Device (指点设备/鼠标)
    • 主要特征:直接操纵(Direct Manipulation)
    • 最大特点/优点是:(某个启发式原则)依赖识别而非记忆
  4. 天然交互/多通道交互界面 (NUI - Natural User Interface) —— 未来
    • 举例子?语音交互、手势交互(Kinect)、脑机交互(BCI)
界面类型代表技术用户记忆负担学习成本灵活性/效率
命令行 (CLI)命令符、快捷键极高 (靠回忆)高 (对专家)
图形界面 (GUI)图标、菜单、鼠标 (靠识别)中 (适合大众)
自然交互 (NUI)语音、手势、眼动极低 (靠本能)极低不稳定 (目前阶段)

神人录
#

  • Vannevar Bush :提出 Memex 工作站概念。他是“超文本之父”,预言了 PC 和 Web 的出现。
  • Ivan Sutherland :开发了 SketchPad (1963):第一个交互式绘图系统。被称为“计算机图形学之父”。开发了第一个虚拟头盔(VR 的祖师爷)。
  • Douglas Engelbart :发明了鼠标 (1964)。演示了第一个标准化的编辑器 NLS。
  • Alan Kay 提出 Dynabook:这是现代笔记本电脑的原型。名言:“每个人都想拥有自己的 PC,就像每个人都想拥有自己的汽车”。
  • Mark Weiser 提出 普适计算 (Ubiquitous/Pervasive Computing):电脑应该嵌入到所有设备中,让人感觉不到电脑的存在。

经典商业系统的更迭(了解即可,防选择题)
#

  • Xerox Alto (1973): 第一台真正意义上的个人计算机(有键盘、显示器、图形界面、以太网)。
  • Xerox Star (1981) :第一个基于可用性工程设计的商用图形界面系统。
  • Apple Lisa (1982) :概念成功,商业失败(太贵)。
  • Apple Macintosh (1984) :第一个获得巨大商业成功的 GUI 电脑。
  • VisiCalc :电子表格软件,是 PC 的“杀手级应用”(让非技术用户觉得电脑有用)。

小测:
#

  1. WIMP 的四个字母分别代表什么?(中文或英文皆可)
  2. 图形用户界面 (GUI) 相比命令行界面 (CLI) 的最大优势是什么?(请用“记忆”相关的术语回答)
  3. 谁发明了鼠标?
  4. 谁提出了“普适计算”的概念?

3交互设计的原则和目标
#

交互框架与EEC
#

第三部分内容稍微多一点点, (5:03) 或者是作为我们的一个重点, (5:05) 交互设计的原则和目标。 (5:08) 我们其实一上来的时候, (5:10) 先给大家介绍了一个叫做交互框架的东西, (5:14) 我们在课程过程当中, (5:16) 其实也很多次的跟大家去讨论这个框架, (5:19) 我们说它很好的帮助我们回答了, (5:22) 为什么产品会变得不好用, (5:25) 为什么某个界面或者是软件产品不好用, (5:29) 它的根本原因是什么。

交互框架的定义与作用:交互框架提供了理解或定义某种事物的一种结构,用来帮助设计者结构化设计过程,让其发现设计中的主要问题(到底是在哪个环节让用户卡住了)。

交互框架的模型:EEC(全称:Execution/Evaluation Cycle )模型,是Norman 做的

七个阶段

最初阶段:

  • 第 1 步:形成目标 (Goal) —— “我想看书”。

执行阶段 (Execution):

  • 第 2 步:形成意图 (Intention) —— “我要打开那个台灯”
  • 第 3 步:动作制定 (Specifying an action) —— “我需要伸手去按灯座上的按钮”。
  • 第 4 步:动作执行 (Execution) —— 实际按下去。

评估阶段 (Evaluation):

  • 第 5 步:感知系统状态 (Perceiving the state of the world) —— 看到灯光亮了没?
  • 第 6 步:解释系统状态 (Interpreting the state of the world) —— “灯亮了,这代表有电了”。
  • 第 7 步:评估结果 (Evaluating the outcome) —— “现在亮度够了,我可以开始看书了”。

目标与意图的区别目标 (Goal):是最终想达到的状态(比如:把文件删了)。意图 (Intention):是达到目标的具体方式(比如:右键点击删除,还是按 Delete 键)。一个目标可以对应多个意图!

执行隔阂与评估隔阂

执行隔阂是指用户想要执行的动作,与系统允许的动作之间的差别 ——我想做这个操作,但我不知道怎么下手,或者系统把按钮藏得太深:我想把文件存成 PDF,但我在“文件”菜单里找了半天也没看到“导出”按钮;

评估隔阂是指系统状态的实际表现,与用户预期之间的差别 ——我操作完了,系统没给我反应,或者反馈太模糊,我不知道成功没有。比如,我点击了“保存”,但屏幕上什么提示也没有,进度条也没动。我不知道到底保存成功了没,这就是巨大的评估隔阂。

扩展EEC模型

“扩展”之处在于除了用户的心理和动作过程,把系统也拉进来

四个部分:

  1. 用户 (User) —— 任务语言。
  2. 输入 (Input) —— 输入语言。
  3. 系统 (System) —— 内核语言。
  4. 输出 (Output) —— 输出语言。

核心逻辑: 交互就是在这四者之间进行翻译

  • **Articulation (表达)** :用户把想法转为输入动作。
  • **Performance (执行)** :输入传给系统执行。
  • **Presentation (表现)** :系统把结果传给输出设备。
  • **Observation (观察)** :用户观察输出并理解。

可用性指标
#

(5:31) 我们也讨论了什么是可用性, (5:34) 课后的时候有同学问我, (5:36) 说老师我可用性, (5:37) 因为这个里头我们是不包括主观满意度的, (5:40) 但是我们前段的时候可能介绍到了, (5:43) 我们说也有的可用性目标里头, (5:45) 会把其中一个维度作为用户的主观满意度, (5:49) 有同学问说老师这个主观满意度和我们后面的用户体验, (5:53) 有什么区别吗? (5:56) 其实这个问题也还蛮好的, (5:57) 大家可以这么去理解, (5:59) 当我们讲在可用性里头去讨论主观满意度的时候, (6:06) 它就是一个问题, (6:08) 你对这个系统的主观满意度到底是多少, (6:11) 然后你给它打个分, (6:12) 这一般是可用性里面我要去度量主观满意度的时候是这种方式, (6:17) 但是如果到了用户体验里头, (6:19) 我度量的所有的其实主要都集中在主观的反馈上面的时候, (6:26) 我就可能包含你是不是觉得这个系统比较容易使用, (6:31) 你是不是觉得用这个系统的时候过程比较愉悦, (6:34) 你是不是觉得使用这个系统有比较高的成就感等等, (6:38) 所以它的主观满意度就是一系列方方面面的很多个维度, (6:43) 但是在可用性里面的时候, (6:45) 我们一般讲主观满意度的时候, (6:47) 它就是变成一个维度了, (6:49) 但是当然这也要去体会一点, (6:52) 我们课堂上面强制的把客观的分为了可用性, (6:56) 把主观的分为了用户体验, (6:59) 但现实当中我们也会经常讨论, (7:02) 我要验证这个产品的可用性, (7:04) 其实当你说你要去验证它的可用性的时候, (7:09) 你不仅仅有客观,你也有主观, (7:11) 那其他学科的老师去讨论说我要讨论它的可用性的时候, (7:15) 同样的我除了主观也会有客观, (7:18) 或者换句话讲, (7:19) 在实际当中大家也经常把这两个概词混着用, (7:23) 就和人际交互和用户体验也是一样的。

——老师对可用性中的主观满意度和用户体验中的满意度的区别的解释

  1. 易学性 (Learnability) :用户第一次用,上手有多快?(PPT 提到的“10分钟法则”)。
  2. 高效率 (Efficiency) :用户学会之后,执行任务的速度快不快?(达到性能平坦期)。
  3. 易记性 (Memorability) :用户隔一段时间没用,再次操作时还记不记得怎么用?(依赖识别而非记忆)。
  4. 少出错 (Errors/Safety) :系统应该尽可能防止用户犯错;犯错后应该容易恢复。
  5. 主观满意度 (Satisfaction) :用户用得舒不舒服?(这是可用性中唯一的感性指标)。

可用性与用户体验目标UX Goals

  • 对比: 可用性关注的是“任务完成得好不好”;用户体验关注的是“用户心里爽不爽”。
  • 矛盾性:有时可用性和用户体验是冲突的。 例子:打地鼠游戏。如果为了“可用性”,应该按一个键就打死所有地鼠(高效率),但这就没意思了。用户追求的是挑战感,这违反了可用性的“效率”,却提升了用户体验。
  • 超越可用性:有些设计叫Dark Pattern(黑暗模式) 。比如:故意把注销按钮藏起来。这可能对企业有益,但用户体验极差。

简易可用性工程
#

(7:31) 然后后面的时候我们讲到这个简易可用性工程, (7:35) 简易可用性工程里面这四个技术, (7:38) 你应该了解一下, (7:39) 特别我们花了比较多的时间和精力去讲后面这两个技术, (7:44) 我们包括,其实这个边做边说, (7:47) 还有我们的启发式评估, (7:49) 其实应该是大家都要去实际掌握的, (7:53) 我们课堂上也做过这样的小的练习, (7:55) 特别是边做边说, (7:57) 启发式评估可能没有来得及, (7:59) 你大概知道它们分别是什么, (8:01) 它们用在什么样的场合, (8:03) 为什么要使用, (8:04) 学任何一个技术的时候除非都是这几个方面

  1. 用户和任务观察 :直接看用户怎么操作。记住准则:“你”不是用户!
  2. 场景 (Scenario) :通过写故事的方式描述用户如何使用产品。
  3. 边做边说法 (Thinking Aloud)
    • 核心:让用户在操作时,把脑子里想的东西全部说出来
    • 地位:最有价值的单个可用性工程方法
  4. 启发式评估 (Heuristic Evaluation)
    • 核心:请专家根据一套设计准则(见下文)来给界面找茬。
    • 数字:5 名专家可以发现约80 %的可用性问题。专家再多,性价比就低了。

设计原则(启发式设计原则,十条必背)
#

(8:08) 然后包括我们介绍了所谓的设计原则, (8:12) 我们重点学的是十条启发式的规则, (8:18) 但是我们曾经考过什么呢, (8:20) 就刚才大家看到去年的试卷上头, (8:23) 我们是给大家一个界面原型, (8:25) 然后让你去用这些原则去解释一下, (8:29) 它里面哪些地方做的可能是跟我们原则相悖的, (8:33) 我们以前还考过什么呢, (8:35) 考过选择题, (8:36) 比如说我从这个黄金规则里头挑一条, (8:39) 然后我问你, (8:40) 它对应的可能是我们的十条启发式规则里头的哪一个, (8:45) 或者反过来给你这个, (8:46) 问你在黄金规则里头可能对应的是哪一个, (8:49) 也就是这个几种共同原则之间的对应关系。

  1. 系统状态的可见度 (Visibility of status) :系统应该随时告诉用户正在干嘛(比如:进度条、上传成功的提示)。
  2. 系统和现实世界的吻合 (Match between system and real world) :用人话,不用代码;用现实中存在的图标(比如:回收站图标)。
  3. 用户享有控制权和自主权 (User control and freedom) :支持撤销、重做;点错了能轻易退回来。
  4. 一致性和标准化 (Consistency and standards) :同一个功能,在不同页面的位置和图标应该一样。
  5. 避免出错 (Error prevention) :比起出错后给提示,更高级的是不让用户犯错(比如:日期选择器,而不是让用户手打日期)。
  6. 依赖识别而非记忆 (Recognition rather than recall) :把功能摆在台面上。
  7. 使用的灵活性和高效性 (Flexibility and efficiency of use) :为专家提供快捷键,为新手提供引导。
  8. 审美感和最小化设计 (Aesthetic and minimalist design) :不要放没用的信息。
  9. 帮助用户识别、诊断和恢复错误 (Help users recognize, diagnose, and recover from errors) :报错信息要具体,并给出解决方案。
  10. 帮助和文档 (Help and documentation) :即使系统再好,也得备个说明书。

黄金规则自己看罢(

  1. 尽可能保证一致
  2. 符合普遍可用性
  3. 提供信息丰富的反馈
  4. 设计说明对话框以生成结束信息
  5. 预防并处理错误
  6. 让操作容易撤销
  7. 支持内部控制点
  8. 减轻短时记忆负担

4 评估
#

(9:02) 然后就进入了我们评估部分的内容, (9:05) 评估我们说了, (9:06) 其实这部分能考的地方就比较多, (9:09) 因为它的那些, (9:10) 首先就是评估范型, (9:12) 就四大类, (9:13) 四大类分别是什么, (9:15) 同样有什么特点, (9:16) 用在什么场合, (9:18) 然后呢, (9:19) 后面我们又花时间介绍了所谓的观察呀, (9:24) 是吧, (9:25) 我们的观察, (9:26) 我们的询问, (9:27) 我们的用户测试, (9:28) 我们还展开了这么几个小的篇幅, (9:31) 所以在这里边去抽一个小题啊什么东西还是比较容易的

评估的分类,从时机上讲:
#

  • 形成性评估 (Formative Evaluation) :在设计初期/过程中进行,目的是改进设计(如检查草图、故事板)。
  • 总结性评估 (Summative Evaluation) :在产品完成后进行,目的是衡量产品是否达到了预期目标。

评估的范型
#

  1. 快速评估 (Quick Evaluation):
    • 特点:任何阶段都能做,强调“快”,数据是非正式的、叙述性的。
    • 场景:设计初期看用户对图标的反应。
  2. 可用性测试 (Usability Testing):
    • 特点:20世纪80年代的主导方法。在实验室由开发人员控制,量化数据(出错率、时间)。
    • 缺点:测试用户少,不适合深度统计分析。
  3. 实地研究 (Field Research):
    • 特点:在自然环境中进行。目的是理解用户在真实场景下的表现。
    • 场景:探索新技术的应用契机;对儿童等沟通有问题的用户
  4. 预测性评估 (Predictive Evaluation):
    • 特点:用户不在场。由专家通过模型(GOMS/KLM)或经验进行预测。
    • 优点:成本最低,速度最快。

DECIDE 评估框架
#

decide是指:determine, explore, choose, identify, decide, evaluate

  1. Determine(确定目标):为什么要评估?(如:比较两个菜单哪个好)。
  2. Explore(发掘问题):要回答的具体问题是什么?(如:用户能 5 秒内找到保存键吗?)。
  3. Choose(选择范型和技术):用测试法还是观察法?
  4. Identify(标识实际问题):找什么样的用户?需要多少钱?
  5. Decide(决定道德问题):签署协议书 (IRB),保护隐私,告知随时可以退出。
  6. Evaluate(评估、解释并表达):怎么分析数据?

观察
#

老师提到的“边做边说”其实属于观察法的一种变体。 直接观察:观察者在场。 挑战:霍桑效应(用户因为被看着而表现得不自然)。 间接观察:通过日志、视频录制。 优点:适合用户分散的情况,体现真实任务过程。 观察框架:Goetz and Lecomfte/Robson Robson 框架关注空间、行为者、活动、物体、目标、感觉。

实验室观察和现场观察

询问用户
#

两种方法:访谈 (Interview) 与 问卷 (Questionnaire)

访谈的指导原则:

  • 避免过长的问题。
  • 避免使用复合句。
  • 避免专业术语
  • 避免诱导性问题(如:你为什么觉得这个颜色好看?→ 默认用户觉得好看,这不对)。

问卷设计的原则:跟访谈感觉没差多少……实现细节之类的指导:

  • 对于征求用户意见的问题,应提供一个“无看法”
  • 在可能时,采用封闭式问题并提供充分的答案选项
  • 注意提问次序,先提出一般化问题,再提出具体问题
  • 在使用等级标度时,应设定适当的等级范围,并确保它们不重叠
  • 明确说明如何完成问卷

QUIS 调查表:由 Ben Shneiderman 开发,专门测满意度。

询问专家:认知走查 (Cognitive Walkthrough)
#

  • 具体方式:专家把自己当成“小白用户”,边走流程边自述。

  • 核心目标:评估系统的易学习性 (Learnability)。

  • 专家需要问自己 3 个核心问题——可预见性 :正确动作对用户明显吗?用户知道下一步该点哪吗?可理解性 :用户能注意到正确操作吗?(比如按钮有没有被看到)。可解释性 :用户点完之后,能理解反馈吗?

询问专家:启发式评估 (Heuristic Evaluation)
#

  • 具体方式:专家根据“十项启发式原则”(咱们昨天刚背过)来找茬。

  • 评估流程(4步):彻底检查界面。与原则对比。列出可用性问题。解释为什么违背原则。

  • 严重性分级:

    • 0 -不是问题。
    • 1 -表面问题(不一定要改)。
    • 2 -轻微问题(优先级低)。
    • 3 -主要问题(严重,必须改)。
    • 4 -可用性灾难(发布前必须修正)。

如何区分认知走查和启发式评估?

认知走查侧重逻辑链条,像讲故事一样,看用户能不能走通流程(专注易学习性);启发式评估侧重准则检查,像拿着清单对账,看哪里违背了设计原则。

5 交互式系统的需求
#

(10:25) 然后是, (10:31) 然后就到了我们的需求部分, (10:34) 需求部分我们重点介绍的其实是两个技术, (10:38) 一个是人物角色, (10:39) 一个是场景, (10:42) 我们讲本身这个其实是实践当中, (10:45) 大家应该用的会比较多的, (10:47) 就像我们大作业的时候, (10:49) 大家去拍视频, (10:50) 其实体现的就是人物角色和场景, (10:54) 往常的时候, (10:56) 往年好像考过选择题, (11:01) 点答题有没有考过, (11:03) 有点不记得了, (11:04) 反正你把这两项技术, (11:06) 然后重点的去理解一下, (11:07) 比如说什么是人物角色呀, (11:09) 然后人物角色构造的时候要注意什么呀, (11:13) 人物角色为什么需要人物角色呀, (11:15) 类似的这种,

用户分类
#

  • 新手用户 (Novice) : 敏感、易有挫折感。设计要求:不能把新手状态作为目标,要提供向导式帮助。
  • 专家用户 (Expert) : 欣赏强大功能,不耐受复杂性干扰。设计要求:快速访问(快捷键),专家说不好就是不好(影响力大)。
  • 中间用户 (Intermediate) —— 重点:
    • 地位:数目最多、最稳定、最重要,但往往被程序员忽略。
    • 设计目标:让新手无痛成为中间用户;让中间用户感到愉快。
    • 习惯用法:工具提示 (Tooltip) 是适合他们的最好方法。

人物角色
#

人物角色不是真实的人,也不能说是“编造出来的”;而是基于观察到的真实行为数据形成的综合原型

人物角色解决了三个问题:

  1. 弹性用户 (Elastic User) : 避免开发者根据自己的意愿随意改变“用户”的定义(比如一会儿觉得用户是专家,一会儿觉得是小白)。
  2. 自参考设计 (Self-Referential Design) : 避免设计者把自己的目标和技巧投射到产品上(“我觉得好用”不代表用户觉得好用)
  3. 边缘情况设计 (Edge Cases) : 必须考虑,但不应作为关注点。

人物角色构造方法:拼凑 -> 组织 -> 细节 -> 求精(循环反复)。

需求获取的其他手段
#

  • 直接观察 vs 间接观察: 直接观察可能干扰用户;间接观察(录像)让观察者更舒适。
  • 场景 (Scenario): 一种“非正式的叙述性描述”,也就是讲故事
    • 特点: 广而浅,不涉及具体技术细节(PPT P46)。
      • 作用: 从故事中发掘任务的上下文环境。

6 交互式系统的设计
#

(11:32) 然后到了交互设计部分的内容, …… (12:02) 它这里头也会有一些小的内容, (12:05) 比如怎么减轻用户的记忆负担啦, (12:08) 怎么样子保证输错信息设计的是合理的呀, (12:12) 然后重点是后面的所谓的简化设计的策略, (12:18) 我们介绍了几种不同的简化设计的策略, (12:22) 然后每一种应用在什么样的场合, (12:26) 其实稍微结合着经验, (12:29) 这个也好分, (12:30) 我们也考过选择题

简化设计的四大策略
#

1.删除 (Remove) —— 最明显的简化方法
#

  • 高分答题点(如何删除):
    • 关注核心:改进基本功能比增加新功能更有价值。
    • 砍掉残缺功能:避免“沉没成本误区”,不要因为花了精力做就舍不得删。
    • 删除视觉混乱:提高**“数据墨水率”**,减少不必要的线条、颜色和阴影。
    • 删减文字:删除引见性文字(如“欢迎光临我们的网站”)、不必要的说明和繁琐的解释。

2.组织 (Organize) —— 最快捷的简化方法
#

  • 常用手段:
    • 分块 (Chunking):利用 7±2 法则。
    • 明确的分类标准:按字母、时间或空间顺序排列(名词组织);按工作流/步骤(动词组织)。
    • 利用网格和对齐:让界面在视觉上显得平衡(PPT P71)。
    • 大小和位置:重要元素大,次要元素小。

3.隐藏 (Hide) —— 低成本的简化方案
#

  • 核心逻辑:用户不会因为不常用的功能而分心。
  • 隐藏什么?:
    • 主流用户很少用,但专家需要的高级功能。
    • 繁琐的细节(如服务器配置、邮件签名)。
    • 特定于地区的信息。
  • 术语:渐进展示 (Progressive Disclosure) :先给核心功能,点击“高级”或“更多”后再展开。

4.转移 (Displace)
#

  • 把复杂性转移到最适合处理它的设备上。
  • **应用场景:
    • 设备间转移:手机录数据(便携),网站查细节(大屏幕)。例如运动APP RunKeeper。
    • 向用户转移:把一些原本由电脑规划的东西留给用户自己DIY,因为用户更了解自己的灵活需求。
    • 电脑擅长 vs 人擅长:电脑擅长精确计算、存储、执行程序;人擅长设定目标、估算、想象。

人性化软件设计
#

  1. 加快响应速度(利用空闲时间)
    • CPU 等待时别闲着。例如 Mac OS 的 Spotlight 在系统空闲时索引硬盘。
  2. 减轻记忆负担
    • 好的软件会回忆用户的上次行为。例如:自动填入上次的文件夹路径。
  3. 减少等待感(心理建设)
    • 进度条:让用户了解进度。
    • 渐进式呈现:先传全局概括(模糊图),再传细节(清晰图)。
    • 分散注意力:给用户点小任务做。
  4. 设计好的出错信息 四个原则:
    • ① 使用清晰的语言(不准用代码)。
    • ② 精炼准确(不准空泛)。
    • ③ 提供建设性帮助(告诉用户现在该怎么办)。
    • ④ 语气友好(不准威胁或责备用户)。

7 交互式系统的基础知识
#

(12:44) 然后就是我们去理解了人的信息处理过程, (12:51) 当然在这部分重点就是我们这个大头娃娃模型, (12:55) 因为它是我们后面也提了很多次, (12:59) 包括我们的预测模型, (13:01) 我们的GOMS模型也是以它为基础的, (13:04) 那它是个什么东西, (13:07) 包括我们后面提到了格式塔心理学, (13:10) 格式塔心理学里面的有哪些原则, (13:14) 分别怎么去指导我们的交互设计, (13:25) 然后还有就是我们的记忆, (13:27) 记忆这个地方也有一些便于考试的点, (13:32) 记忆的三个阶段, (13:34) 每个阶段有什么特点, (13:40) 刚才我们说最后这部分的话, (13:42) 大家可以对照着交互的发展历史, (13:45) 一起来看一下,

人类处理机模型
#

  • 三种记忆:感觉记忆,工作记忆和长时记忆
  • 三大子系统/处理器/交互式组件:感知处理器,认知处理器,动作处理器

信息从感知处理器 的存储进入工作记忆 认知处理器 结合长时记忆 的信息做出决定,最后通过动作处理器 执行。

模型的局限性:它把认知看作串行执行(一步步来),但实际上人可以并行处理;忽略了环境因素和其他人的影响。 由此引申出了:外部认知模型和分布式认知模型。

格式塔心理学
#

人眼感知事物时,总是尽可能将其视为一个“好”的整体,而不是孤立的部分。

五大原则:

  • 相近性 (Proximity) :空间上靠近的物体容易被视为一类。 应用:相关的按钮(如“提交”和“取消”)应该放在一起,通过留白来划分组(PPT P9)。
  • 相似性 (Similarity) :长得像的物体被视为一类。 应用:功能相近的组件(如所有的“保存”按钮)应保持相同的颜色和形状(PPT P11)。
  • 连续性 (Continuity) :人眼倾向于沿着平滑的路径看。 应用:对齐(左对齐或水平对齐)能让界面更清晰(PPT P14)。
  • 对称性 (Symmetry) :相互对称的物体会被组合成一个单元(PPT P15)。
  • 完整性/闭合性 (Closure) :即使有缺口,人脑也会自动脑补成闭合形状。 应用:那个由缺口圆组成的三角形,或者熊猫 Logo(PPT P16)。

菲茨定律
#

(15:50) 然后Fitz定律, (15:52) 同学也问了, (15:53) 老师, (15:54) 还有同学问我, (15:55) 老师为什么这个里头的这个D跟那个P不一样, (15:58) 我说这一听就是没上课的, (16:00) 我们上课的时候解释了半天, (16:02) 就是跟大家讨论, (16:03) 为什么跨线操作和我们光标移动的操作有啥区别, (16:08) 本质上是没什么区别的, (16:10) 但它为了能够让你去预测任务的时间, (16:13) 所以在这里头的P给你了一个固定的值, (16:16) 但我们学过了Fitz定律, (16:17) 你就应该知道, (16:18) 这个值应该是和你移动的距离, (16:21) 和你到它的这个, (16:23) 和目标的这个大小, (16:25) 还有你到目标的这个距离是相关的, (16:28) 也就是这个1.1, (16:29) 其实本身它不应该是个定值, (16:32) 它是根据你的那个任务特定相关的, (16:35) 但是这里头我们都给它取了一个定值, (16:41) 然后Fitz定律的话, (16:42) 那你就应该了解, (16:44) 首先这两个都是预测模型, (16:46) Fitz定律和基建层次模型, (16:47) 那这两个预测的也都是时间, (16:49) 但是它们的时间又是不一样的, (16:51) 它们分别就是预测的任务有什么区别, (16:55) 然后包括Fitz定律能够告诉我们, (16:58) 对我们交互设计有什么样子的启发意义, (17:08) 其实这边也就是这个, (17:10) Fitz law是我们今年新加的, (17:12) 就这么一丢丢的内容, (17:16) 应该不会考吧, (17:17) 要考也应该是个很小的题目

公式: \(MT = a + b \log_2(D/W + 1)\)

  • MT:完成移动的时间。
  • D (Distance):距离目标的距离。
  • W (Width):目标的大小(宽度)。

设计启示(简答题必背点):

  1. 大目标、短距离有优势。
  2. 屏幕边缘和角落的价值最高:因为当鼠标移向边缘时,W 可以被视为无限大,移动时间极短(这也是为什么 Mac 菜单栏在顶部、Windows 开始菜单在角落的原因 - PPT P29)。
  3. 饼形菜单 (Pie Menu) 比条形菜单快:因为每个选项到圆心的距离相等,且目标面积大。

五、 希克定律 (Hick’s Law) —— 选择的成本
#

位置:PPT 11, P32-34

公式: \(RT = a + b \log_2(n + 1)\)

  • 结论:一个人拥有的选择越多,做出决定所需的时间就越长。
  • K.I.S.S 原则:Keep it Simple and Straightforward。尽量减少选项。

GOMS
#

  1. 什么是 GOMS?(定义与背景)GOMS 是由 Card, Moran 和 Newell 在 1983 年提出的。它的核心思想是 “分而治之” (Divide and Conquer):把一个复杂的任务像剥洋葱一样,一层层分解,直到变成大脑能处理的最小单元。它基于“大头娃娃” (MHP) 模型:它假设用户是专家,且操作过程中不出错。
  2. 四大核心要素(G-O-M-S 每一个字母都要考)
  • G -Goals (目标) : 用户想要实现什么? 层级性:它有总目标(Goal)和子目标(Sub-goal)。 例子:总目标是“编辑文档”,子目标可能是“删除这段话”。
  • O -Operators (操作符): 用户执行任务的底层动作,不能再分解了。 包括:认知动作(想一下)、感知动作(看一眼屏幕)、物理动作(点一下鼠标)。 注意:这就是后来 KLM 模型重点提取的部分。
  • M -Methods (方法) : 为了达成目标而进行的操作符序列。 例子:删除文本的方法 A 是“选中 -> 按退格键”;方法 B 是“选中 -> 右键 -> 点击剪切”。
  • S -Selection Rules (选择规则) —— 重点考点! 核心逻辑:如果完成一个目标有多种方法,用户会按照什么规则去选? GOMS 认为这种选择不是随机的。 书写格式:通常用 Select: [条件] -> [方法]。 例子:Select: 如果手已经在鼠标上,使用方法 B;如果在键盘上,使用方法 A。

考试如果让你用 GOMS 描述一个任务(比如:在 Word 中删除文本),你不能只写步骤,要写出层级:

Goal: 删除 Word 中的文本

Goal: 选定待删除文本

[Operator: 移动光标]

[Operator: 拖拽鼠标]

Goal: 执行删除动作

Selection Rule:

If (手在键盘上) Use Method: 按 Delete 键

If (手在鼠标上) Use Method: 点击工具栏剪刀图标

以用户为中心的局限性
#

(17:22) 然后最后一部分, (17:23) 我们就是来考虑了一下, (17:25) 学了一学期了, (17:26) 大家在学什么呢, (17:27) 学的是以用户为中心的交互设计, (17:31) 我们当年也考过以用户为中心, (17:34) 让大家去写个英文全称, (17:36) 然后也差不多估计挂掉的同学, (17:40) 比人机交互挂掉的还要再多, (17:43) 你学完了一学期, (17:44) 你就不知道什么叫以用户为中心, (17:50) 我们其实课上也会前前后后讲过很多了, (17:55) 所以上次不是有同学也问我, (17:57) 老师这个课怎么复习, (17:59) 看上去好像内容确实还是蛮碎的, (18:02) 但是其实考来考去, (18:03) 我觉得那个考点不怎么会变化, (18:07) 唯一的活题, (18:08) 其实其他的东西, (18:10) 就是除了那三道大题, (18:12) 然后稍微灵活一点, (18:13) 其他的东西我觉得大家课上听过了之后, (18:16) 基本上甚至于你都不要再去怎么复习, (18:20) 我们也没有什么特别复杂的逻辑, (18:22) 或者是公式什么的, (18:24) 你已经知道了这些事情是这个样子, (18:27) 它就成了一个常识性质的问题, (18:30) 你就去回答就可以了, (18:32) 当然你也要知道以用户为中心, (18:35) 它也有一个局限性, (18:38) 大家去体会一下就行, (18:40) 反正每年好像没有考过, (18:43) 大家以用户为中心这个局限性是什么

  • 样本量小:通常只有 5-12 人,不适合进行大规模的统计推断。
  • 环境人为化:在实验室里用户会紧张,表现不如平时自然。
  • 耗时耗力:需要昂贵的设备和专业的人员观察。

大题部分
#

实验设计
#

(9:36) 另外就是我讲的, (9:38) 我们一定会有一道大题, (9:40) 然后去关于实验的设计, (9:43) 实验设计, (9:44) 你就是前面讲的, (9:47) 你可以结合我们的实证研究的方法, (9:50) 从假设我们变量这个样子去实验, (9:53) 你到底怎么去准备一个实验, (9:55) 你也可以去从我们的这个比赛的评估框架的角度啊, (10:00) 去分析一个实验应该怎么去开展, (10:03) 就这里边其实内容就会比较细一些了, (10:05) 甚至于我现在也想不到到底可能会重点考在哪里了, (10:19) 之后的都是一个例子, (10:22) 大家要注意看一下

这是老师在语音里明说的三大题之一。通常题目会给你一个场景(比如:比较指纹解锁和面部解锁哪个快),让你设计一个实验。你必须按以下“八股文”格式回答才能拿高分。

1. 研究假设 (Hypothesis) —— 逻辑起点(笔记 04, 7.1)
#

必须写出两对假设,且要用 $H_0$ 和 $H_1$:

  • 零假设 ($H_0$):指实验条件没有显著差异(如:两种解锁方式速度一样)。
  • 备择假设 ($H_1$):指实验条件存在显著差异(这是研究者想证明的)。

2. 变量定义 —— 核心加分点(笔记 04, 7.2)
#

  • 自变量 (Independent Variable, IV):你改变的东西。
    • 例子:解锁方式(指纹 vs. 面部)。
  • 因变量 (Dependent Variable, DV):你测量的结果。
    • 例子:解锁耗时(秒)、识别错误率。

3. 实验设计类型 —— 必考选择(笔记 04, 7.8)
#

你必须在方案中明确说明你选哪种:

  • 组间设计 (Between-groups)
    • 做法:A组用指纹,B组用面部。
    • 优点:没有学习效应(不会因为练了指纹解锁而对面部解锁产生干扰)。
    • 缺点:受个体差异影响大(万一A组全是年轻人,B组全是老人呢?);需要的人手多。
  • 组内设计 (Within-groups)
    • 做法:同一个人,先测指纹,再测面部。
    • 优点消除个体差异;节省被试数量。
    • 缺点:存在学习效应疲劳问题

4. 偏置控制:拉丁方设计 (Latin Square) —— 高分杀手锏(笔记 04, 16)
#

如果你选了“组内设计”,为了防止“先做A再做B”产生的顺序影响,必须提到:

  • 平衡处理:一半人先A后B,另一半人先B后A。这种交叉排列的方法统称为拉丁方设计

5. 实验流程与环境(笔记 07, 1.4)
#

  • 环境控制:必须在相同的实验室、相同的光照、相同的设备下进行(控制无关变量)。
  • 规模试验 (Pilot Test):正式实验前先找 1-2 个人跑一遍流程,检查设备是否有坑(笔记 04, 2)。

层次化任务分析
#

  • 什么是 HTA? 把任务分解为子任务,再分解为更细的子任务,最后组织成“执行次序”。
  • 核心逻辑: 调查现有情形,了解人们想要达到什么目标(笔记 9)。
  • 考试必画图(PPT P67):
    • 顶部是“0. 任务名”(如:借书)。
    • 下面一层是“1. 前往图书馆”、“2. 检索图书”、“3. 取书”、“4. 办理手续”。
    • 再下面是子任务的拆解(如 2.1, 2.2)。
  • 必写:“计划 (Plan)” 或 “执行次序”:
    • 这是很多同学丢分的地方!你不仅要画树状图,还要写出逻辑(PPT P65):
    • 例子: 执行次序 0:执行 1-2-3;若图书不在,则执行 2-3-4。 这种逻辑判断是 HTA 的精髓。
  1. 从 ATM 取钱 身份验证 1.1 插入银行卡 1.2 输入密码 设定取款金额 2.1 选择预设金额 或 2.2 手动输入金额 完成取款 3.1 确认并等待吐钞 3.2 取走现金 退卡 执行次序(Plans): Plan 0: 执行 1-2-3-4。若 1 失败,重复 1 超过三次则没收卡片并中止。 Plan 2: 执行 2.1 或 2.2。 Plan 3: 执行 3.1;若余额不足,返回 2;执行 3.2。

击键层次模型
#

(13:49) 然后就是模型和理论, (13:51) 模型和理论这边重点, (13:53) 其实当然就是我们的击键层次模型, (13:56) 刚才说了铁定会考的, (13:57) 怎么样拿着这个表格去预测一个操作对立, (14:02) 上午的时候还有同学来问, (14:04) 老师这个可能, (14:06) 指出了一个问题, (14:07) 我们这确实是好多年都没有同学说, (14:11) 这里面应该是5K, (14:19) 因为这个数有问题, (14:25) 有同学也讲, (14:26) 老师我这个预测的时候有可能跟这个结果不一样吗, (14:30) 是有可能的, (14:31) 因为我们是预测嘛, (14:33) 所以包括你通常来讲, (14:36) 一个任务的时候, (14:37) 你有一些操作你可以拿鼠标去执行, (14:40) 有一些操作你可以拿键盘去执行, (14:42) 这都会导致你预测的结果不对, (14:44) 那其实我们的助教包括, (14:47) 或者是我们给答案的时候, (14:49) 其实都会讲, (14:50) 只要你那个操作串行是合理的, (14:53) 那其实你就可以拿分, (14:56) 助教当然会看到, (14:58) 比如你写了, (14:59) 我现在要去移动光标到某个位置, (15:02) 然后我要选中什么什么东西, (15:04) 其实助教就是把自己当成机器人, (15:06) 然后跑一遍, (15:07) 然后看看你这个过程是不是能够完成这个任务, (15:11) 如果完成的话, (15:12) 那基本上就可以拿分了, (15:14) 否则有明显的错误的时候, (15:16) 其实我们感觉这个问题, (15:19) 大部分的分也都是白送的, (15:20) 但还是会有同学不知道写的是什么, (15:23) 如果你为了担心, (15:26) 那助教有没有看懂我这个步骤怎么办, (15:29) 你也可以像这个样子, (15:31) 就本身我们的基建层次模型, (15:32) 不需要写这个文本的部分内容, (15:35) 如果你比较担心, (15:36) 你就把它的步骤也写上, (15:38) 这个也无所谓, (15:39) 就说一开始手在哪里, (15:41) 然后呢, (15:42) 我现在要再过来我要干嘛, (15:44) 这个都没关系, (15:48) 这个是基建层次模型

KLM 是 GOMS 的简化版,专门用来计算专家用户无错误情况下完成任务的时间(PPT P10)。

1. 操作符及其赋值(必须背下来,PPT P11)
#

  • K (Keystroke):按键或点击。熟练打字员 = 0.22s;普通人 = 0.28s(通常考试用0.28s)。
  • P (Pointing):用鼠标移动光标到目标。赋值 = 1.1s
  • P1 (Click):按下并释放鼠标键。赋值 = 0.2s
  • H (Homing):手在键盘和鼠标之间切换。赋值 = 0.4s
  • M (Mental):心理准备/决策时间(大脑想一下)。赋值 = 1.35s
  • R (Response):系统响应时间。通常为 t(如果系统秒开,则为0)。

2. 最难点:放置 M 操作符的启发式规则(PPT P16 / 笔记 11, 4.3)
#

老师在语音里强调,很多同学不知道什么时候加 M。记住这四大原则:

  1. 原则0:在每一个 K 和每一个 P 之前都放一个 M(即 MK, MP)。
  2. 原则1(删除M):如果一个动作是完全可以预见的(如 PMK -> PK),删除 M。
  3. 原则2(删除M):如果一串 MK 组成的是一个认知单元(比如打一个单词“cat”),只保留第一个 M,后面的全部删掉(即 M K K K)。
  4. 原则3(删除M):如果 K 是一个连续的操作(如输入数字),删除中间的 M。
  5. 原则4(删除M):删除复合操作(如“选中并点击”)之间的 M(即 MPP1)。

老师的实战建议(语音 15:31): 为了保命,你在写操作序列时,最好把每一步在干嘛写在括号里。即使你的 M 算错了,助教看到你步骤合理,也会给你分。

三、 KLM 计算演练(高分必练)
#

题目:在 Word 里替换一个 5 字符的单词。手刚开始在鼠标上。

  • 第一步:分析物理动作
    1. 移动鼠标到单词(P)
    2. 双击选中单词(P1, P1)—— 注意:有些模型把双击看作两个K,看老师PPT给的例子
    3. 手移回键盘(H)
    4. 输入 5 个新字符(K, K, K, K, K)
  • 第二步:插入 M(心理准备)
    1. 开始任务前需要想一下(M)
    2. 准备打字前需要想一下(M)
  • 最终序列: M + P + P1 + P1 + H + M + 5K
  • 代入数值计算: 1.35 + 1.1 + 0.2 + 0.2 + 0.4 + 1.35 + (5 * 0.28) = 6.0s
Reply by Email
hhikr
作者
hhikr
未来人,宇宙人或超能力者
考前复习-hci - 这篇文章属于一个选集。
§ 0: 本文

相关文章

第五章 文件管理
·22473 字·45 分钟· loading · loading
StudyBase 笔记 OS 操作系统
本文介绍了文件管理的基本概念、文件的逻辑结构、文件的物理结构、文件的组织方式、文件的实现层次等。
草稿
S02E07 操作系统并发(4): 线程
·9925 字·20 分钟· loading · loading
StudyBase 笔记 OS 操作系统
操作系统进阶笔记
草稿
S02E06:操作系统并发(3): 进程通信
·8183 字·17 分钟· loading · loading
StudyBase 笔记 OS 操作系统
操作系统进阶笔记