伴随着计算机技术的飞速发展,人机接口技术也在不断改进: 从早期的穿孔纸带、面板开关和显示灯等交互装置,发展到今天的视线追踪、语音识别、感觉反馈等具有多种感知能力的交互装置。用户人机界面的发展历经了批处理、命令行、图形界面三个阶段,现在的研究和开发重点已经放在了Post-WIMP界面上。
人机交互技术几十年来经历了几个不同的主要发展阶段和典型风格。当前,占统治地位的图形用户人机界面(WIMP/GUI)正遭受不断的批评,而新的交互技术尚不成熟和普及,于是人们更为热衷于争论未来的人机界面“可能是什么样子”而且莫衷一是。在此,我们也想加入这种讨论的行列,根据几年来研究工作的心得发表一些看法,谈谈什么是理想人机交互风格。我们的出发点处于人机工程学这个大背景,遵循人机工程学的基本观点,在“以人为中心”前提下强调人机配合。
让我们先考察在人机工程学出现之前人类如何对待工具。不管某个具体工具的设计者在某个具体时期如何理解人与工具的关系,就人类劳动(尤其是制造和使用工具)的历史长河而言,人类是在努力不懈地改造和驯服自然,而工具的制造和完善都是在服从这种目的的前提下进行的。就使用特定工具是否需要经过训练以及所需训练的程度如何,也是不一而论的。人的技能有简单与复杂之分,也许人人都能学会打字,但未必人人都能学会驾驶航天飞机。
较为合理的看法是“自然人机交互是利用人的日常技能进行的”,强调无需特别训练或不需要训练。但究竟什么是“日常技能”以及日常技能是否都是不经训练或稍作训练即可获得呢?语言(特别是书面语言)是必须经过训练的,音乐、绘画、生产工艺等莫不如此。我们认为,人从日常环境走向计算环境时原本具有的技能便是所谓的“日常技能”。可见这是一个相对的概念,其中并不细究是否需训练的问题。所以我们不能以是否需要训练来衡量人机交互技术的好坏。人机工程学并不否定训练,避免训练或减少训练是人们的愿望,但能否做到并不完全由人的主观意志决定,应根据人机交互任务的目的、特点、场合以及实现成本等因素来决定人机交流应达到的自然性程序。
也许对于早期的“纯粹”的计算机问题和为数极少的计算机专家而言,命令语言及程序语言界面是足够的。但是当计算机大量应用于CAD/CAM、字处理、MIS等非数值计算领域之后,需要进行大量几何的、空间的、非数值的、非符号的信息处理手段,此时形式语言界面的复杂性、抽象性,对记忆负荷要求等限制了计算机应用的深入和普及,随之直接操纵给用户界面技术应运而生并广受欢迎。我们相信,形式语言不会消失,当然也不能强迫所有用户都接受它。这正如数学语言并不会被其它形式的语言(如图形的、手势的)所取代,虽然心理学家尝试在数学教育中大量利用非数学手段;又如流行音乐与高雅音乐各分秋色,听众各有所好。目前,直接操纵界面不但没有彻底取代形式语言界面,而且其自身也表现出许多局限性。而基于语言的对话式交互方式又重新开始受到重视,只是对话语言不再限于单纯的形式语言,而是引入了自然语言或类自然语言对话,如所谓的第四代语言,甚至引入基于语音的人机对话。基于形式语言、自然语言或类自然语言的用户界面本质上都是命令驱动的,其基本模式与直接操作用户界面相反。这两种本质不同的人机交互模式在人类的日常活动中都存在其对应的形式,分别对应于语言的和非语言的交际活动,后者泛指形体语言,包括姿势,情态、触摸、近体、标志等。语言具有后天习得性,有口头语言和书面语言两种,书面语言需要正规和专门的教育和训练才能掌握。
我们认为,自然人机交互模式是以直接操纵为主的、与命令语言特别是自然语言共存的人机交互形式。理想的人机交互模式就是“用户自由”。