诺贝尔经济学奖得主赫伯特·西蒙(Herbert Simon)曾对与过量信息如影相随的“注意力缺乏”有过精彩论述,这一观念用在当下的大数据时代再合适不过了。随着我们产生、存储和处理大量数据能力的日益提高,我们也需要从数据中提取可靠和可用的知识与见解。
信息可视化这个研究领域旨在提高人们分析和交流复杂数据的能力,从而协助决策,促进科学发现。信息可视化方法和技术包括
- 视觉编码和交互方法
- 可视化软件系统和语言
- 可视化的有效性评估,和
- 面向自动化设计和评估的视觉感知模型
2017年7月“今日计算”刊登了五篇报告这一领域最新进展的文章,文章提出的新工具和模型有助于人们更好地理解他们的数据。相关视频探讨了创建帮助人们探索数据、做出决策和交流发现的可视化工具所面临的挑战。
本期文章
网络分析对空间布局、路径跟踪、聚类识别以及图形结构与节点和边的多变量属性之间的关系发现等方面构成挑战。随时间而变化的动态网络很容易冲垮传统分析方法。Stef van den Elzen和他的同事在IEEE VAST 2015 最佳论文《把快照缩减为点:用于动态网络探索的视觉分析方法》中采用可视化分析方法,将统计分析和可视化在一个交互式探索系统中结合在一起。作者使用降维技术来创建网络动态总览,从而显示网络在时间维度上的“轨迹”,包括网络在何处分叉或聚合。他们完成的系统使得灵活的摘要方法规范描述成为可能,允许用户以“钻取”方式来逐步细化地查看网络。
当展示两组或三组集合之间的关系时,维恩图也许看起来很直观。但随着集合数量的增加,维恩图迅速变得疲于应对、难以解读。Alexander Lex和他的同事在文章《UpSet:交集可视化》中提供了一种新的技术,用于交互式分析集合的并和交。UpSet允许分析人员形成任务驱动的聚集,以便研讨并集和交集的规模和性质。UpSet开源软件包可以开放获取。
可视化常常提到的一个目标是“发现意想不到的”。然而,在许多情况下,将视觉突显赋予已知的基本比率(例如人口密度)或者样本数量和归一化中的失真(例如更小也因此更多变的样本中产生的异常值),数据图形会产生误导。在文章《Surprise!面向偏差降低主题图的贝叶斯加权》中,Michael Correll和Jeffrey Heer针对空间和时间数据提出了一种重加权技术,以可视化相对于一组基本模型在统计意义上奇异的特征。从视觉科学导入称为贝叶斯奇异的一种度量,Surprise!使用一种初始等效模型空间以及贝叶斯更新步骤来重新评估这些模型对观察数据的合理性。这些更新步骤减少了可预期的时空事件的权重,提升了奇异事件的权重。其结果图用于将分析人员注意力引导到一些数据区域中,在这些区域观察到的特征不太可能是由于基本比率或正常的统计波动所导致。
除了开发新技术之外,信息可视化研究旨在了解哪些能(和哪些不能)对有效的图形演示有帮助。一种长期使用的设计指南是Jock Mackinlay的表现性和有效性原则,其基本概念是:(1) 可视化应该仅传递所选数据中的事实,并且仅仅传递该事实;(2) 选择的视觉编码渠道应最大限度地提高人们快速准确地解码数据的能力。然而,之前工作使用逻辑标准来实施表达性原则, 经验结果表明需要更加精细的方法来接近人类感知。在文章《二维标量场分箱的影响度量》中,Lace Padilla及其同事度量了对标量场进行连续和离散色彩编码的影响。作者发现,对连续域采用分箱表示可以比“直接”连续编码的准确率更高。本文不仅改善了设计指南,而且还体现了高质量的可视化效果评估,包括精心的任务选择。
感知实验不仅可以用于直接评估和比较竞争设计方法,还可以建立感知现象的预测模型。工具制造商可以使用这些模型来开发用于设计和评估可视化技术的自动化方法。文章《Colorgorical:面向信息可视化的可辨别和优选颜色调色板的创建》针对为分类数据自动生成有效调色板的问题, 提出了一种基于优化的结合颜色感知、命名和美学的方法。作者Connor C. Gramazio,David H. Laidlaw和Karen B. Schloss不仅关注完全自动化过程,还关注如何将它们结合到一种使设计师根据视觉感知指导来表达自己喜好的交互式工具中。该文指出了构建感知知识获取工具的方式,该方式支持定制设计,且仍对有效的设计原则敏感。
观点视频
Maureen Stone分享了关于可视化工具设计师面临的重大挑战的见解
行业视角
在本月视频中,来自Tableau软件公司的研究经理Maureen Stone分享了关于可视化工具设计人员面临重大挑战的见解:培养对数据的批判性怀疑,改进数据管理和集成,以及发展过程以了解用户的意图和目标。
结论
信息可视化帮助横跨工业界和学术界的人们来理解他们的数据以及传达重要的发现。本月“今日计算”主题中所介绍的前沿研究和工具可以帮助设计人员进行更有效的可视化,帮助分析人员从数据中发现新的见解。
客座编辑
Jeffrey Heer是华盛顿大学计算机科学和工程系的副教授。他从加州大学伯克利分校获得计算机科学博士学位。他是《IEEE Transactions on Visualization and Computer Graphics 》副主编。Heer共同创立了面向可扩展数据的交互工具平台Trifacta,该平台帮助开发的可视化工具(如Vega,D3.js,Protovis和Prefuse)得到了研究人员、公司和全球各地数千名数据爱好者的使用。他的联系方式是jheer@uw.edu。