October 2015 Theme: 移动分析
特邀编辑导言: Arkady Zaslavsky

分析(Analystics)的一般定义是对本地或云数据中存在的有意义的模式进行发现和多模态交流的过程。移动分析(Mobile Analytics)强调对移动状态下所感知、观测、发现和计算的数据中存在的有意义的模式在移动设备上进行轻量级的发现、计算均衡和交流。移动分析关注在移动设备(如智能电话)上进行数据流和查询处理,以及和基于云/雾的资源进行自适应的分布式协作。思科最近推出了雾计算,强调在边缘网关、路由器和智能手机等边缘设备上对物联网数据进行分布式处理。 分析包括对数据进行离线处理和在线处理,潜在数据是大数据。移动数据分析包括一套工具——处理、分析和可视化来自移动设备或其他来源(例如社交媒体和无线传感器网络)并由移动设备在移动状态下使用的数据。

过去十年智能手机崛起:配备了强大的计算处理能力,包括一系列传感器和通过无线通信网络连接互联网的能力。技术进步已经把手机从单纯的语音电话设备升级为丰富数据之源。这些无所不在的设备产生的数据为开发物联网新应用创造了令人兴奋的机遇。配备了传感器和通信能力的移动设备既可充当嵌入式物联网对象(咖啡机、冰箱、工业机器人等)的桥梁,也可以产生环境有关(例如空气质量测量)的信息。大多数情况下,移动设备产生的数据由App传送到远程服务器或云以供进一步处理。近年来,移动设备产生和消耗的数据与日俱增,对移动数据分析的研究兴趣也日益提高。

主题文章

本月“今日计算”主题的开篇是Arkady Zaslavsky, Prem Prakash Jayaraman和Shonali Krishnaswamy撰写的《ShareLikesCrowd:面向参与传感和众包应用的移动分析》(ShareLikesCrowd: Mobile Analytics for Participatory Sensing and Crowd-sourcing Applications)。作者介绍了移动分析系统的分类以及在本地(移动设备)和远程(服务器/云/雾)执行的数据分析。图1显示了移动分析使能系统(enabled system)的广义分类,它们都以这样或那样的方式依赖于来自移动设备的传感数据。图1中的传感部分包括移动设备内置传感器产生的数据、用户对群智(crowd-sourcing)应用问题的应答,以及来自移动用户的社交网络数据。文章把使用移动分析的应用分为四类:

  • 基于推/拉的独立系统,涉及本地传感和云处理,但本地处理可有可无;
  • 基于推的合作系统,涉及本地感知和处理;
  • 基于推的合作系统,涉及本地感知和云处理/存储;
  • 基于推/拉的合作系统,涉及分布式处理以及云和移动设备之间的负载均衡。

最典型的局部分析是把传感器的原始数值转换成应用可用数值(例如模数转换)。移动分析的关键挑战之一是在本地还是云中进行数据分析。各种群感(crowd-sensing)和群智的参考架构采用的是不同组合:本地、云或两者组合。另一项关键挑战是确定达到应用功能所需的启发法(heuristic)和算法。能效也是决定负载均衡策略的一项关键因素。这里的启发法范围很广,从滤波、去噪到上下文推理(例如用户活动和噪声水平)这样的数据调制技术,到聚类、变化检测和决策树这样的数据挖掘方法。文章还介绍了一种叫做CAROMM(Context-Aware Open Mobile Mining,环境感知的开放移动挖掘)的数据流挖掘系统,这是一种移动群感框架,它使用一种可扩展的数据收集引擎,在提供移动分析处理能力的同时,能够向移动用户提供实时的和态势感知的位置信息。

《论移动数据分析中D和A的关联》(On the Link(s) Between ‘D’ and ‘A’ in Mobile Data Analytics中,Goce Trajcevski探讨了移动数据分析依赖应用的效率管理问题。他专注于移动对象相关的时空数据,认为把时空数据的收集、存储、检索和查询与执行控制及决策算法分离开来是不利的。他认为,移动分析的一个重要组成部分是与不同折衷有关相关的动态管理,更重要的是,在统筹数据管理和分析过程时要把它们联系起来。这篇文章介绍了将数据和控制耦合起来的DNA2(Data’s Natural Associations with Analytics)假说。针对移动分析依赖应用中被动行为和主动行为的融合问题,Trajcevski详细介绍了不确定性的作用和声明规格方面的问题。

Swarnava Dey和他同事们的《在物联网计算网格中使用边缘设备的挑战(Challenges of Using Edge Devices in IoT Computation Grids)》提出了一种架构,将智能手机充当传感器网络和云平台之间的边缘网关。他们认为,对智能手机计算能力的更多使用必须和物联网产生的数据量相匹配。他们讨论了建立这样一个生态系统所面临的挑战,并提出了一个方案,其中智能手机、家庭网关和其它边缘设备可以有效地平衡计算负载。

图1 移动分析使能系统的广义分类

Figure 1. Broad Classification of Mobile Analytics Enabled Systems

《由基于云的出版/订阅中间件使能的移动群感生态系统》(A Mobile Crowdsensing Ecosystem Enabled by a Cloud-based Publish/Subscribe Middleware)中,Aleksandr Antonić和他的同事提出了一种面向移动群感应用的生态系统,它依靠基于云的出版/订阅中间件(CUPUS,Cloud-based Publish/Subscribe Middleware),以情境感知和能源节约的方式从移动设备获取传感数据。该生态系统能够管理移动物联网对象的位置,并能从这种设备自适应地获取数据。Antonić及其同事的解决方案可以使传感数据在传输到云之前,就在临近的移动设备上进行过滤。因此,它既减少了网络流量,也降低了移动设备能耗。为了调查其在智能手机上的性能,作者评估了一种移动CUPUS应用的性能,评估指标包括可扩展性、CPU、内存和高发布负载条件下的能耗。所开发的CUPUS代码作为物联网中间件OpenIoT平台的一部分开源。

Mahadev Satyanarayanan和同事在《物联网的边缘分析》(Edge Analytics in the Internet of Things)中描述了GigaSight——一个互联网尺度的保护隐私的群智视频内容仓库。该架构在网络边缘进行视频分析,是基于虚拟机的云朵(cloudlet)联合系统的代表。云朵可以在智能手机上运行,或者更一般地在任何移动设备上运行,根据成本效率来选择在什么位置运行。隐私保护会影响系统如何修改视频流以及把哪些信息发送至云中。GigaSight结构的重点聚焦于智能交通系统,其中车载摄像头会产生大量数据,不做智能分析,这些数据就会阻塞网络。

Ahmad Razip和他的同事在《一种面向执法态势感知的移动可视化分析方法(A Mobile Visual Analytics Approach for Law Enforcement Situation Awareness)》中探讨了用于对公安数据进行移动可视化分析的工具箱,执法机构装备后就可以有效地感知态势并进行风险评估。这套系统提供了一套交互式工具,用户在处理犯罪、交通和民事案件时可以用它来分析和探测趋势、模式和异常。它还提供了交互式风险评估工具,让用户识别潜在的高风险区域,用户只要指定任何地点和时间,它就可以评定风险。该系统设计面向iPhone/iPad环境,作者介绍时一个执法机构协会正在评估该系统。

 

Industry Perspective Video
Amy Shi-Nash

Industry Perspective Video
Anirban Mondal

工业展望

本月主题对两位著名的移动分析领域行业专家进行了视频采访。我请这些专家就以下问题发表看法:

  • 你如何定义移动分析?
  • 你认为移动分析的研发未来几年走向何方?
  • 可否举例说明你所在组织里的移动分析项目及其影响?

第一段视频采访的是Amy Shi-Nash,他是DataSpark私人有限公司的首席数据科学家,该公司与新加坡电信相关。第二段视频是Anirban Mondal对移动分析的看法,他是施乐印度研究中心(XRCI)的研究员。

结论

这组文章针对移动分析带来的挑战提出了解决方案,使得移动分析——作为物联网的重要组成部分——可实践、可行、可部署和可用。当然,在移动分析未来五到七年成为真正有用的使能者和智能手机的基本功能之前,还有更多的研究应该进行,还有更多的挑战需要应对。鼓励感兴趣的读者开展进一步研究,并加入推进、研究、开发、架构和应用移动分析的队伍中来。

Arkady Zaslavsky is senior principal research scientist at Data61 of the Commonwealth Scientific and Industrial Research Organisation (CSIRO), Australia. He is also an adjunct professor at the University of New South Wales (UNSW), La Trobe University (Melbourne), and Luleå University of Technology, Sweden. He has a PhD in Computer Science from the Institute for Control Sciences (IPU-IAT), USSR Academy of Sciences. His technical interests focus on the Internet of Things, pervasive, ubiquitous, mobile computing, context-awareness, semantic data management and mobile analytics. Zaslavsky is a member of the CN editorial board. Contact him at arkady.zaslavsky@csiro.au.

Translations

English    |    Spanish

Translations by Osvaldo Perez and Tiejun Huang


Audio

English: