中国科协第277次青年科学家论坛简报
2014年06月26日

大数据和移动互联网

——中国科协举办第277次青年科学家论坛活动

  中国科协第277次青年科学家论坛——大数据与移动互联网于2014年5月30-31日在南京东南大学召开。本次论坛由中国科学技术协会主办、中国计算机学会承办。本次论坛以“大数据与移动互联网”为主题,旨在推动相关领域的青年科技工作者拓宽学术视野,提高学术水平,为扶持优秀青年科技工作者学术成长、培养学术带头人和科技领军人才提供一个专业、平等、自由的交流平台。本次论坛正式代表80余人,参会列席共约150余人。

  华中科技大学计算机学院、国家自然科学基金委优秀青年基金资助获得者廖小飞教授,清华大学计算机科学与技术系、国家自然科学基金委优秀青年基金资助获得者唐杰副教授,浙江大学、国家杰出青年基金获得者何晓飞教授,南京大学、国家杰出青年基金获得者周志华教授分别担任本次论坛执行主席。

会场照片

  一、论坛讨论的主题

  “大数据”和“移动互联网”是当前计算机科学与技术领域的两大热点。“大数据”一般指的是在可容忍的时间内无法基于IT设施进行处理的数据集合。在社会计算、工业计算、商业计算、科学计算等诸多领域,数据资源的价值逐步被人们所探寻和认知,许多决策依据逐步转向数据。人们甚至因此认为,数据,这个快速增长的集合,已经上升到了与“石油”同等重要的战略级别。让数据“说话”,已经成为我们这个时代最重要的IT命题之一。中国是全球最重要的大数据市场之一,中国人口数是全球第一,经济规模世界第二,也造就了全球第一的互联网用户数和全球第一的移动互联网用户数,创造数据的规模远远超过全球其他各个国家。因此,与大数据相关的理论、技术、产品和市场不论对于学术界、工业界还是政府来讲,如今都已成为一个炙手可热的重要领域。在欧美等部分发达国家,大数据已然提升到国家战略的高度,而我国相关部门也正在积极研究大数据发展目标、发展原则、关键技术等方面的顶层设计与规划。

  “移动互联网”一般指的是以手持设备(手机、平板电脑、笔记本电脑等)为终端,以无线方式通过多种网络协议接入互联网 。据统计,全球移动互联网用户数总数目前已经超过10亿,这意味着移动互联网已经、并且正在改变全球10亿人生活方式的点点滴滴。同样,中国拥有世界上最大规模的移动互联网用户群体,对相关技术、产品和服务有着巨大的市场需求。毋庸置疑,“移动互联时代”已经到来,如何应对移动互联时代带来的机会和挑战,是学术界、工业界和政府都应当仔细思考的问题。在国家政策方面,移动互联网已通过国家 “十二五”发展规划,被正式确定为重点扶持的国家战略新兴产业。

  随着“大数据”和“移动互联网”的重要性和巨大潜力逐渐成为各界共识,对两个领域相关问题的研究往往成为计算机领域的热门课题。比如,在国际电子电气工程师协会计算机学会(IEEE Computer Society)总结的2014年十大技术趋势中,与“大数据”和“移动互联网”相关的技术就占了一半,包括“移动云的兴起”(“Emergence of the Mobile Cloud”)、“从物联网到物连万维网”(“From Internet of Things to Web of Things”)、“从大数据到巨量数据”(“From Big Data to Extreme Data”)、“下一代移动网络”(“Next-generation Mobile Networks”)和“身份和隐私的平衡”(“Balancing Identity and Privacy”)。与此同时,更多的新兴理论和技术也在计算机领域日新月异的飞速发展。随着技术的进一步发展,移动互联网逐渐成为大数据的最佳实践环境。

  本次论坛以“大数据与移动互联网”为主题,旨在推动相关领域的青年科技工作者拓宽学术视野,提高学术水平,为扶持优秀青年科技工作者学术成长、培养学术带头人和科技领军人才提供一个专业、平等、自由的交流平台。 在论坛上讨论大数据和移动互联网的技术趋势、国家战略具有重要的意义。

  二、论坛代表的互动思路

  二十余名代表发表了自己的观点,下面选择了一些有代表性的发言予以报告。
  任丰原教授(杰青)主要针对大数据时代的网络研究阐述了自己的观点。他认为大数据的衍生对网络传输带来了巨大压力,因此,如何提速网络传输速度成为一个重要问题。它包含了三个挑战:终端地理位置随机不确定;传输有偶发特征与时效性;共享信息网络基础设施不足。对此,崔勇、陈文光等代表就实时数据处理、TCP协议栈的容错性能等展开了讨论。
  陈恩红教授(杰青)就面向智能移动应用的数据挖掘方法进行了研究阐述。他就移动智能应用的隐私保护、欺诈排名等问题进行了分析与讲解。他认为,大数据的分析技术有助于智能应用的诚实性分析和评价,有利于保证移动网络的安全性。对此,吴松等代表提出了社交网对推荐的影响、系统软件层面的处理瓶颈等重要的挑战。
  陈文光教授就移动计算的系统软件做了分享和阐述,对移动设备的安全性和可管理性、电池容量、计算能力、网络的稳定性等提出了自己的见解,希望通过云化和虚拟化突破上述瓶颈。列席代表提出了移动桌面的规模、传输等方面的问题,多人参与了交流。
  崔勇教授就移动互联网的个人云存储提出了自己的见解。他认为个人云存储已经成为未来移动互联网时代的入口。因此,个人存储承担了重要的意义。多个教授就此进行了激烈讨论。
  黄罡教授(优青)阐述了云端融合的概念、挑战,并分享了他的体会。他认为云端融合是未来移动互联网时代的重要趋势和市场热点。廖小飞等代表就云端融合的效率、性能进行了交流和讨论。
  於志文教授(优青)阐述了移动社交网络的相关问题。他认为,实现物理空间和信息空间的融合在移动时代尤为重要,并提出了基于位置的社交网络融合形式和基于事件的社交网络融合方式。唐杰等代表就推荐和社交分析提出了自己的观点。
  吴松教授阐述了移动云计算的架构和挑战。他认为移动云计算有别于传统云计算,且在成本、能耗、性能等多个方面具有重要的意义。陈文光、於志文教授对云计算细粒度计费问题提出了一些意见和讨论。
  张敏灵教授阐述了基于监督学习的大数据分析的进展和挑战。他认为监督学习是研究最久、应用最广泛的一种主流框架。
  李国良教授针对大数据的群体计算阐述了观点。他认为,大数据和众包的最佳结合就是群体计算,可以为大数据时代的计算提供了有益帮助。孙海龙等代表提出了学习算法的未来发展和群体智能的发展需要认真分析。
  李武军教授则从哈希学习的角度阐述了大数据的分析与处理的关键问题。他认为哈希学习室机器学习的一个重要研究领域,是大数据分析与处理的一个关键问题。大家对哈希学习的未来走向进行了讨论。
  胡清华教授、许锋教授以及周涛则从具体的大数据问题入手,阐述了大数据分析的意义和挑战。他们分别从天文大数据、水利大数据和人力资源大数据三个应用领域入手,分析了大数据分析带来的巨大受益和面临的难题。这三组报告引起了参会者的广泛兴趣。
  论坛在举行圆桌互动研讨中,围绕着大数据和移动互联网的主题,展开了激烈的交锋和讨论。在讨论中,代表们始终认为,这两个主题是未来IT技术发展的主流和趋势,也是涉及国家重大战略需求的IT领域,应予以足够的重视。但是,对于具体领域背后的重要问题以及问题的发展方向,与会者展开了百家争鸣,形成了研究讨论中的观点。与会专家通过两天来的互动讨论,向政府有关部门提出建设性意见。建议如下:

  1)加快发展大数据的关键技术,积极构建大数据典型应用
  首先,要有总体规划。统筹规划,尽快制定大数据国家发展战略。应将数据作为重要的国家战略资源来管理和应用,保证数据资源为我所管,数据价值为我所用。通过国家战略,保证“大数据”核心技术自主可控,并积极推动“大数据”政府管理和公众服务应用目标的实现。根据我国现状,“大数据”政府应用建议分为两步走:在先期阶段采用“线面结合”的方式,在保证数据安全的前提下,选取如交通、环境、医疗、公共安全等有代表性、信息化基础好的政府部门,探索“大数据”应用;同时,以智慧城市为实验床,探索政府各部门数据资源共享与关联分析应用的模式与标准规范建设。在此基础上,加快国家大数据基础设施和大数据集的建设,以提高国家的管理效率与核心竞争力。
  其次,要加强技术研发。“大数据”作为新型计算模式,其信息处理的全生命周期对传统计算模型、处理软件和存储计算能力提出了新的挑战,应加强共性关键技术的研发,在与欧美信息技术发达国家的竞争中抢占技术制高点。关键技术体系包括了:(1)海量非结构化数据感知与高效采集技术;(2)海量非结构化数据多维并行预处理技术;(3)面向大数据的存储技术;(4)面向大数据的数据管理及分析技术;(5)数据安全与隐私保护技术。
  再次,要支持重要的应用研发。在研发关键技术的基础上,应注重在政府管理、公共服务方面加强大数据应用的支持和研究。建议将提高政府管理效率、提升公众服务水平和探索新型商业模式、拉动信息消费作为“大数据”的应用的首要目标;加强基础设施建设,建立国家“大数据”集和分析应用中心,将构建数据共享基础架构与应用环境,建立国家数据解析中心,提高跨机构数据分析与应用能力放在首要位置。
  最后,要有配套的政策支持。要完善信息公开,提升公共服务质量。在不影响国家安全的前提下,参照美国公开信息资料库data.gov网站的建立,选取关系公众生活质量的政府部门数据,如交通、环境、食品、医疗等,在充分开放数据的同时建议建立公共服务平台并提供定制化服务,使公众的便捷出行、智慧医疗、食品安全等服务质量得到质的提升。
  要完善政策引导,拉动信息消费。鼓励企业在“大数据”核心技术和应用模式方面的创新,充分利用中国“大人口基数”的优势,引领“大数据”产业的发展,提升公共服务水平和拓展信息消费领域。同时加强政策引导,鼓励企业尽可能开放有价值的数据资源,为政府管理决策提供辅助和依据。
  要完善法律,保证数据安全。对大数据的收集、分析和应用各环节加强立法和监督,在数据资源开放共享的同时,切实保护政府、企业和个人的数据隐私和数据安全。

    2)积极应对,建立移动互联网的技术生态体系  从移动互联网的本质特征出发,以获取更多原始创新成果为目标,主要建议如下:
  首先,要加强移动终端设备(主要是手机、平板)及核心芯片和器件的研究。面向可穿戴式移动显示终端的研制开发,急需关注的关键技术包括以下六个方面:可长期佩戴的舒适型穿戴式显示终端技术,多通道生理与情感信号的采集、特征提取与理解技术,高精度定位及三维虚实融合呈现技术,大空间低成本便携手势体感交互技术,用户意图理解和高性能自然口语对话技术,多模自然人机交互及交互界面的设计方法。
  其次,要加强移动互联网基础软件的研究,包括移动终端操作系统的核心技术、移动互联网基础服务平台。其中前者的目标是掌握足够多的核心知识产权,威慑相关国外企业并且保护开源系统能长期为我所用;后者的目标是形成与移动终端操作系统所对应的基础服务平台,深入挖掘移动终端的“互联网服务”承载能力。
  再次,要重视以个人为中心的长时携带移动服务。包括智能穿戴服务、智能服装、健康监测等设备及相关核心芯片及器件的研究,与设备相对应的服务的研究。一方面,要开展可穿戴人机交互和智能计算关键技术和应用的研究,研究可穿戴交互隐喻表征、范式设计和适应度分析方法,研究基于可穿戴传感系统的高效的个人上下文感知和识别典型的如眼动跟踪、位置、姿态和生理感知及手势以及情感识别等。另一方面,还需紧密结合云计算、物联网技术,开展面向医疗、健康、娱乐领域的与可穿戴设备高度适配的创新性应用试点,逐步建立可穿戴产业链。
  最后,要注重在特定环境中以人为中心的移动设备及服务。包括智能加电与移动互联网的融合、车联网与移动互联网的融合、物联网与移动互联网的融合过程中所需的芯片器件、设备及服务。在该领域的跨界研究将会让移动互联网深入渗透第三产业。

学会学术部供稿

责任编辑:赵颖