为科学服务的大数据

Big Data for Better Science
作者
        郭毅可(伦敦帝国理工学院数据科学研究所 伦敦 SW7 2AZ)
        潘为(伦敦帝国理工学院数据科学研究所 伦敦 SW7 2AZ)
        于思淼(伦敦帝国理工学院数据科学研究所 伦敦 SW7 2AZ)
        吴超(伦敦帝国理工学院数据科学研究所 伦敦 SW7 2AZ)
        王世才(伦敦帝国理工学院数据科学研究所 伦敦 SW7 2AZ)
中文关键词
         大数据;数据科学;数据驱动的科学研究
英文关键词
        big data;data science;data-driven scientific research
中文摘要
        数据驱动的科研活动已蔚为大观,然而厘清关于数据研究的基本问题仍是数据科学的首要任务。文章根据伦敦帝国理工学院建设数据科学研究院的经验,将数据科学聚焦于交叉研究上,讨论从数据整合与理解,到数据感知与交互,再到数据学习与认知,最后到数据交换与经济的完整链条,并结合开展的科研实践工作,分析了其中的基本研究问题。
英文摘要
        Data driven scientific research has now gain great prosperity. However, we believe that the principle task of data science is to understand the basic problems within data research. In this paper, based on our experience in building the Data Science Institute in Imperial College London, we consider data science as the core of interdisciplinary research, and discuss the whole pipeline of data science research, including data integration and understanding, data sensing and interaction, data learning and cognition, and data exchange and economy. We discuss these basic scientific problems based on our practices in practice. We hope the work presented in this paper can bring thinking and discussion in a larger scale.
DOI10.16418/j.issn.1000-3045.2016.06.002
作者简介
郭毅可 英国帝国理工学院计算系教授,帝国理工学院数据科学研究所所长。1985年毕业于清华大学计算机系,获工学学士学位。1993年在英国帝国理工学院获得计算机博士学位,博士期间研究方向为计算逻辑及陈述性语言编程,其毕业论文获1994年英国帝国理工学院最佳博士毕业论文。2002年被聘为帝国理工学院计算机系终身正职教授,在当时是英国最年轻的教授之一。其主要研究领域包括大数据管理与分析、分布式数据挖掘、网格计算、云计算、传感器网络及生物信息学等。1999年创立了帝国理工计算系的第一个派生公司InforSense,并于1999年至2008任该公司首席执行官。InforSense有限公司于2009年6月为国际知名科学数据管理公司英国IDBS公司并购,迄今他一直担任IDBS公司首任首席创新官。2012出任全球性非盈利性组织tranSMART基金会的首席技术官。2011年至2013年担任清华大学信息科学与技术国家实验室讲席教授。2012年成为首批上海市千人计划入选者、上海特聘专家,并为北京市人民政府"海外人才工作顾问"。现任上海市产业研究院大数据首席科学家,中科院深圳先进技术院健康大数据中心主任,及上海大学计算机学院院长。E-mail:y.guo@imperial.ac.uk
微信关注公众号