须成忠查看源代码讨论查看历史
须成忠 |
---|
图片来自雷锋网 现任 澳门大学科技学院院长 性质 中国计算机科学家 出生地 江苏苏州 |
须成忠是一位中国计算机科学家。
简介
须成忠,IEEE Fellow,现任澳门大学科技学院院长、协同创新研究院代院长、计算机及信息科学系讲座教授,国家科技部重点研发计划首席科学家。曾任美国韦恩州立大学电子与计算器工程系主任、以及中国科学院深圳先进技术研究院数字所所长兼云计算技术研究中心主任。[1]
生平
1986年获得南京大学学士学位,1989年获得南京大学硕士学位,1992年获得香港大学博士学位。1995年担任美国韦恩州立大学助理教授,2001年升任副教授,2007年升任正教授,电子与计算机工程系系主任。2011年5月起担任中国科学院深圳先进技术研究院数字所所长兼云计算中心主任。2015年被选为美国电气电子工程师学会会士。[2]
研究方向
须教授的主要研究方向包括并行与分布式系统、云计算和大数据、智能交通和智能城市,及无人驾驶技术。2019年开始承担国家科技部智慧城市重点研发专项,广东省云数据中心重点专项,澳门FDCT无人驾驶重点研发专项,和深圳市数据智能与城市计算重点专项,迄今在相关领域发表两本专著《LoadBalancing:PracticeandExperience》(Springer,1996)《ScalableandSecureInternetServicesandArchitecture》(Chapman Hall/CRC2005)并在国际知名学术期刊及会议上发表学术论文三百馀篇,引用过万次,H-index=53,并多次获计算机领域HPCA、HPDC、Cluster,ICPP等著名会议最佳论文或提名奖,拥有一百多项PCT及国家发明专利。获2014年中国电子学会科技进步一等奖和2019年建设部华夏建设科技进步一等奖等多个国家和地方奖项,2015年当选IEEEFellow,2016年入选科学中国人年度人物。研发的云数据中心资源管理和分布式系统中的位置服务等技术转移给华为、中兴、阿里巴巴等企业,并成功孵化深圳北斗应用技术研究院,获滴滴出行投资。
研究成果
在并行计算方面,提出了一组深具影响的“维度交换”扩散性负载平衡算法。该方法很好地解决了系统资源管理中一个长期未决的负载均衡兼顾数据局域性的问题,并提供了一个灵活的全局优化与开销之间折衷的手段。在分布式计算方面,率先提出了一种基于自适应反馈控制的服务器资源管方法来确保系统在负载异常情况下的在线服务可靠性和稳定性。同时,也最早提出了一种便于多属性检索和易于维护的结构化点对点网络系统架构,和一种基于语义的网络服务缓存及预取方法等一系列可扩展性技术。对大规模系统的可靠性和能耗进行了深入的研究,并提出了一种对系统已往故障事件在不同时空域内相关性的定量分析模型。以此为基础开发了一组基于机器学习的前摄性(proactive)系统故障应对策略来提高大规模系统的可用性。在系统能耗方面,提出了一组动态电压调整算法来优化系统整体能耗。针对网络和云计算服务请求一类的软实时任务,首次量化了能耗与实时响应请求之间的关系,并以此来实现系统性能与能耗的折中。
在云计算方向,用强化学习的办法来配置虚拟机与应用程序的参数,以全面优化多用户云计算系统性能。首先提出一种在NUMA服务器上挖掘数据局部性的虚拟机调度算法,该算法比经典的CreditScheduler性能提高30%以上。提出一种数据局部性感知的MapReduce任务调度算法,在虚拟集群环境上将性能提高1.5倍以上。在大数据应用方面,首先提出一组用户移动行为的分析模型,通过融合出租车数据,地铁数据和手机数据,精准刻画市民的出行行为模式。在基于机器学习的智能调度方面也有较多的积累。是较早尝试用强化学习及基于神经元网络的强化学习方法对云数据中心的虚拟机及虚拟机网络进行自适应配置管理,对虚拟机网络与Web应用配置参数联合调优,和对虚拟集群环境下HadoopMapReduce应用进行自适应配置管理的研究,相关结果得到学术界广泛关注,也获HPDC2013最佳论文奖提名。对强化学习算法,特别是Q-learning算法进行理论上探索,证明了异步并行Q-learning的收敛性条件并给出收敛速度。此外,还尝试用RandomForest,EnsembleLearning等其他机器学习方面对Hbase,Spark等应用框架等进行参数调优。
须教授带领团队开发了具有自主知识产权的先进云/先进数据一体化服务平台xCloud/xData,系统集成了性能优化、故障主动检测与恢复、动态负载均衡、绿色节能等算法成果,实现安全可靠、高效节能、互联互通的目标,并成功应用于智能交通和智能医疗。系统获2011年计算器大会“优秀创新成果奖”。基于先进云平台的低成本全生命周期企业管理软件获2011年获“优秀产品奖”。“先进云”平台技术成功转移转化给中兴通讯公司,并获2014中国电子学会“科学技术一等奖”。团队以智慧交通方面的工作为基础,2014年成功孵化“北斗应用技术研究院”有限公司,并获滴滴出行公司(滴滴公交)和深圳公交公司投资。[3]
智慧城市中的 ABC
谈到智慧城市这一概念的界定问题,须教授表示:
智慧城市的概念比较宽泛,中国有数百个城市都在搞智慧城市建设,而且体现在不同的层面,但其核心是用新一代信息技术解决城市运行管理中的问题。然而目前绝大多数城市都是在建立数据中心、铺设网络,就宣称自己在做智慧城市建设。但是这仅仅只是第一步,我们还要做数据;比如说在数字化过程中,我们数据的共享怎么能够实现?这一块我们做得不多,没有数据,怎么能谈智能服务?所以很多的智慧城市建设都是停留在非常粗浅的第一步(比如说建网络、建数据中心等),那是看得见摸得着的,但数据整合共享真正有内涵的是做智能服务,在这一点上,深圳走在了前面。
就报吿中 ABC 与智慧城市的关系问题,须教授认为,C 也就是 Computing Platform,大算力的数据中心平台是在智慧城市建设中必不可少的;有了数据之后,不仅仅是要数字化,而且这些产生数据都要开放共享,那这就是 B (Big Data)的问题;而只有共享的数据,才能产生价值与服务,产生价值与服务第三个一定是针对某一个应用领域的算法(Algorithm)。
换句话说,从 C 的公共基础社会,到 B 开放共享的大数据,再到 A 的数据智能服务,三者之间是层层递进的关系。
那么, 政府、企业、学界在智慧城市发展中应该扮演什么样的角色呢?须教授认为:
智慧城市本质上是政府买单的工程。一个强有力的政府能够来保证相关的技术落地快;因此,在香港、澳门政府相对弱势,或者受制衡的因素比较多,这样的话,它们从另外一个角度做事效率没有那么快,我们有机会能够在智慧城市方面来赶超西方的发达国家。当然,智慧城市也是非常典型的政产学研结合起来的项目。政府是主导、支持、关注,企业做设施;而其中很多的技术研究点,比如说大数据的有序开放共享、数据的智能服务等,是研究机构专注的问题,企业相对来说就比较弱一点。但是铺设施,比如说建大数据中心或者是铺网络,这个是企业所擅长的。所以,从这个层面,我们国家有四五百个城市都号称在智慧城市建设,但它们仅仅是由企业来参与建的数据中心,建成网络,这个是很重要的一步,但并不是完成了智慧城市建设的任务。
而从国家层面,须教授认为,要想实现智慧城市的发展,要有很好的顶层规划设计,而具体的实施过程中间会有一些阻力;这些阻力并不是来自于平台,并不是来自于数据中心、网络,而是来自于数据的开放共享,我们说城市与城市之间的开放共享、行业与行业之间的开放共享,做人工智能的算法跟数据可以做一些突破的,所以关键还是在数据在这一块。同时,这也是我们国家将大数据算力与人工智能算力结合起来的原因——C 大家都在做,而且做得很好,A 无论是产业界还是大学都在做,但 B 大数据开放共享现在还需要进一步加强。
而针对智慧城市数据分类的问题,须教授表示,目前在学术界也有多种多样的分类,包括从不同的维度来进行分类,但实际上,数据分类跟具体应用是密切相关的,我们并不是说抽象地来谈数据,而是某个特定应用领域产生的数据才有意义。
数据共享是大方向,但也要保护隐私
须教授表示,从目前来看,在智慧城市的未来发展中,数据共享将会是一个大的方向,特别是公共数据必须要开放共享,而且要有序,比如说行业与行业之间,城市与城市之间;但同时,数据共享过程中也要关注隐私保护的问题,也就是在隐私保护顾虑的情况下怎么能够做好数据智能服务。
不过,须教授强调,数据共享不意味着数据开放,比如说银行数据肯定不能共享。比如说,金融服务中间很重要的一块就是做风险控制(也就是风控),那风控怎么来做呢?根据某一个客户的消费行为也不一样,他在这个银行有消费行为,在另外一个银行也有很多的消费行为,在另外一个零售商也有很多消费行为……但这些数据是不可能开放共享的。
由此,须教授提到了一个同时面向数据共享和数据隐私保护的模型——联合学习(Federated Learning)模型,它能够在不共享数据的情况下怎么能过来挖掘数据内在的价值,也就是在兼顾数据隐私的情况下同时又能提供智能服务。[4]