須成忠
簡介
須成忠,IEEE Fellow,現任澳門大學科技學院院長、協同創新研究院代院長、計算機及信息科學系講座教授,國家科技部重點研發計劃首席科學家。曾任美國韋恩州立大學電子與計算器工程系主任、以及中國科學院深圳先進技術研究院數字所所長兼雲計算技術研究中心主任。[1]
生平
1986年獲得南京大學學士學位,1989年獲得南京大學碩士學位,1992年獲得香港大學博士學位。1995年擔任美國韋恩州立大學助理教授,2001年升任副教授,2007年升任正教授,電子與計算機工程系系主任。2011年5月起擔任中國科學院深圳先進技術研究院數字所所長兼雲計算中心主任。2015年被選為美國電氣電子工程師學會會士。[2]
研究方向
須教授的主要研究方向包括並行與分佈式系統、雲計算和大數據、智能交通和智能城市,及無人駕駛技術。2019年開始承擔國家科技部智慧城市重點研發專項,廣東省雲數據中心重點專項,澳門FDCT無人駕駛重點研發專項,和深圳市數據智能與城市計算重點專項,迄今在相關領域發表兩本專著《LoadBalancing:PracticeandExperience》(Springer,1996)《ScalableandSecureInternetServicesandArchitecture》(Chapman Hall/CRC2005)並在國際知名學術期刊及會議上發表學術論文三百餘篇,引用過萬次,H-index=53,並多次獲計算機領域HPCA、HPDC、Cluster,ICPP等著名會議最佳論文或提名獎,擁有一百多項PCT及國家發明專利。獲2014年中國電子學會科技進步一等獎和2019年建設部華夏建設科技進步一等獎等多個國家和地方獎項,2015年當選IEEEFellow,2016年入選科學中國人年度人物。研發的雲數據中心資源管理和分佈式系統中的位置服務等技術轉移給華為、中興、阿里巴巴等企業,併成功孵化深圳北斗應用技術研究院,獲滴滴出行投資。
研究成果
在並行計算方面,提出了一組深具影響的「維度交換」擴散性負載平衡算法。該方法很好地解決了系統資源管理中一個長期未決的負載均衡兼顧數據局域性的問題,並提供了一個靈活的全局優化與開銷之間折衷的手段。在分佈式計算方面,率先提出了一種基於自適應反饋控制的服務器資源管方法來確保系統在負載異常情況下的在線服務可靠性和穩定性。同時,也最早提出了一種便於多屬性檢索和易於維護的結構化點對點網絡系統架構,和一種基於語義的網絡服務緩存及預取方法等一系列可擴展性技術。對大規模系統的可靠性和能耗進行了深入的研究,並提出了一種對系統已往故障事件在不同時空域內相關性的定量分析模型。以此為基礎開發了一組基於機器學習的前攝性(proactive)系統故障應對策略來提高大規模系統的可用性。在系統能耗方面,提出了一組動態電壓調整算法來優化系統整體能耗。針對網絡和雲計算服務請求一類的軟實時任務,首次量化了能耗與實時響應請求之間的關係,並以此來實現系統性能與能耗的折中。
在雲計算方向,用強化學習的辦法來配置虛擬機與應用程序的參數,以全面優化多用戶雲計算系統性能。首先提出一種在NUMA服務器上挖掘數據局部性的虛擬機調度算法,該算法比經典的CreditScheduler性能提高30%以上。提出一種數據局部性感知的MapReduce任務調度算法,在虛擬集羣環境上將性能提高1.5倍以上。在大數據應用方面,首先提出一組用戶移動行為的分析模型,通過融合出租車數據,地鐵數據和手機數據,精準刻畫市民的出行行為模式。在基於機器學習的智能調度方面也有較多的積累。是較早嘗試用強化學習及基於神經元網絡的強化學習方法對雲數據中心的虛擬機及虛擬機網絡進行自適應配置管理,對虛擬機網絡與Web應用配置參數聯合調優,和對虛擬集羣環境下HadoopMapReduce應用進行自適應配置管理的研究,相關結果得到學術界廣泛關注,也獲HPDC2013最佳論文獎提名。對強化學習算法,特別是Q-learning算法進行理論上探索,證明了異步並行Q-learning的收斂性條件並給出收斂速度。此外,還嘗試用RandomForest,EnsembleLearning等其他機器學習方面對Hbase,Spark等應用框架等進行參數調優。
須教授帶領團隊開發了具有自主知識產權的先進雲/先進數據一體化服務平台xCloud/xData,系統集成了性能優化、故障主動檢測與恢復、動態負載均衡、綠色節能等算法成果,實現安全可靠、高效節能、互聯互通的目標,併成功應用於智能交通和智能醫療。系統獲2011年計算器大會「優秀創新成果獎」。基於先進雲平台的低成本全生命週期企業管理軟件獲2011年獲「優秀產品獎」。「先進雲」平台技術成功轉移轉化給中興通訊公司,並獲2014中國電子學會「科學技術一等獎」。團隊以智慧交通方面的工作為基礎,2014年成功孵化「北斗應用技術研究院」有限公司,並獲滴滴出行公司(滴滴公交)和深圳公交公司投資。[3]
智慧城市中的 ABC
談到智慧城市這一概念的界定問題,須教授表示:
智慧城市的概念比較寬泛,中國有數百個城市都在搞智慧城市建設,而且體現在不同的層面,但其核心是用新一代信息技術解決城市運行管理中的問題。然而目前絕大多數城市都是在建立數據中心、鋪設網絡,就宣稱自己在做智慧城市建設。但是這僅僅只是第一步,我們還要做數據;比如説在數字化過程中,我們數據的共享怎麼能夠實現?這一塊我們做得不多,沒有數據,怎麼能談智能服務?所以很多的智慧城市建設都是停留在非常粗淺的第一步(比如説建網絡、建數據中心等),那是看得見摸得着的,但數據整合共享真正有內涵的是做智能服務,在這一點上,深圳走在了前面。
就報吿中 ABC 與智慧城市的關係問題,須教授認為,C 也就是 Computing Platform,大算力的數據中心平台是在智慧城市建設中必不可少的;有了數據之後,不僅僅是要數字化,而且這些產生數據都要開放共享,那這就是 B (Big Data)的問題;而只有共享的數據,才能產生價值與服務,產生價值與服務第三個一定是針對某一個應用領域的算法(Algorithm)。
換句話説,從 C 的公共基礎社會,到 B 開放共享的大數據,再到 A 的數據智能服務,三者之間是層層遞進的關係。
那麼, 政府、企業、學界在智慧城市發展中應該扮演什麼樣的角色呢?須教授認為:
智慧城市本質上是政府買單的工程。一個強有力的政府能夠來保證相關的技術落地快;因此,在香港、澳門政府相對弱勢,或者受制衡的因素比較多,這樣的話,它們從另外一個角度做事效率沒有那麼快,我們有機會能夠在智慧城市方面來趕超西方的發達國家。當然,智慧城市也是非常典型的政產學研結合起來的項目。政府是主導、支持、關注,企業做設施;而其中很多的技術研究點,比如説大數據的有序開放共享、數據的智能服務等,是研究機構專注的問題,企業相對來説就比較弱一點。但是鋪設施,比如説建大數據中心或者是鋪網絡,這個是企業所擅長的。所以,從這個層面,我們國家有四五百個城市都號稱在智慧城市建設,但它們僅僅是由企業來參與建的數據中心,建成網絡,這個是很重要的一步,但並不是完成了智慧城市建設的任務。
而從國家層面,須教授認為,要想實現智慧城市的發展,要有很好的頂層規劃設計,而具體的實施過程中間會有一些阻力;這些阻力並不是來自於平台,並不是來自於數據中心、網絡,而是來自於數據的開放共享,我們説城市與城市之間的開放共享、行業與行業之間的開放共享,做人工智能的算法跟數據可以做一些突破的,所以關鍵還是在數據在這一塊。同時,這也是我們國家將大數據算力與人工智能算力結合起來的原因——C 大家都在做,而且做得很好,A 無論是產業界還是大學都在做,但 B 大數據開放共享現在還需要進一步加強。
而針對智慧城市數據分類的問題,須教授表示,目前在學術界也有多種多樣的分類,包括從不同的維度來進行分類,但實際上,數據分類跟具體應用是密切相關的,我們並不是説抽象地來談數據,而是某個特定應用領域產生的數據才有意義。
數據共享是大方向,但也要保護隱私
須教授表示,從目前來看,在智慧城市的未來發展中,數據共享將會是一個大的方向,特別是公共數據必須要開放共享,而且要有序,比如説行業與行業之間,城市與城市之間;但同時,數據共享過程中也要關注隱私保護的問題,也就是在隱私保護顧慮的情況下怎麼能夠做好數據智能服務。
不過,須教授強調,數據共享不意味着數據開放,比如説銀行數據肯定不能共享。比如説,金融服務中間很重要的一塊就是做風險控制(也就是風控),那風控怎麼來做呢?根據某一個客戶的消費行為也不一樣,他在這個銀行有消費行為,在另外一個銀行也有很多的消費行為,在另外一個零售商也有很多消費行為……但這些數據是不可能開放共享的。
由此,須教授提到了一個同時面向數據共享和數據隱私保護的模型——聯合學習(Federated Learning)模型,它能夠在不共享數據的情況下怎麼能過來挖掘數據內在的價值,也就是在兼顧數據隱私的情況下同時又能提供智能服務。[4]