南京大學為什么要建那么大一個HPC集群?

摘要:作者|于澤(大數(shù)網(wǎng)副主編)去蕪存菁微信|YL09092014深入到實際案例中,發(fā)現(xiàn)攻下每一個客戶都不容易。只有不斷地重復這種不易,才能使你變得偉大。6月30日,2017聯(lián)想全球超算峰會(2017Len

作者 | 于澤 (大數(shù)網(wǎng)副主編)

去蕪存菁 微信|YL09092014

深入到實際案例中,發(fā)現(xiàn)攻下每一個客戶都不容易。只有不斷地重復這種不易,才能使你變得偉大。

6月30日,2017聯(lián)想全球超算峰會(2017 Lenovo HPC Summit)即將召開。而在此之前的6月27日,一場小規(guī)模的研討會率先在南京上演。主角是誰?南京大學和聯(lián)想。

聯(lián)想集團數(shù)據(jù)中心業(yè)務教育行業(yè)總監(jiān)蔡斯揚致辭

看起來這可能只是聯(lián)想高性能計算(High Performance Computing,HPC)在教育行業(yè)的一個具體案例,但折射的其實有很多。比如,南京大學為什么有代表性,教育行業(yè)在HPC領域的應用情況如何,為什么南京大學最終選擇了聯(lián)想、被其哪些方面打動等。

南京大學-HPC高教范本

一個一個來,由小到大,先說南京大學這個案例。

大背景是南京大學理工科非常強,八個國家一級學科,中國語言文學、數(shù)學、物理學、化學、天文學、地質(zhì)學、生物學、計算機科學與技術(shù)學中,有七個都需要大量的運算。有了這個前提,不難理解為什么南京大學的HPC歷程可以追溯到那么早。

2001年,南京大學開始投資建設高性能計算中心,這也是中國最早一批高性能計算中心,后歷經(jīng)2005年、2007年先后立項擴建;2009年,新建高性能計算中心,并在當年的中國高性能計算機性能TOP100排行榜列第七位,高校系統(tǒng)第一位。2015年,南京大學高性能計算中心的擴建再次提上日程。

截止當前,南京大學高性能計算中心改造升級項目已經(jīng)結(jié)束,并正式投入運營。

南京大學高性能計算中心一角

看兩組數(shù)據(jù),一是Linpack峰值(理論計算速度),它直接反映的是系統(tǒng)的性能,升級前的南京大學高性能計算集群(以下簡稱“一期”)Linpack峰值為每秒34萬億次,升級后的(以下簡稱“二期”)是844.8萬億次,是一期的近25倍。

二是系統(tǒng)規(guī)模,一期共402個計算節(jié)點,每節(jié)點12GB內(nèi)存、2顆至強處理器,存儲是128TBSAN加上54TB并行存儲;二期呢?880個計算節(jié)點,每節(jié)點2顆至強處理器,內(nèi)存有兩種規(guī)格64GB和128GB,存儲是2PB的SAN加上超過1.2PB的并行存儲。

結(jié)合兩組數(shù)據(jù)能發(fā)現(xiàn)很多東西,比如二期規(guī)??雌饋硭坪踔槐纫黄诜艘槐叮阅軈s差近25倍,可見八年間信息技術(shù)發(fā)展之迅猛。

與此同時,南京大學對高性能計算資源的需求增長之快可見一斑。南京大學高性能計算中心副主任董錦明在接受采訪時表示,擴建后高性能計算中心的負載率目前在1/3左右,但他們預計一年后,就會達到80%。這并非盲目的樂觀,他解釋說,之前由于資源不足,很多老師都在外尋找計算資源,同時他們也拒掉了很多兄弟院校,以及企業(yè)的申請,把這些都算上,很快就會再次進入資源相對緊張的狀態(tài)。

這是南京大學HPC方面的一些情況,從根本上說,他們升級是因為資源不夠用了。而這很有代表性,足以體現(xiàn)行業(yè)趨勢,那就是高校對HPC需求量大,而且越來越大。

廣深交織-需求日益增加

為什么高校會有如此大的需求量?從更高的層面看,一、當下是數(shù)據(jù)社會,數(shù)據(jù)量正越來越大、再加上人們對數(shù)據(jù)分析效率的追求越來越高,這需要更為強大的計算力,二是信息技術(shù)這些年取得長足進步,使得HPC的獲取變得簡單、容易,之前需要大量的人員、資源投入,現(xiàn)在以極少的代價就能享受其強大的能力。

聚焦高教,就如南京大學的情況,需要借助HPC的學科越來越多,越來越深。舉個例子,車輛設計需要HPC,但很多基礎的研究并不在汽車制造公司,比如材料、分子等。在哪?在高校、在研究所。車輛設計只是HPC應用的一個門類,但高校覆蓋的是各個學科,物理、化學、生物……連接的是各行各業(yè),因此可能高校HPC在某一領域的應用深度比不上產(chǎn)業(yè),但廣度絕對超過所有單一行業(yè)。

這是其一,高??蒲猩婕邦I域廣泛,需要HPC的地方多。其二,隨著研究的不斷深入,追趕國際領先水平腳步的日益加快,高校在單一領域?qū)PC的需求量也會與日俱增。

這可以理解為當前高教領域?qū)PC需求的現(xiàn)狀,需求量大、重視程度日益增加,這一點從南京大學身上也能看出。

除此之外,事實上,從另一個側(cè)面也看出這一點,那就是建設高性能計算中心的院校越來越多,這幾年僅聯(lián)想實施的就有北京大學超算中心、廈門大學化學化工學院超算中心、青海大學水利工程超算中心和南方科技大學新能源超算中心等十數(shù)個,HPC在高教行業(yè)的發(fā)展速度可以想象。

聯(lián)想HPC-它們的一致選擇

為什么這么多院校會選擇聯(lián)想作為合作伙伴,聯(lián)想打動他們的是什么?南京大學的案例或許能解釋其中的緣由。

南京大學高性能計算中心副主任周慶林教授

南京大學高性能計算中心副主任周慶林教授在采訪中談到了兩點:一、先入為主,南京大學高性能計算中心上一套系統(tǒng)是IBM的,用的很好,穩(wěn)定、可靠,而聯(lián)想收購了IBM x86服務器業(yè)務,沒理由不繼續(xù)使用。

二、聯(lián)想的實力,尤其是在高性能計算領域的實力。連續(xù)多年國內(nèi)HPC TOP100排行榜榜首,連續(xù)多屆國際HPC TOP500第二,不用再細說技術(shù)能力、服務能力,這些成績已經(jīng)說明了一切。

除此之外,他還講了一個小插曲,一個國際知名廠商已經(jīng)買了標書了,最后投標卻沒來。他猜想可能還是滿足不了南京大學的需求,可能是技術(shù)能力不足,也可能是實施能力不夠。

實際上,就如周慶林所分析的,技術(shù)實力跟聯(lián)想差不多的,服務能力未必跟得上;服務能力夠的,技術(shù)能力又不一定行。最終多方權(quán)衡,聯(lián)想是最好的選擇。

當然,他們的選擇絕對是對的,聯(lián)想絕對有能力擔負起大家的期待。作為中國最早做HPC的廠商,聯(lián)想有足夠的積淀,并且在收購IBM x86服務器業(yè)務后,這些能力獲得進一步增強。

看看聯(lián)想在HPC領域的布局,深騰X8800解決方案、水冷技術(shù)、LiCO智能超算平臺……再加上全球化的專業(yè)團隊,覆蓋應用調(diào)研、方案設計、方案論證、應用測試和優(yōu)化、現(xiàn)場安裝和實施端到端,以及開放心態(tài)下緊密無間的合作伙伴,其有今天的成績一點都不意外。

面向未來,聯(lián)想還在不斷的進步,更好支持AI人工智能)的LiCO平臺、很快就要發(fā)布的Think System服務器產(chǎn)品線、團隊進一步的調(diào)整細化。據(jù)說30號還會有重大發(fā)布……一切為了客戶,明天自然不會差。

采訪手記

沒人能隨隨便便成功,4500萬大項目的背后,是雙方無數(shù)次的溝通交流、是很多人沒日沒夜的加班加點。就如聯(lián)想集團蘇皖大區(qū)DCG業(yè)務總監(jiān)郝飛所透露,服務這個項目的一個20人的團隊最忙的時候,十天時間平均每個人只睡一天。對此,周慶林他們笑笑說,我們真沒少提要求。

再想想聯(lián)想做了那么多這樣的項目,于是我寫下了開篇的第一句話。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2017-06-30
南京大學為什么要建那么大一個HPC集群?
摘要:作者|于澤(大數(shù)網(wǎng)副主編)去蕪存菁微信|YL09092014深入到實際案例中,發(fā)現(xiàn)攻下每一個客戶都不容易。只有不斷地重復這種不易,才能使你變得偉大。

長按掃碼 閱讀全文