“你們先去吧,等會(huì )人少了我再去。最近事太多,我要抓緊把這組數據跑個(gè)結果出來(lái),導師催著(zhù)要呢。”
“你還在用咱們實(shí)驗室的集群在跑嗎?”
“是啊,實(shí)驗室買(mǎi)了這么多服務(wù)器,可還是跑的很慢。”
“你去超算中心啊,他那邊跑的快很多。”
“我之前試過(guò),那邊排隊太長(cháng)了,比我們實(shí)驗室快不了多少。”
“現在他們新買(mǎi)的華為HPC平臺,規模比之前大了很多,作業(yè)周轉快基本不用排隊。而且I/O特別快,算我們這種作業(yè)快得不要不要的。”
“真的嗎?那我趕緊試試華為的平臺。”
小科登錄超算中心的系統,提交了幾個(gè)計算作業(yè)。不用不知道,一用就見(jiàn)識了這個(gè)平臺的快:下午提交的作業(yè)到凌晨依次運行完畢,第二天一早就拿到了需要的計算結果。
“幸虧你推薦我去超算中心跑程序,不然用實(shí)驗室的集群估計還要跑10天半個(gè)月。”
瀚海助力科大超算集群表現亮眼
瀚海助力科大超算集群表現亮眼
幫助小科的這個(gè)平臺叫做“瀚海20超級計算系統”,他擁有CPU計算集群30480顆核,系統理論峰值性能2.52Pflops,實(shí)測HPL雙精度浮點(diǎn)計算能力:700個(gè)節點(diǎn)1.43PFlops,計算效率為63.95%,甚至部分計算節點(diǎn)HPL效率跑出了71%以上的超高性能。“瀚海20系統”采用InfiniBand HDR100 100Gbps網(wǎng)絡(luò )技術(shù)構建的全線(xiàn)速的高速計算網(wǎng)絡(luò ),在600納秒的極低延遲下,每秒可發(fā)送2億條消息,讓用戶(hù)獲得更快的網(wǎng)絡(luò )性能,也是全國高校首例。

瀚海20系統單節點(diǎn)HPL性能統計


中科大瀚海20系統負載
不光是小科同學(xué),中科大合肥微尺度物質(zhì)科學(xué)國家研究中心的胡老師針對大尺度分子固體材料的第一性原理計算模擬,以自主開(kāi)發(fā)的第一性原理線(xiàn)性標度計算軟件DGDFT[JCP 143, 124110 (2015)]為基礎,開(kāi)發(fā)低標度、低通訊,低內存、低訪(fǎng)存的并行計算方法,實(shí)現超大規模高性能并行計算,其中DGDFT采用了多級MPI并行以及高效求本征值方法,具有高度可擴展性。而本次測試在某校外超算和“瀚海20系統”超算平臺上分別計算金屬石墨烯C2880(2880個(gè)碳原子),在相同核數下的絕對計算速度比該校外超算運行快30%以上。

DGDFT軟件在校外某超算和“瀚海20”超算系統上測試金屬石墨烯C2880計算的并行
瀚海為用戶(hù)提供多種選擇
瀚海為用戶(hù)提供多種選擇
“瀚海20系統”還為科研用戶(hù)提供了多種計算選擇,其采用20臺華為T(mén)aishan服務(wù)器構建的鯤鵬生態(tài)計算集群,其中的華為T(mén)aishan服務(wù)器采用鯤鵬架構,該架構芯片在部分單精度和整型計算應用程序性能表現優(yōu)異,可用于生物信息學(xué)計算軟件,和流體力學(xué)計算。中國科大網(wǎng)絡(luò )信息中心張煥杰老師就利用其實(shí)現了ARM平臺甄別郵件系統中用戶(hù)弱口令問(wèn)題,由原來(lái)的需要1天,縮短到30幾秒即可完成,大大縮短了處理時(shí)間,提高了郵件系統的安全性。
瀚海超算集群節能環(huán)保
瀚海超算集群節能環(huán)保
中科大“瀚海20系統”不只性能強,而且更加綠色環(huán)保,系統采用液冷技術(shù)進(jìn)行高效散熱,可循環(huán)使用的冷卻水流經(jīng)CPU、內存等高發(fā)熱量器件,80%的熱量直接由冷卻水帶走,大幅降低超算中心的散熱能耗。其中的720臺華為X6000液冷高密服務(wù)器計算節點(diǎn)僅需10個(gè)機柜即可部署,每個(gè)機柜72個(gè)節點(diǎn)39KW的超高密計算系統,相比傳統服務(wù)器每年至少可節省電費17余萬(wàn)元。

中科大“瀚海20系統”

中科大“瀚海20系統”液冷計算節點(diǎn)