


與大多數國內一流院校相同,上海杉達學(xué)院也希望通過(guò)信息化建設為教學(xué)、科研進(jìn)行支撐,開(kāi)發(fā)教育資源,優(yōu)化教育過(guò)程,升級學(xué)院師生的教學(xué)環(huán)境配置,提升教學(xué)效率。
尤其是隨著(zhù)學(xué)院在大數據和人工智能領(lǐng)域教學(xué)的不斷深入,學(xué)院需要一個(gè)能夠支持整個(gè)學(xué)院的面向未來(lái)的教學(xué)科研平臺。這個(gè)平臺,不僅要能夠解決面向HPC、人工智能、大數據等教學(xué)和實(shí)驗需求的瓶頸,還要滿(mǎn)足當前使用物理服務(wù)器加裝GPU、FPGA卡,支撐Tensorflow、Caffe、Torch、深度學(xué)習框架等,并且能夠讓學(xué)院的整體IT資源實(shí)現共享、隨需分配以及快速上線(xiàn)。

三步完成全自動(dòng)化部署:比傳統方案更勝一籌
學(xué)院管理層高度重視教學(xué)科研平臺的升級工作,目標是構建一個(gè)滿(mǎn)足教研需求的IT資源池,滿(mǎn)足多租戶(hù)管理和易于運維等需求。在技術(shù)選型上,學(xué)院最初也考慮過(guò)傳統解決方案:X86服務(wù)器+虛擬化軟件,但由于傳統方案缺乏靈活的多租戶(hù)管理,以及對專(zhuān)業(yè)運維人員的高要求,使得傳統解決方案難以滿(mǎn)足當下需求。經(jīng)過(guò)嚴格的方案篩選,學(xué)院最終選擇EasyStack易捷行云 ECS Stack云就緒超融合方案。
基于ECS Stack云就緒超融合一體機,EasyStack易捷行云為學(xué)院構建了國內首個(gè)基于超融合的應用技術(shù)教育教學(xué)科研云平臺,既滿(mǎn)足了教學(xué)科研所需的IT資源,又提供了靈活的多租戶(hù)管理和極簡(jiǎn)運維能力。
為了讓學(xué)院的管理員輕松地使用教學(xué)科研云平臺,ECS Stack從安裝部署、運行到后期運維全過(guò)程實(shí)現簡(jiǎn)化運維——只需3步即可完成全自動(dòng)化安裝部署,實(shí)現小時(shí)級就緒。事實(shí)上,該平臺從開(kāi)始實(shí)施到2018年7月上線(xiàn)投入使用,整個(gè)建設過(guò)程在1周內完成。
在IT資源管理上,新建成的教學(xué)科研云平臺,通過(guò)ECS Stack內嵌了虛擬化引擎提供虛擬機服務(wù),基于OvS實(shí)現網(wǎng)絡(luò )虛擬化功能以及基于OpenStack neutron實(shí)現vRouter、vFirewall、vLB,實(shí)現了虛擬機生命周期管理,分布式存儲系統提供塊、文件和對象存儲功能等。
學(xué)院的管理員可以通過(guò)ECS Stack控制臺實(shí)現資產(chǎn)管理、應用模板管理、配置管理以及租戶(hù)資源配額管理等。融入感知式編排功能,可實(shí)現通過(guò)圖形化拖拽的方式快速創(chuàng )建整個(gè)應用IT拓撲及資源開(kāi)通;平臺提供租戶(hù)之間資源隔離以及網(wǎng)絡(luò )二層100%隔離,從而避免租戶(hù)之間互相影響;平臺提供租戶(hù)資源配額管理,從而避免租戶(hù)之間資源搶占。每個(gè)學(xué)生都可以申請云平臺租戶(hù)賬號,登陸ECS Stack控制臺自服使用云資源。
為了簡(jiǎn)化教育科研實(shí)驗所需的應用部署,ECS Stack融入應用中心功能,管理員可預先在ECS Stack應用中心封裝、更新和發(fā)布應用模板;每個(gè)教師都可以按照教學(xué)課程的需求自主設計課程實(shí)驗,并將實(shí)驗環(huán)境打包為應用模板發(fā)布到應用中心,學(xué)生自助挑選實(shí)驗課程之后即可在應用中心實(shí)現一鍵部署實(shí)驗環(huán)境。
不僅如此,新建成的教學(xué)科研云平臺,還可以在底層支持GPU和FPGA兩種最常用的異構計算架構,在芯片核心底層即可釋放人工智能潛力,上層則整合TensorFlow、Caffe、Torch等多種流行的深度學(xué)習開(kāi)源框架,從而可以快速建模卷積神經(jīng)網(wǎng)絡(luò )和遞歸神經(jīng)網(wǎng)絡(luò ),廣泛覆蓋圖像識別、語(yǔ)音語(yǔ)義識別、時(shí)間序列預測等多種人工智能應用。另外,該平臺還提供針對大數據應用的Hadoop、Spark等開(kāi)源框架,以滿(mǎn)足教學(xué)過(guò)程中對于分布式數據計算、分析、預測等需求。
無(wú)人值守的監控運維中心,解決后顧之憂(yōu)
新平臺上線(xiàn)之后,最讓學(xué)院運維人員認可的,就是復雜的運維工作不復存在了。事實(shí)證明,在教學(xué)科研云平臺投入使用的近半年時(shí)間里,讓學(xué)院運維人員真正感受到了什么是故障自愈、可視化運維、無(wú)人值守的監控運維能力。
在ECS Stack監控中心里運行著(zhù)一個(gè)核心引擎——ECMS故障自愈中心,實(shí)時(shí)監控平臺中所有微服務(wù)化控制平面服務(wù)的運行情況,任何一個(gè)控制平面服務(wù)出現運行狀態(tài)異常都都會(huì )自動(dòng)發(fā)出告警并自動(dòng)觸發(fā)故障自愈,在數分鐘內完成服務(wù)恢復。故障自愈中心包含多種故障場(chǎng)景應急處理知識庫,進(jìn)而判斷不同告警對應的應對處理機制,例如服務(wù)修復的方式,服務(wù)重啟的方式,幫助客戶(hù)自動(dòng)修復運行異常的控制服務(wù),使得整個(gè)系統自動(dòng)重新回到正常運行狀態(tài)。
目前,學(xué)院師生人數已達1400多人,隨著(zhù)學(xué)生人數進(jìn)一步增多以及需求多樣化,必然會(huì )對該平臺后續升級/擴容等提出更高的要求。為了簡(jiǎn)化平臺升級過(guò)程,ECS Stack云就緒超融合支持業(yè)務(wù)無(wú)感知的平滑升級功能,確保“三不停”——業(yè)務(wù)不停,控制服務(wù)不停,物理服務(wù)器不停。在升級過(guò)程中,采取多副本滾動(dòng)升級的策略,確保不會(huì )造成服務(wù)停機,持續升級其它副本,直至完成所有副本升級。同時(shí)還支持升級回滾功能,且業(yè)務(wù)/控制服務(wù)不受影響。
總體來(lái)說(shuō),ECS Stack云就緒超融合一體機幫助上海杉達學(xué)院構建智能教學(xué)科研云平臺,它不僅能夠在安裝、部署、使用、運維上實(shí)現簡(jiǎn)單易操作,而且具有故障自愈和平滑無(wú)感知升級能力,通過(guò)感知式編排實(shí)現零基礎資源編排;通過(guò)管理員和用戶(hù)雙機制實(shí)現資源靈活管理以及通過(guò)應用中心輕松實(shí)現應用封裝、發(fā)布到一鍵部署。
關(guān)于 EasyStack
EasyStack 自成立以來(lái)已為國家電網(wǎng)、人民銀行、郵儲銀行、建設銀行、交通銀行、中國銀聯(lián)、中國移動(dòng)、中國電信、海通證券、國泰君安、光大證券、平安證券、興業(yè)數金、江蘇農信、TCL、海爾、順豐、百世匯通、上汽乘用車(chē)、宇通客車(chē)、可口可樂(lè )、清華大學(xué)、中經(jīng)社、天河云等超過(guò)500家企業(yè)級客戶(hù)提供云產(chǎn)品和服務(wù),涵蓋金融、電信、政府、能源、交通、制造、教育、醫療等各大行業(yè)。
