“過(guò)去三十年,我們可以說(shuō)是生活在一個(gè)關(guān)系型數據庫時(shí)代,絕大多數的應用都是建立在關(guān)系型數據庫之上,整個(gè)數據庫市場(chǎng)也基本由甲骨文、微軟、IBM等幾家老牌數據庫廠(chǎng)商所統治。但是,這個(gè)曾經(jīng)非常穩定的市場(chǎng)正在重新進(jìn)入一個(gè)‘群雄混戰’的時(shí)代。”近日,VMware全球高級副總裁范承工在“VMware&EMC大數據高峰論壇”上如此說(shuō)道。
范承工解釋說(shuō),最根本的原因是傳統數據庫技術(shù)已經(jīng)無(wú)法應付所有應用。今天,海量,種類(lèi)和來(lái)源都更加多樣化,分布更廣,更強調實(shí)時(shí)處理與分析的數據,讓傳統的數據庫技術(shù)捉襟見(jiàn)肘。同時(shí),開(kāi)發(fā)者的需求也在變——現在的移動(dòng)應用開(kāi)發(fā)者有多樣化的需求,傳統關(guān)系型數據不是他們的最優(yōu)選擇,這使得在互聯(lián)網(wǎng)、移動(dòng)應用里各種NoSQL大行其道。此外,用戶(hù)越來(lái)越希望數據庫以自助服務(wù)的形式得到。
“總之,要滿(mǎn)足大數據應用的開(kāi)發(fā),一種數據庫是不行的。”范承工說(shuō)。他還描述了VMware眼中的大數據平臺。首先,不同的數據源都應該能以實(shí)時(shí)數據流的方式向大數據平臺輸送數據。其次,該平臺要有一個(gè)大數據的文件管理系統,還能進(jìn)行數據分析和數據展示,并且大數據平臺之下有個(gè)統一的云架構,即建立在云之上。
范承工表示,過(guò)去三年VMware和EMC都在圍繞這個(gè)大數據藍圖來(lái)進(jìn)行各種研發(fā)。例如,EMC推出了既支持結構化數據,也支持非結構化數據的大數據分析平臺EMC Greenplum統一分析平臺(UAP)。同時(shí),VMware發(fā)起了開(kāi)源項目Serengeti。該項目使得Hadoop也能運行在基于vSphere技術(shù)的虛擬環(huán)境(當前,Hadoop技術(shù)通常是部署在物理服務(wù)器上)。“優(yōu)點(diǎn)是部署更快捷,具有更好的伸縮性,支持多租戶(hù),而且測試顯示,性能損耗也并不大。”范承工說(shuō)。
此外,為了簡(jiǎn)化數據庫在云中的管理、使用和虛擬化問(wèn)題,VMware推出了VMware vFabric Data Director,以提供自助式“數據庫即服務(wù)”。又得益于收購Cetas,該公司還能向用戶(hù)提供數據分析云服務(wù)。
與大數據相關(guān)的產(chǎn)品及解決方案還有一些,在此不逐一介紹。總之,作為VMware數據產(chǎn)品全球工程團隊的負責人,范承工強調:“大數據與云不應該是割裂的。”這句話(huà)應該解釋了以虛擬化起家,在云時(shí)代大領(lǐng)風(fēng)騷的VMware對大數據的態(tài)度、方法,以及未來(lái)的主攻方向。