大數據很火,從今天開(kāi)幕的英特爾年度盛會(huì )IDF上就能看出端倪。
與往年一樣,重磅主題演講人之一,英特爾高級副總裁兼數據中心及互聯(lián)系統事業(yè)部總經(jīng)理柏安娜,在介紹英特爾數據中心戰略時(shí)特別強調,英特爾將持續投資Hadoop,為開(kāi)源社區提供代碼,面向至強優(yōu)化發(fā)行,提供硬件增強的壓縮功能。
據她介紹,早期成果已經(jīng)在中國有客戶(hù)部署Hadoop,如中國移動(dòng)和中國聯(lián)通等運營(yíng)商,應對3G甚至4G系統啟用之后呼叫數據大幅增長(cháng)導致傳統計費系統出現的難題。
“執行Hadoop的方案背后離不開(kāi)存儲設備的支持,必須有很高的性能和效率。”在中國移動(dòng)的案例中,最大挑戰是提供實(shí)時(shí)呼叫數據記錄,每天實(shí)時(shí)檢索30天的記錄,每秒生成30萬(wàn)條記錄,每秒35MB,每月計費數據達到90TB。
她提到了數據中心在交付實(shí)時(shí)信息和服務(wù)的個(gè)人計算體驗中所扮演的重要角色,以及英特爾在提供數據分析所需要的硬件及軟件、提高智能設備和數據中心基礎設施功能上所邁出的創(chuàng )新步伐。
隨后,英特爾副總裁兼平臺事業(yè)部總經(jīng)理Jason Waxman在演講中,介紹數據分析支持浙江智能電網(wǎng)的案例,最大挑戰是提高電網(wǎng)效率,內存數據庫要支持100TB和100萬(wàn)個(gè)并發(fā)請求,傳感器更是多達1億個(gè)以上,最總不僅決策速度提高了60倍,而且減少了電力浪費和碳排放。
2013年底之前英特爾加速擴展基于22納米制程工藝的數據中心處理器產(chǎn)品線(xiàn)計劃,支持擁有更高成本效益和更高能效的數據中心基礎設施。在數據中心產(chǎn)品組合中,面向微型服務(wù)器的英特爾凌動(dòng)S1200處理器發(fā)布4個(gè)月后,全新專(zhuān)為存儲設備定制的英特爾凌動(dòng)S12x9處理器也隨之亮相
談到所謂的數據中心機架“重塑”,目前騰訊和百度都十分關(guān)注提高機架密度和降低運營(yíng)成本。在數據中心內機架方面,可以將散熱和供電等系統進(jìn)行整合,甚至未來(lái)能夠把存儲和計算等核心資源聚合到一起,提高效能和降低成本。
基于這個(gè)設想,騰訊、阿里巴巴、百度和中國電信發(fā)起了名為“天蝎”(Scorpio)項目,英特爾擔任技術(shù)顧問(wèn)。整機柜的理念把服務(wù)器的功能放入機架中,例如把風(fēng)扇從機柜中移走,做成風(fēng)扇墻提高效率和加強散熱,通過(guò)重新設計機架機械尺寸整個(gè)機架密度提升一倍甚至更高,從進(jìn)一步推動(dòng)標準化。
為什么在數據中心機架重塑這個(gè)項目上互聯(lián)網(wǎng)公司和運營(yíng)商走在了前面?天蝎項目輪席主席Eric Chen解釋說(shuō),之前廠(chǎng)商各自有不同的標準,用戶(hù)之間沒(méi)有合作,所以提出的需求不同,不僅有多套整機柜,而且國外通用產(chǎn)品無(wú)法拿來(lái)直接運行。
正式啟動(dòng)天蝎項目之后,廠(chǎng)商和運營(yíng)商整合各自需求,開(kāi)發(fā)一套通用產(chǎn)品。“2012年是天蝎的元年。去年底,百度采用200個(gè)整機柜,天蝎技術(shù)每年節省4200萬(wàn)運營(yíng)費用。今年和明年將有更多整機貴落地。未來(lái)的天蝎2.0將充分利用風(fēng)火水電,從服務(wù)器轉移到數據中心機架,這個(gè)高級階段中解耦(Disaggregation)是關(guān)鍵技術(shù)。”
他表示:“隨著(zhù)整機柜成為主流技術(shù),如Facebook OCP的OpenRack項目,我們非常愿意和Facebook一起合作推動(dòng)標準化。”
在下午的IDF 2013大數據專(zhuān)場(chǎng)中,記者則更為詳盡地了解到與上午主題演講相關(guān)的大數據一體機和Hadoop的信息。
在英特爾大數據一體機方面,參考設計主要針對智慧城市、智能交通、電信、金融和醫療等目標市場(chǎng),為渠道和本地OEM提供一體化的方案,包括DCSG/PEG、DSD、SSD、NSG和ISG在內的多個(gè)英特爾部門(mén)參與,負責服務(wù)器、一體化集成、Hadoop發(fā)行版、優(yōu)化、固態(tài)盤(pán)、前端和邊緣服務(wù)器接入
下午的會(huì )場(chǎng)還同時(shí)發(fā)布了最新的Hadoop發(fā)行版2.3版本。演講人特別介紹了新版本在處理非結構化數據方面的兩個(gè)應用實(shí)例。其一,某市交通管理在線(xiàn)應用中,需要實(shí)時(shí)存儲和獲取路口的實(shí)時(shí)交通狀況圖片;其二,某銀行存儲大量交易記錄備注或交易證據掃描照片,并允許柜員及客戶(hù)在線(xiàn)查詢(xún)這些記錄