數據中心正在對閃存“狼吞虎咽”,但也有些“消化不良”的感覺(jué)──以上是中國云計算服務(wù)業(yè)者阿里巴巴(Alibaba)的數據中心部門(mén)首席技術(shù)專(zhuān)家Wu Peng,在近日于美國加州舉行的閃存高峰會(huì )(Flash Memory Summit)上發(fā)表演說(shuō)時(shí)分享的實(shí)際經(jīng)驗。
Wu Peng表示,閃存供貨商最需要關(guān)注的是降低每GB成本,以及降低閃存的功耗與延遲,并提升可靠性;他指出,大多數閃存產(chǎn)品都會(huì )提供許多小時(shí)的故障間隔時(shí)間(mean time between failures,MTBF),以及多年保固:“但實(shí)際上我們遭遇不少性能規格表現低落的情況,因此我們正在尋找更穩定、生命周期性能表現確實(shí)的產(chǎn)品。”
盡管面臨以上問(wèn)題,閃存正在大舉進(jìn)軍數據中心;阿里巴巴在去年所采購的閃存量,就占據全球企業(yè)用閃存消耗量的至少1%,而且其使用量仍在成長(cháng)中。阿里巴巴自五年前就開(kāi)始研究閃存儲存方案,該公司現在除了采用全閃存數據中心,也在內容傳遞網(wǎng)絡(luò )(content distribution network)以及應用程序服務(wù)器中大量使用閃存。
去年阿里巴巴這家電子商務(wù)公司,創(chuàng )下了在24小時(shí)內完成1.88億筆交易量,以及每秒1.5萬(wàn)次交易的新高紀錄;為了穩定跟上需求速度,應用程序需要更多所仰賴(lài)的、關(guān)于閃存運作情況的信息。Wu Peng表示:“故障是無(wú)法避免的,但最好是要讓系統在硬件將發(fā)生故障時(shí)預先得知,以判斷何時(shí)發(fā)出警告以及何時(shí)必須將數據備份。”
阿里巴巴想通過(guò)簡(jiǎn)化硬件與軟件,以方便讓?xiě)贸绦虻弥讓娱W存的狀態(tài);這家大型數據中心營(yíng)運商希望自己處理服務(wù)開(kāi)通(provisioning)以及冗余(redundancy)問(wèn)題,Wu Peng表示:“如果應用程序能知道很多信息,就能做很多事。”
在阿里巴巴近期遭遇的問(wèn)題中,RAID控制器在與閃存共同使用時(shí),糾錯(error correction)與電池備援會(huì )產(chǎn)生問(wèn)題;同時(shí)Wu Peng表示,閃存供貨商太專(zhuān)注于提供更高速度的數據傳遞速率,卻太少關(guān)注降低延遲。
Wu Peng認為閃存有五大問(wèn)題需要改善
長(cháng)期來(lái)看,Wu Peng認為需要建立一個(gè)新的軟件編程模型,以應對不斷變化的儲存層次結構以及閃存的出現;此外,供貨商導向(vendor-driven)的軟件定義儲存(software-defined storage)概念仍在“非常粗略的方向”,能讓數據中心滿(mǎn)足不同應用的儲存需求。
而眾多新一代內存如STT-MRAM與相變化內存(phase-change memory)的崛起,也為數據中心帶來(lái)新的問(wèn)題;Wu Peng表示:“有許多專(zhuān)利的事情被推給我們,但我們有困難去了解那些技術(shù)會(huì )失敗,以及何時(shí)是著(zhù)手布署的正確時(shí)機。”
Wu Peng并邀請所有的供貨商擁有多樣化應用程序的阿里巴巴實(shí)驗室測試新產(chǎn)品:“我們有一個(gè)程序,測試可能最終會(huì )應用在我們基礎建設上的新東西;測試過(guò)程確實(shí)會(huì )很漫長(cháng),但我們一直歡迎新產(chǎn)品。”