易有太極,是生兩儀,兩儀生四象,四象生八卦,世間萬(wàn)物皆出于此。古人的《易經(jīng)》用這段話(huà)解釋萬(wàn)物起源的過(guò)程,而我們是如何得知的呢?因為數據的保存流傳,數據信息可以看做文明傳播的主要載體,而存儲介質(zhì)的使用則是數據信息傳播的主要工具。從結繩記事,到甲骨、青銅鼎,再到紙張的使用,人們通過(guò)不斷的改造發(fā)明,將文明傳播一代又一代,也改進(jìn)了人類(lèi)發(fā)展進(jìn)程。這里有一個(gè)反例可以看出存儲介質(zhì)選用的重要性,作為四大文明古國之一的印度就曾出現了較為嚴重的文化斷層,據考古研究他們使用樹(shù)皮或樹(shù)葉記錄信息,到今天的存世量非常稀少,有學(xué)者指出這是導致文化斷層的最根本原因。
隨著(zhù)工業(yè)革命的發(fā)生,科技的日新月異,人們選用的存儲介質(zhì)也發(fā)生了較大的變化,硬盤(pán)開(kāi)始成為人們日常生活工作中的必備品,并在數據存儲中扮演著(zhù)重要角色。但是近年來(lái),由于社交網(wǎng)站、智能移動(dòng)終端的不斷普及,人們創(chuàng )造出來(lái)的數據量是驚人的,據統計2013年光中國產(chǎn)生的數據總量就已經(jīng)超過(guò)0.8ZB(相當于8億TB),在海量數據的壓力下,數據的存儲介質(zhì)會(huì )發(fā)生什么改變?企業(yè)面對海量數據如何改造升級傳統數據中心來(lái)滿(mǎn)足業(yè)務(wù)運營(yíng)的需求?新興的互聯(lián)網(wǎng)巨頭公司又該如何解決自身龐大數據的存取難題?這些亟待解決的問(wèn)題是用傳統手段,比如無(wú)限制擴展數據中心規模,擴充存儲容量,還是采用新的科技手段,選擇新的存儲介質(zhì)來(lái)滿(mǎn)足海量數據的存取需求呢?
大數據下的數據取舍
要想解決上面提到的問(wèn)題,首先我們應該先了解現階段下海量數據的構成特點(diǎn)。以前的數據存儲基本是基于結構化數據進(jìn)行的,這些數據有一定的規律性,通過(guò)簡(jiǎn)單的機制就可以方便的存儲數據并能夠隨時(shí)獲取到相關(guān)信息。但是隨著(zhù)社交網(wǎng)絡(luò )以及智能設備的普及,任何一個(gè)人都能產(chǎn)生大量數據,而這些數據又雜亂無(wú)章,毫無(wú)規律可循,這些數據又被被稱(chēng)為非結構化數據。尤其是互聯(lián)網(wǎng)行業(yè),用戶(hù)在其平臺上所創(chuàng )造的視頻、文字、圖片更是缺少一定的信息標注,使得早期的數據中心很難區分數據類(lèi)型,對數據信息采取直接存儲的方式,極大降低了數據的可用性,并造成了一定的成本浪費。
在大數據時(shí)代,人們開(kāi)始重新審視數據的可用性以及重要性。由結構化數據和非結構化數據組成的海量數據對于企業(yè)的IT建設成本負擔占據多大比例?這些數據的可用性對于企業(yè)來(lái)說(shuō)是否能夠逐漸降低其投入產(chǎn)出比?如果要解決這些問(wèn)題,首先要從存儲其數據的介質(zhì)開(kāi)始說(shuō)起。
傳統機械硬盤(pán)存儲的弊端
我們知道自從硬盤(pán)被IBM這藍色巨人造出來(lái)后就一直承擔著(zhù)數據存儲的重擔,在企業(yè)IT基礎架構中,硬盤(pán)都是搭建IT整體架構的“板磚”。硬盤(pán)廠(chǎng)商通過(guò)技術(shù)更迭、廠(chǎng)商之間的各種收購,現在已經(jīng)形成了寡頭時(shí)代,如買(mǎi)了IBM硬盤(pán)業(yè)務(wù)的日立環(huán)球存儲被西部數據收購,更名HGST,西部數據也因此坐擁硬盤(pán)老大地位;由IBM前員工創(chuàng )辦的希捷公司,在收購邁拓、三星的硬盤(pán)業(yè)務(wù)后,也穩居硬盤(pán)市場(chǎng)第二,硬盤(pán)市場(chǎng)競爭激烈程度可見(jiàn)一斑。因為用戶(hù)的高需求量,才能創(chuàng )造市場(chǎng)的繁榮,份額大了,搶得人就會(huì )多,手段就會(huì )激烈。
那么這一對硬盤(pán)的高需求量在大數據、云計算時(shí)代下發(fā)生著(zhù)哪些變化呢?因為傳統機械硬盤(pán)單碟容量的限制,導致大多數用戶(hù)在面對海量數據時(shí)只能采取不斷擴容的手段來(lái)滿(mǎn)足數據存取的需求。而不斷的擴容必然導致設備能耗的增加以及空間資源的浪費,這也使企業(yè)陷入了一個(gè)“容量無(wú)底洞,金錢(qián)塞不夠”的狀況。另外,因為傳統機械硬盤(pán)的轉速、性能方面以及高可靠性等方面的局限,令用戶(hù)在存取大容量數據時(shí),增加一定的時(shí)間成本。再加上現在占據主流的非結構化數據的多樣性,讓用戶(hù)不再單單滿(mǎn)足于簡(jiǎn)單的數據存儲,而是需要在成千上萬(wàn)次的數據存取過(guò)程中去尋找數據價(jià)值,這對于一塊硬盤(pán)的性能有非常高的要求。
閃存的選擇
傳統機械硬盤(pán)無(wú)法滿(mǎn)足用戶(hù)的各種新需求,技術(shù)的發(fā)展又不能很快的跟隨著(zhù)用戶(hù)需求的變化速度,那么大家就開(kāi)始尋找其他類(lèi)型的存儲介質(zhì),閃存就被提了出來(lái)。顧名思義,閃存就是存取速度方面非常占優(yōu)的存儲介質(zhì)。閃存的出現有一定時(shí)間了,但是人們總是對它報以不信任感,除了價(jià)格昂貴,還有傳統的認知,小小芯片的存儲介質(zhì)實(shí)在難以讓傳統企業(yè)信任,還是大大的碟片看著(zhù)讓人舒服省心啊。到目前為止,很多金融機構仍然不敢將閃存作為高性能運算方面的主要存儲介質(zhì),也是出于對其不穩定性的擔憂(yōu)。
但是在性能方面,閃存絕對可以解決現在大數據時(shí)代下的各種需求。對海量數據的存取速度,已經(jīng)超過(guò)傳統機械硬盤(pán)的幾十倍,小而精的體積又讓傳統數據中心節約大量空間,并能夠節省能耗,為數據中心省下一大筆錢(qián)。當然了,“節省一大筆錢(qián)”的前提是這些閃存都是別人送你的。所以,現在閃存的應用還是走不出貴與不穩定的“高富帥”形象。兩大硬盤(pán)巨頭到現在也沒(méi)怎么發(fā)展固態(tài)硬盤(pán)業(yè)務(wù),可能也是說(shuō)明了市場(chǎng)選擇的一個(gè)大致方向。