Apache Hadoop助力企業(yè)應對他們最艱難的挑戰之一--利用海量數據創(chuàng )造價(jià)值。用戶(hù)普遍部署Hadoop框架,是因為它能夠幫助企業(yè)從各種不同類(lèi)型的大數據中獲得價(jià)值。獨立分析機構Forrester Research公司發(fā)布的《Forrester浪潮:大數據Hadoop解決方案》(2014年一季度版)報告顯示,Hadoop的開(kāi)源架構逐漸深入適應企業(yè)環(huán)境,其瘋狂的發(fā)展勢頭已無(wú)法阻擋。其全新獨特的數據管理方案正在幫助企業(yè)變革大數據存儲、處理、分析及共享的方式。
不斷發(fā)展的HADOOP技術(shù)
依托其技術(shù)優(yōu)勢,Hadoop已榮膺多項大獎,但與此同時(shí),與其真正所能提供技術(shù)能力相悖的錯誤消息及過(guò)度承諾也困擾著(zhù)這項技術(shù)。在部署Hadoop技術(shù)時(shí)提出不切實(shí)際的預期需求或誤入技術(shù)認知誤區,將導致浪費時(shí)間,費用上漲,業(yè)績(jì)乏善可陳。
了解Hadoop技術(shù)能力與限制,并相應制定安裝計劃,將在未來(lái)充分發(fā)揮Hadoop技術(shù)能力。了解Hadoop技術(shù)的真相,并避開(kāi)以下常見(jiàn)誤區,將幫助您順利部署Hadoop:
誤區一:Hadoop可替代數據倉庫
真相:Hadoop框架自身不是完整的數據或分析解決方案,也不是用作或替代數據倉庫的框架或平臺。就其自身而言,依托Hadoop技術(shù)開(kāi)發(fā)高成本效益的大數據平臺解決方案,與其它數據庫共享信息,使其成為數據倉庫的完美組合。依托Hadoop技術(shù),企業(yè)將能夠通過(guò)新的途徑充分利用各種類(lèi)型的海量數據。
誤區二:Hadoop技術(shù)曇花一現
真相:Hadoop倍受青睞,其發(fā)展勢頭看上去勢不可擋,因此,它不會(huì )曇花一現。《Forrester浪潮:大數據Hadoop解決方案》(2014年一季度版)報告稱(chēng),Hadoop框架是大型企業(yè)必備的數據平臺,是未來(lái)任何靈活數據管理平臺中最重要的組成部分。為充分利用Hadoop的技術(shù)優(yōu)勢,下一代數據倉庫將與Hadoop技術(shù)更深入地整合,管理規模更大,結構更復雜的數據集。
誤區三:Hadoop技術(shù)是免費的
真相:Hadoop的確是一套開(kāi)源產(chǎn)品,所有用戶(hù)均可免費下載。但使用該技術(shù)卻并非免費,甚至需要更高的成本。高效運用Hadoop技術(shù)需要接受?chē)栏衽嘤柕膶?zhuān)業(yè)人士,而長(cháng)期存儲數據亦需要高昂成本。考慮分析及多用戶(hù)因素,Hadoop技術(shù)的成本實(shí)際上要高于數據倉庫。除開(kāi)源技術(shù)外,廠(chǎng)商還銷(xiāo)售支持各種功能的專(zhuān)用應用程序,支持并拓展Hadoop使用范圍,為企業(yè)提供更多幫助。
誤區四:Hadoop解決方案是一款數據整合工具
真相:Hadoop實(shí)際上是專(zhuān)為特定數據類(lèi)型及負載設計的分布式文件系統。但該技術(shù)缺乏數據整合能力。如果Hadoop解決方案未能與大型數據管理生態(tài)系統結合使用,它將會(huì )成為另一個(gè)使信息相互隔離的數據孤島。一旦在數據倉庫環(huán)境下部署Hadoop技術(shù),用戶(hù)即可查詢(xún)數據倉庫及Hadoop中的信息。
誤區五:Hadoop是單一的開(kāi)源產(chǎn)品
真相:Hadoop是產(chǎn)品庫及技術(shù)庫,包括Hadoop分布式文件系統、MapReduce、Pig、Hive、Falcon、Knox等。多家廠(chǎng)商開(kāi)發(fā)Hadoop產(chǎn)品,并加入具有差異化優(yōu)勢的功能。例如,Hortonworks數據平臺幫助企業(yè)采集、處理并共享任意格式、任意規模的數據。并不是所有Hadoop產(chǎn)品都是開(kāi)源的.forrester報告稱(chēng),對Hadoop產(chǎn)品的需求使廠(chǎng)商面對競爭殘酷的市場(chǎng),他們需要抓住一切機會(huì )銷(xiāo)售他們特有的Hadoop解決方案。
釋放HADOOP技術(shù)的全部潛能
Hadoop為大型數據集存儲及處理提供可靠的解決方案,幫助企業(yè)克服以往數據使用成本高、數據結構復雜的困難,高效利用各種類(lèi)型的海量數據。雖然Hadoop技術(shù)用途廣、優(yōu)勢多,但它卻無(wú)法取代數據倉庫或數據整合工具。而通過(guò)與其它數據或分析解決方案整合,反而能夠提升Hadoop技術(shù)的價(jià)值。