近期市場(chǎng)調研公司Gartner發(fā)布了一份關(guān)于企業(yè)在大數據方面的支出情況報告;IBM和牛津大學(xué)聯(lián)合發(fā)布了一份大數據研究報告;Teradata宣布推出MPP技術(shù)和Hadoop的整合新設備。
據外國媒體報道稱(chēng),本月將是一個(gè)大數據新聞的“循環(huán)月”,本周在紐約舉辦的“Strata + Hadoop World ”上將發(fā)布一系列公告,所以在前兩周就做了鋪墊。
關(guān)于“支出”
據技術(shù)研究和咨詢(xún)公司Gartner指出,大數據將帶動(dòng)2012年全球280億美元的IT支出,2013年帶動(dòng)的IT支出規模可望進(jìn)一步增至340億美元。 而到2016年全球在大數據方面的總花費將達到2320億美元。
Gartner還表示,到2020年,大數據將成為主流的嵌入式技術(shù),特性和功能會(huì )是非差異化,并被傳統企業(yè)供應商視為常規產(chǎn)品的一部分。大數據在2020年前會(huì )再度成為“單純數據”,如果架構主張、基礎設施和軟/硬件若無(wú)法適應這一‘新標準’將遭淘汰。組織機構如若抗拒這一改變會(huì )將面臨嚴重的經(jīng)濟沖擊。有業(yè)內人士認為,此趨勢會(huì )促使企業(yè)的合并風(fēng)潮。
關(guān)于大數據研究
據IBM和牛津大學(xué)的研究包括:大數據的實(shí)際使用情況;創(chuàng )新型企業(yè)如何從不確定數據中提取有價(jià)值數據,該報告最終被整理為一本20頁(yè)的出版物,其內容還包含了在95個(gè)國家的1144業(yè)務(wù)和IT專(zhuān)業(yè)人士的調查結果。此外,它還涵蓋了大數據的定義;調查常見(jiàn)的大數據基礎設施;討論大數據的最高數據來(lái)源分析、功能和采用階段(連同他們的贊助商,數據可用性及障礙),并為如何采用及培養大數據提出了一系列建議。
分析師分享了以下四個(gè)“有趣”的數據:
- 前四位的大數據來(lái)源包括:交易數據、記錄數據、“事件”和電子郵件;
- 前五位的大數據能力包括:數據挖掘,數據可視化,預測建模與數據“優(yōu)化”;
- 只有6%的受訪(fǎng)者表示在“執行”階段利用大數據(47%仍處于“探索”階段);
- 63%的受訪(fǎng)者表示,使用大數據分析為他們提升了競爭優(yōu)勢;
關(guān)于大數據設備
Teradata在新的大數據設備產(chǎn)品發(fā)布前先公布了兩條消息:首先、該公司宣布其新的數據分析設備,新設備混合了Teradata的SQL-MapReduce技術(shù)。此外,Teradata將與Hortonworks合作,TeraData與Hortonworks的合作旨在幫助企業(yè)建立基于Hadoop的大數據分析環(huán)境。兩家公司將嘗試幫助企業(yè)利用Hadoop與現有的Teradata數據和Teradata Aster分析技術(shù)無(wú)縫結合。
SQL/MapReduce(簡(jiǎn)稱(chēng)SQL/MR)是Aster Data的一個(gè)框架,支持當前流行的Java和C預言,用戶(hù)可以將代碼安裝在nCluster中,可以在數據庫中由SQL調用,系統將自動(dòng)并行執行。
Teradata認為,當前非結構化的數據增長(cháng)更快,每天都產(chǎn)生大量的數據,分析的豐富程度也在增加。因此,大數據的分析,需要一個(gè)快速的、簡(jiǎn)單的、scale-up的分析平臺。