• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>

    大數據熱背后的冷思考

    2012-11-22 09:59:31   作者:吳勇毅   來(lái)源:CCW    評論:0  點(diǎn)擊:


      繼云計算、社交網(wǎng)絡(luò )之后,如今大數據(Big Data)風(fēng)起云涌,已成為2012 年信息技術(shù)領(lǐng)域最時(shí)髦的詞匯之一。而相比大數據的興起,以前以商業(yè)智能分析而著(zhù)稱(chēng)的BI開(kāi)發(fā)商卻頗為失落。有人大膽預測,未來(lái)10年,與大數據相關(guān)的商務(wù)智能分析將引領(lǐng)管理信息化的發(fā)展。

      大數據

      真的那么必須?

      通常所說(shuō)的大數據是具有3種特性的數據,即大數據量(Volume)、高生成速度(Velocity)和多數據類(lèi)型(Variety)。大數據量指的是數據海量,如今有許多企業(yè)已經(jīng)面臨單日數據量以數十、數百TB的速度增加,而總數據量也達到了PB(Petabyte)等級,這樣的數據量已讓傳統的數據庫難以處理;高生成速度是指企業(yè)數據增加的速度越來(lái)越快,諸如移動(dòng)化、社交網(wǎng)絡(luò )的廣泛應用,使得數據增加的速度比傳統的企業(yè)應用程序要快很多,一旦數據增生速度加快,數據處理、分析的速度也得跟上;多數據類(lèi)型是指數據的多樣性,時(shí)下人們上互聯(lián)網(wǎng)不只是看看資訊,同時(shí)也在不斷地產(chǎn)出數據:上傳照片、上傳視頻、發(fā)微博;另一方面,IT深入工作生活中的各個(gè)角落,各種各樣的傳感器、監控器也時(shí)刻不斷產(chǎn)生各種數據,數據的形式已日趨復雜、多樣了。這就催生了大數據技術(shù)的強烈需求。

      雖然如何解決日漸緊迫的大數據處理已成了企業(yè)管理信息化、現代化的必然需求,但國內的大數據領(lǐng)域到底有多活躍?大數據真的如一些廠(chǎng)商所描繪的那么強大、好用,成為每個(gè)企業(yè)所必需的嗎?

      在一片叫好聲中,部分專(zhuān)家和業(yè)內人士顯得小心謹慎,甚至不乏非議。一些專(zhuān)家認為,除了大量的研討會(huì )和各類(lèi)公司宣稱(chēng)進(jìn)軍大數據領(lǐng)域的雄心之外,其實(shí)際進(jìn)展至今難見(jiàn)成效。許多企業(yè)CIO認為,國內能利用大數據背后的價(jià)值的行業(yè)主要集中在金融、電信、能源、證券、煙草等超大型、壟斷型企業(yè),其他行業(yè)談大數據為時(shí)尚早,大數據在企業(yè)的應用并不是說(shuō)只要開(kāi)放了數據、應用一些技術(shù)就可以輕易地發(fā)現“金礦”。目前國內大數據應用似乎正在呈現這樣的狀態(tài):投資人活躍,技術(shù)和服務(wù)供應商熱心,媒體高調,而大量應用企業(yè)迷惑。

      有人更是批評“大數據是在既有的方案上包裝了一下,實(shí)質(zhì)是新瓶裝舊酒,只不過(guò)更時(shí)髦”,海量數據時(shí)代的數據應用并沒(méi)有給多少企業(yè)帶來(lái)革命性的變化,在 MapReduce(Hadoop中采用的編程模型,用于大規模數據集的并行運算)出現之前,也有企業(yè)能夠輕松地對數據進(jìn)行大規模并行計算了,而 NoSQL 的出現也只是為處理數據的方式帶來(lái)了更多選擇罷了,并沒(méi)有革命性、實(shí)質(zhì)性的飛躍。比如,某廠(chǎng)商說(shuō),利用其大數據技術(shù),電子商務(wù)網(wǎng)站就能知道“什么地方的人買(mǎi)東西最瘋狂”或是“什么型號手機最好賣(mài)”,這就是大數據分析的結果。對此有專(zhuān)家反駁“難道同樣基于數據倉庫系統的BI分析出來(lái)的結果和基于這個(gè)大數據出來(lái)的結果會(huì )有不同?”

      的確,從某些大數據應用中能挖掘出新的價(jià)值,但這個(gè)價(jià)值只是附加價(jià)值,沒(méi)有理由去夸大它,更沒(méi)有理由去無(wú)端地想象。大數據是機會(huì ),但現階段還只是少數人的機會(huì ),更多的是巨頭們的商業(yè)謀略。”廈門(mén)一位電子公司CIO也認為,“一些企業(yè)所需要的數據挖掘,傳統列式數據就能很好地處理。與其參加各種口沫橫飛的會(huì )議,還不如和工程師聊聊可以運用什么更實(shí)用的工具來(lái)解決具體問(wèn)題。”

      大數據當立

      BI當下?

      讓大數據取代BI也是當下熱議的話(huà)題。實(shí)際上,大數據與BI之間的確存在著(zhù)天然聯(lián)系,但并不是互相替代、排斥的關(guān)系。大數據與BI一個(gè)主要區別在于:與傳統基于事務(wù)的數據倉庫系統相比較,其能在BI的基礎上進(jìn)行更大容量數據和非結構化數據處理,大數據分析不僅關(guān)注結構化的歷史數據,它們更傾向于去對Web、社交網(wǎng)絡(luò )、RFID傳感器等非結構化海量數據進(jìn)行更好地分析。整體相比BI而言,大數據更寬泛。

      以EMC公司的 Greenplum核心產(chǎn)品線(xiàn)為例,它分為Greenplum Database(數據倉庫)、Greenplum HD(Hadoop分析)和Greenplum DCA(數據計算設備),后者還是基于高性?xún)r(jià)比的工業(yè)標準x86服務(wù)器的MPP(大規模并行處理)分布式可擴展架構。這三個(gè)產(chǎn)品歸于一個(gè)產(chǎn)品線(xiàn)也可以看出傳統BI和大數據之間的內在聯(lián)系。

      誠然,海量增長(cháng)的非結構化、半結構化數據中確實(shí)有值得深入挖掘的價(jià)值,但這并不等于人們就要采用全新的方法、工具來(lái)處理它們。正如需求是漸進(jìn)式的增長(cháng)一樣,業(yè)務(wù)的變革也要以漸進(jìn)式為主。

      筆者認為,大數據的創(chuàng )新性、先進(jìn)性與前瞻性,不容否定,值得肯定,但當有人提出“大數據當立,BI當下”之論,就顯得過(guò)分武斷。在如今細分制勝的時(shí)代,功能并不是越多越好,功能過(guò)多反而顯得累贅,增加無(wú)謂費用。Gartner研究公司BI分析師RitaSallam曾表示,“大數據讓BI更有價(jià)值和更有利于業(yè)務(wù)發(fā)展。我們總是會(huì )需要看看過(guò)去的數據,當你擁有大數據時(shí),你更應該這樣做。BI并不會(huì )被大數據取代消失,它的作用通過(guò)大數據被放大了。至少在相當長(cháng)的時(shí)期內,大數據還難于取代傳統BI。”

      時(shí)至今日,各種關(guān)于大數據與BI軟件誰(shuí)優(yōu)誰(shuí)劣的交鋒仍不斷泛起,對用戶(hù)而言,必須認真權衡,到底利用大數據后能給企業(yè)帶來(lái)了多少額外的價(jià)值?這種增加的價(jià)值是否能讓企業(yè)的投入值得?而且更為重要的一點(diǎn)是,是否只要使用大數據就一定能夠給企業(yè)帶來(lái)以前不可能實(shí)現的價(jià)值?這些是當下用戶(hù)們最需要重點(diǎn)考慮的。

    分享到: 收藏

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 桐庐县| 团风县| 且末县| 依兰县| 康乐县| 屯昌县| 勐海县| 化德县| 鄄城县| 延川县| 集贤县| 玉山县| 上高县| 金溪县| 翁牛特旗| 章丘市| 乌拉特中旗| 措勤县| 息烽县| 秦安县| 清丰县| 广宗县| 中宁县| 江北区| 高阳县| 普宁市| 巨鹿县| 肥东县| 商洛市| 建昌县| 阳朔县| 安顺市| 民和| 黄石市| 格尔木市| 上犹县| 蕲春县| 通榆县| 长汀县| 广州市| 英吉沙县| http://444 http://444 http://444 http://444 http://444 http://444