• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>

    依托云計算,挖據大數據背后的價(jià)值

    2014-09-09 10:51:56   作者:中國工程院院士 李德毅   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      云計算是信息技術(shù)發(fā)展和信息社會(huì )需求到達一定階段的必然結果。云計算技術(shù)的創(chuàng )新帶動(dòng)了新的商業(yè)模式的成功,對現有電子信息產(chǎn)業(yè)及應用模式產(chǎn)生了巨大的震動(dòng),有著(zhù)深遠的影響.iDC預測,未來(lái)3年全球云計算領(lǐng)域將有8000億美元的新業(yè)務(wù)收入。整個(gè)“十二五”期間,我國云計算領(lǐng)域的產(chǎn)業(yè)規模預計可達7500~10000億元人民幣。目前,全球各大IT廠(chǎng)商正競相進(jìn)入云計算領(lǐng)域,以占據新一代信息技術(shù)的制高點(diǎn)。

    \

      云計算需避免兩大誤區

      在政府和業(yè)界的雙重推動(dòng)下,云計算已經(jīng)變得炙手可熱,成為新興產(chǎn)業(yè)中最熱門(mén)的領(lǐng)域。這說(shuō)明云計算已經(jīng)從“不知所云”到深入人心,同時(shí)也存在隱憂(yōu)和困擾。其中的問(wèn)題主要體現在兩個(gè)方面:

      一方面是對于“云泡沫”的擔憂(yōu)。據有關(guān)調查,很多地方投巨資建成了所謂的“云”系統,但資源利用率卻不足20%,云計算中心成了形象工程,甚至成了變相的商業(yè)地產(chǎn)項目。云計算本身是一種綠色計算,不是比規模、比設備、比廠(chǎng)房,發(fā)展云計算不能變成簡(jiǎn)單的圈錢(qián)圈地,而要盡可能避免重復建設和資源浪費,將云計算產(chǎn)業(yè)落到實(shí)處,讓消費者受益于云計算。因此,云計算的創(chuàng )新應用,是云計算產(chǎn)業(yè)健康發(fā)展的試金石。

      另一方面是云計算被作為萬(wàn)能包裝過(guò)度渲染,仿佛什么都可以云化,在互聯(lián)網(wǎng)上什么都是云計算,以至于消費者和投資者常常困擾于對真“云”和假“云”的辨別。云計算的本質(zhì)特征是什么?首先,云計算是一種基于互聯(lián)網(wǎng)、大眾參與的計算模式,云計算的基本應用場(chǎng)景應該直接面向互聯(lián)網(wǎng),所需要的資源不在客戶(hù)端而是來(lái)自網(wǎng)絡(luò ),即通過(guò)網(wǎng)絡(luò )提供企業(yè)和個(gè)人所需要的計算力、存儲空間、軟件功能和信息服務(wù)等;其次,云計算的服務(wù)一定具有較高的可伸縮能力,云計算的服務(wù)資源能夠隨著(zhù)應用需求自動(dòng)地動(dòng)態(tài)調整,既能夠在幾分鐘甚至數秒之內,自動(dòng)地增加服務(wù)資源的數量、提升服務(wù)能力來(lái)應對網(wǎng)絡(luò )的尖峰流量,又能隨著(zhù)應用的減少,動(dòng)態(tài)減少服務(wù)資源。

      云計算支撐大數據發(fā)展

      大數據(Big Data)這個(gè)概念近年來(lái)在越來(lái)越多的場(chǎng)合被越來(lái)越多的人提及,并且經(jīng)常是和云計算聯(lián)系在一起。大數據無(wú)疑將給人類(lèi)社會(huì )帶來(lái)巨大的價(jià)值,科研機構可以通過(guò)大數據業(yè)務(wù)協(xié)助進(jìn)行研究探索,如環(huán)境、資源、能源、氣象、航天、生命等領(lǐng)域的探索。那么云計算和大數據之間到底是什么關(guān)系呢?概括而言,沒(méi)有互聯(lián)網(wǎng)就沒(méi)有云計算模式,沒(méi)有云計算模式就沒(méi)有大數據處理技術(shù)。

      然而,云計算環(huán)境同樣對大數據處理技術(shù)提出了新的挑戰,這主要反映在傳統的關(guān)系數據庫不能滿(mǎn)足大數據處理的要求,比如海量用戶(hù)的高并發(fā)讀寫(xiě)、海量數據的高效存儲和訪(fǎng)問(wèn)、系統的高可用性和高擴展性等。為此,業(yè)界一些廠(chǎng)商先后研發(fā)了一批包含分布式數據緩存、分布式文件系統、非關(guān)系型數據庫和新關(guān)系型數據庫等新技術(shù)來(lái)解決上述問(wèn)題。

      同樣,由于海量數據的大數據量和分布性的特點(diǎn),使得傳統的數據處理技術(shù)不適合于處理海量數據。這對海量數據的分布式并行處理技術(shù)提出了新的挑戰,開(kāi)始出現以MapReduce為代表的一系列新處理技術(shù),像數據并行處理技術(shù)、增量處理技術(shù)、流式計算技術(shù)等。

      云計算時(shí)代會(huì )有更多的數據存儲于計算中心。數據是資產(chǎn),云是數據資產(chǎn)保管的場(chǎng)所和訪(fǎng)問(wèn)的渠道。大數據的處理和分析必須依靠云計算提供計算環(huán)境和能力,挖掘出適合于特定場(chǎng)景和主題的有效數據集。比如,《紐約時(shí)報》用云計算轉換了1851年到1922年超過(guò)40萬(wàn)張掃描的圖片,通過(guò)把任務(wù)分配給幾百臺電腦,這項工作在36個(gè)小時(shí)內就完成了;信用卡公司Visa計算兩年的紀錄,包括730億筆交易、高達36TB的數據,處理時(shí)間用傳統方法需要1個(gè)月,而采用基于Hadoop的處理技術(shù)只要13分鐘。

      挖掘數據背后的價(jià)值

      在互聯(lián)網(wǎng)時(shí)代,特別是進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代后,人們只有通過(guò)數據挖掘才能從海量的低價(jià)值密度的數據中發(fā)現其潛在價(jià)值。移動(dòng)互聯(lián)網(wǎng)時(shí)代的大數據挖掘,主要是網(wǎng)絡(luò )環(huán)境下的非結構化數據挖掘,這些數據形態(tài)反映是鮮活的、碎片化的、異構的原生態(tài)數據。這種非結構化數據有什么特點(diǎn)呢?它常常是低價(jià)值、異構、冗余的數據,甚至有部分數據放在存儲器里沒(méi)再用過(guò)。與此同時(shí),數據挖掘關(guān)注的對象也發(fā)生了很大改變,挖掘關(guān)注的首先是小眾,只有先滿(mǎn)足小眾挖掘的需求,才談得上滿(mǎn)足由更多小眾組成的大眾的需求,因此移動(dòng)互聯(lián)網(wǎng)時(shí)代數據挖掘的一個(gè)重要思想,就是“由下而上”勝過(guò)“由上而下”的頂層設計,強調挖掘數據的真實(shí)性、及時(shí)性,要發(fā)現關(guān)聯(lián)、發(fā)現異常、發(fā)現趨勢,并最終發(fā)現價(jià)值。

      事實(shí)上,互聯(lián)網(wǎng)上交互的大眾,不僅在享受服務(wù),也在提供信息。公眾的在線(xiàn)行為已經(jīng)不能僅僅用瀏覽、搜索或挖掘來(lái)表征,正在演化為迅速地創(chuàng )造內容,涌現出群體智能。小眾的局部積聚特性又可以形成較大范圍的“大眾”特性,小眾成為大眾的基礎。對公眾、大眾和小眾的認識為我們認知人類(lèi)在不同尺度上的所謂微觀(guān)、中觀(guān)或者宏觀(guān)的群體行為,為認知群體中的競爭與協(xié)作提供了機會(huì )。因此人們在進(jìn)行數據挖掘的過(guò)程中要注重網(wǎng)絡(luò )化大數據挖掘的方法,也即社區與社區發(fā)現。例如,無(wú)線(xiàn)T恤公司(Threadless)是一個(gè)在線(xiàn)T恤零售商兼創(chuàng )作聚落,該網(wǎng)站透過(guò)用戶(hù)設計及用戶(hù)投票選出得票最高的T恤,讓使用者能夠分享自行設計的T恤圖案的同時(shí),也讓獲勝者得到一定的酬金.threadless已經(jīng)成為商業(yè)和社區模式雙贏(yíng)的典范,每周都能收到800多個(gè)新的設計方案,每天有超過(guò)1000名新注冊用戶(hù)來(lái)進(jìn)行設計和藝術(shù)方面的討論,并根據設計方案所激發(fā)的靈感提交配套的音樂(lè )和視頻。

      今天,互聯(lián)網(wǎng)帶寬正以每6個(gè)月翻一番的速度在發(fā)展,它比每9個(gè)月翻一番的存儲發(fā)展速度和每18個(gè)月翻一番的計算發(fā)展速度都要快,帶寬的迅猛發(fā)展讓人類(lèi)進(jìn)入了交互時(shí)代,而交互又帶動(dòng)著(zhù)計算和存儲加速前進(jìn)。

      大數據標志一個(gè)新時(shí)代的到來(lái),這個(gè)時(shí)代的特征不只是追求豐富的物質(zhì)資源,也不只是無(wú)所不在的互聯(lián)網(wǎng)帶來(lái)方便的多樣化的信息服務(wù),同時(shí)還包含區別于物質(zhì)的數據資源的價(jià)值挖掘,以及價(jià)值轉換等等。而大數據也將在云計算技術(shù)等的支撐下發(fā)掘出更多的價(jià)值。

    分享到: 收藏

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 福建省| 潜山县| 广水市| 阿合奇县| 莱州市| 美姑县| 宜兰县| 金坛市| 榆中县| 封开县| 额济纳旗| 广汉市| 巴青县| 栾川县| 保定市| 澄城县| 静安区| 马山县| 佛坪县| 永济市| 滨州市| 工布江达县| 临猗县| 怀宁县| 淄博市| 莆田市| 永嘉县| 吉林市| 金乡县| 潢川县| 花垣县| 临邑县| 炎陵县| 望城县| 兰西县| 天峻县| 大理市| 河源市| 蛟河市| 西乡县| 巴彦淖尔市| http://444 http://444 http://444 http://444 http://444 http://444