2013年中國互聯(lián)網(wǎng)大會(huì )在京召開(kāi)。中國互聯(lián)網(wǎng)協(xié)會(huì )理事長(cháng)、中國工程院院士鄔賀銓在論壇中針對未來(lái)互聯(lián)網(wǎng)趨勢做了三個(gè)方面的內容分享:互聯(lián)網(wǎng)產(chǎn)生大數據、大數據變革互聯(lián)網(wǎng)、大數據引發(fā)新業(yè)態(tài)。互聯(lián)網(wǎng)產(chǎn)生大數據,一個(gè)大數據變革互聯(lián)網(wǎng),然后大數據引發(fā)新業(yè)態(tài);到2015年所有的數據中心一半多以上都是云計算中心,都是大容量的;將來(lái)云計算的出現會(huì )把用戶(hù)以信息源為中心,向以能源為中心改變,中心節點(diǎn)發(fā)生變化。
下面是演講實(shí)錄:
鄔賀銓?zhuān)褐x謝主持人
各位專(zhuān)家下午好,我報告題目是大數據時(shí)代的互聯(lián)網(wǎng),講三個(gè)方面內容,一個(gè)互聯(lián)網(wǎng)產(chǎn)生大數據,一個(gè)大數據變革互聯(lián)網(wǎng),然后大數據引發(fā)新業(yè)態(tài)。
一、互聯(lián)網(wǎng)產(chǎn)生大數據。城市里幾十萬(wàn)個(gè)攝象頭能產(chǎn)生數百個(gè)TB的數據;每個(gè)飛機來(lái)回也能產(chǎn)生TB量級的數據;用戶(hù)上網(wǎng)也產(chǎn)生大量的數據;醫療領(lǐng)域也是一個(gè)大數據,一個(gè)大腦CT掃描圖要讓它分辨率很高,微米的數據量產(chǎn)生4.5TB的數據。像北京大學(xué)301醫院門(mén)診量一萬(wàn)人,同時(shí)按照醫療規定一個(gè)患者的數據要保存50年。廣州中山大學(xué)醫院,2008年這個(gè)醫院數據是100個(gè)TB、到2013年是1000個(gè)TB。淘寶網(wǎng)去年光棍節每分鐘幾十個(gè)TB的數據,騰訊每天有5萬(wàn)次計算,所以可以看到網(wǎng)絡(luò )有很多大數據。
美國的網(wǎng)站每分鐘有72小時(shí)視頻監控上載,互聯(lián)網(wǎng)達到720TB每秒,相當于全世界有6億人同時(shí)看不同的高清電影。2016年互聯(lián)網(wǎng)三分鐘傳授300萬(wàn)小時(shí)的視頻,相當于所有全世界生產(chǎn)電影,要34年不吃飯不睡覺(jué)才可以看完電影。最近美國網(wǎng)站上載的網(wǎng)量等于美國三大電視臺所有電視播出總和。今年五月份中國視頻網(wǎng)有3.95億,當時(shí)統計網(wǎng)民是5.95億。這個(gè)圖象左邊圖是互聯(lián)網(wǎng)的網(wǎng)民人均一個(gè)月使用的流量,08年達到一個(gè)G,到明年人均下載流量超過(guò)十個(gè)G。
現在大概全世界新產(chǎn)生的數據量每年增加14%,也就是說(shuō)互聯(lián)網(wǎng)每?jì)赡攴环?012年和2013年互聯(lián)網(wǎng)所產(chǎn)生的流量等于人們有意識以來(lái)一直到2011年所產(chǎn)生的數據量總和, 2011年全世界互聯(lián)網(wǎng)總量1.8個(gè)GB。2020年全世界的數據達到40個(gè)GB。這個(gè)重量相當于多少,相當于424艘美國的尼美茲號航母。
第二、大數據變革互聯(lián)網(wǎng),大數據出現對互聯(lián)網(wǎng)有很大的影響。有一種方式是演進(jìn)型的,還有不考慮和互聯(lián)網(wǎng)兼容我們說(shuō)革命性。兩個(gè)方面技術(shù)提案彼此可以相用。現在很難說(shuō)哪一種更能解決,總得來(lái)說(shuō)我們希望互聯(lián)網(wǎng)更安全更可信的。現在提的方式物理和邏輯分離,物理上有71個(gè),和邏輯上分割辦法對應不同服務(wù),有視頻的服務(wù),數據服務(wù),不同服務(wù)要求的服務(wù)質(zhì)量是不一樣的,所以物理上是一個(gè)網(wǎng)絡(luò ),邏輯上可以組成不同網(wǎng)絡(luò ),我們說(shuō)把網(wǎng)絡(luò )虛擬化,物理和邏輯分離。
其次傳統路由器,有傳送功能,也有控制功能,有業(yè)務(wù)功能,大數據出現我們發(fā)現網(wǎng)絡(luò )上時(shí)空不對應,很難判斷我哪個(gè)地方流量最高,因此現在變法把路由器網(wǎng)絡(luò )控制功能抽出來(lái),形成一個(gè)網(wǎng)絡(luò )控制系統,把業(yè)務(wù)功能抽出來(lái)形成業(yè)務(wù)系統。靈活實(shí)現控制平面的建構,對于大數據流量是一種改型。隨著(zhù)流量增大,大部分流量過(guò)路多,落地少,凡是在光強上做的,就別在電廠(chǎng)做,凡是在IP上可以做的就不再I(mǎi)PO上做。IPO總召喚轉變?yōu)槌休d,這只是一個(gè)包裝,不是做一個(gè)召喚的功能了。召喚我們應該將來(lái)向召喚中心,要從承載分開(kāi)。另外就是傳統互聯(lián)網(wǎng)IP地址表示主機的身份,移動(dòng)互聯(lián)網(wǎng)的出現這個(gè)計算機從這到這里,位置變了,用戶(hù)的身份沒(méi)有變。身份和位置分離,身份在應用層面表示,這樣分離好處支持移動(dòng)性改變安全性。
信源中心和信息中心分離,這個(gè)圖我們可以看到數據中心的發(fā)展,藍色的是云計算數據中心,綠色是傳統數據中心,從這個(gè)圖可以看到到2015年所有的數據中心一半多以上都是云計算中心,都是大容量的。云中心一般考慮放在什么地方?一般考慮氣候、能源工業(yè),我們國家云計算中心會(huì )向高緯度地區集中,比如說(shuō)內蒙一些涼快的地方遷徙,像谷歌把他云計算中心放在摩洛哥,因為那比較涼快。數據中心大部分在北京、上海、廣州,而未來(lái)數據中心會(huì )放在內蒙偏遠的地方,將來(lái)云計算的出現會(huì )把用戶(hù)以信息源為中心,向以能源為中心改變,中心節點(diǎn)發(fā)生變化。過(guò)去我們上海、北京、廣州是中心,現在隨著(zhù)大數據出現發(fā)現了不能這樣做,我們需要增加這個(gè)數據和中心,美國網(wǎng)建互聯(lián)中心有八個(gè),我們現在有三個(gè),中信部有計劃增加這個(gè)中心。
全世界看來(lái)峰值國際流量增加3%,這個(gè)絕對值國際流量增加,相對值就是說(shuō)拉丁美洲的用戶(hù)到美國訪(fǎng)問(wèn)量占整個(gè)國家的流量比較,亞洲、歐洲、和非洲的。盡管?chē)H流量增加,但是國際流量占整個(gè)流量比例是下降的,直接互聯(lián)導致全國互聯(lián)網(wǎng)去中心化。現在谷歌紛紛在中國香港等等地方上節點(diǎn),這時(shí)候對外的訪(fǎng)問(wèn)沒(méi)必要跨洋過(guò)海到美國去訪(fǎng)問(wèn),你可以在本地,這個(gè)意義上國際互連網(wǎng)流量比例在下降,所以說(shuō)全球互聯(lián)網(wǎng)去中心化。另外大數據區域網(wǎng)絡(luò )扁平化,這是中國電信的圖,現在隨著(zhù)大數據出現所有省之間都直連,不這樣安排根本沒(méi)有辦法支持這么大的流量。還有城域網(wǎng)的體系化,大計算機大的主機,我們很時(shí)髦客戶(hù)服務(wù)器,所有客戶(hù)訪(fǎng)問(wèn)網(wǎng)絡(luò )都到服務(wù)器上,一個(gè)熱門(mén)的結果這個(gè)服務(wù)器要傳送無(wú)數遍給終端,每個(gè)終端需要在熱門(mén)的地方下載一小部分,另外一個(gè)終端小在另外一小部分互相交換。我們叫P2P。這個(gè)終端訪(fǎng)問(wèn)服務(wù)器數據量很大,不是一個(gè)服務(wù)器裝得下的,你可能只訪(fǎng)問(wèn)一次,但是服務(wù)器的交換很多,基本以上服務(wù)器之間在增長(cháng),進(jìn)一步發(fā)展服務(wù)器增長(cháng)變成云了,過(guò)去我們是客戶(hù)的服務(wù)器,現在客戶(hù)到云C2C,城域網(wǎng)體系要進(jìn)行云化。
內容分配網(wǎng)絡(luò )化,為了讓用戶(hù)更好更快接受,我們要做內容分配網(wǎng)。我們國家電信運營(yíng)商在靠近用戶(hù)的地方建了很多CDN,這樣適應大家更快訪(fǎng)問(wèn)視頻,CDN的部署對互聯(lián)網(wǎng)流量流向產(chǎn)生了影響,我們國際互連網(wǎng)占比是降低的,我們網(wǎng)間流量比例也是降低的,絕對值增加,但是本地化的訪(fǎng)問(wèn)更多了,遠端的訪(fǎng)問(wèn)降下來(lái)了。
移動(dòng)網(wǎng)絡(luò )一樣,我們過(guò)去電話(huà)走電流交換,我們原來(lái)有基站,激戰控制器網(wǎng)關(guān)。還有移動(dòng)通訊天線(xiàn)分布化,我們國家移動(dòng)通訊呼叫2009年所有呼叫發(fā)生室內是63%,家里29%,辦公室占14%,越是大數據時(shí)代這個(gè)比例越來(lái)越高,室內轉到WIFI,WIFI多了互相干擾,使用小蜂窩的技術(shù),可以范圍很小,損耗很小,因此調試率可以增加。一個(gè)蜂窩分成多個(gè)分布式的天線(xiàn),這樣有些蜂窩加上基站,但是蜂窩之間是統籌的,干擾統籌來(lái)解決數據量的傳輸問(wèn)題。
從互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)將帶來(lái)很大變化。互聯(lián)網(wǎng)原來(lái)面向有線(xiàn),由此用TC和IP沒(méi)有問(wèn)題。可是移動(dòng)互聯(lián)網(wǎng)的無(wú)線(xiàn)電路不可靠,如果繼續用TCPR老同選,因此需要加入糾錯編碼,互聯(lián)網(wǎng)面向PC端的,移動(dòng)互聯(lián)網(wǎng)自動(dòng)檢測網(wǎng)絡(luò )的帶寬和分辨。在傳統電話(huà)話(huà)音傳一百米到六百米,需要傳一筆先令。
IBM從互聯(lián)網(wǎng)新聞上PMI,一般PMI是政府上。美國印地安納大學(xué)的學(xué)者,與谷歌提供情緒,從用戶(hù)盡千萬(wàn)留言算道瓊斯指數準確率到87%,淘寶的CPI和國家統計的CPI不一樣,但是淘寶的CPI更能反映我們物價(jià)搬動(dòng)。國家統計局的CPI主要參數是食品,經(jīng)濟好與不好除非太差人們才會(huì )把食品開(kāi)支省下來(lái),否則不會(huì )省吃飯的錢(qián),淘寶反映買(mǎi)服裝首飾,如果經(jīng)濟不好會(huì )反映出來(lái),所以首長(cháng)到淘寶看了一下說(shuō)你們每天把這個(gè)數據送到中南海。大數據提供咨詢(xún)服務(wù),有一個(gè)人收集各個(gè)地塊的產(chǎn)量和數據,哪個(gè)農產(chǎn)主問(wèn)我明年種什么賺錢(qián),他說(shuō)賠了我賠你,比保險還要高。我在山東壽光看那個(gè)橫幅,他說(shuō)當地黃瓜一塊錢(qián)一斤,當地黃光一毛錢(qián)一斤。農業(yè)除了天氣占領(lǐng)市場(chǎng)心聲,沒(méi)有完全對企業(yè)都好的心聲,可以用大數據提供咨詢(xún)服務(wù),還可以利用大數據到超市買(mǎi)東西,到超市買(mǎi)東西都打出條來(lái),超市可以根據這個(gè)調配貨物。哪些客戶(hù)是最好買(mǎi)東西的客戶(hù),女性顧客最能舍得出買(mǎi)東西,女性里面孕婦,找出一些孕婦最常買(mǎi)的產(chǎn)品,沒(méi)有刺激性的化妝品,關(guān)注一些嬰兒東西等等,他判斷這個(gè)是嬰兒會(huì )把信息推送給他。
人人網(wǎng)通過(guò)客戶(hù)關(guān)系的分析,游戲業(yè)務(wù)取得100%的增長(cháng)。大家淘寶上買(mǎi)東西阿里公司把你的IP地址記下來(lái),買(mǎi)首飾的用戶(hù)IP地址,買(mǎi)化妝品的用戶(hù)IP地址,買(mǎi)服裝的IP地址,拿出來(lái)讓賣(mài)化妝品和服裝人競價(jià)買(mǎi)這個(gè)IP地址。也就是阿里和商家網(wǎng)店得可以賺錢(qián)。百度搜索排名優(yōu)先推薦,央視廣告效果誰(shuí)知道怎么樣?央視去年的廣告收入269億人民幣,百度廣告收入229億人民幣,百度廣告連增50%幾,央視才增百分之十幾,現在發(fā)現百度是我的競爭對手。
另外推動(dòng)視頻與互聯(lián)網(wǎng)的融合,樂(lè )視網(wǎng)買(mǎi)到甄環(huán)傳的網(wǎng)絡(luò )播出獨家權,搜狐視頻拿下了中國好聲音的版權,還有騰訊視頻有一些快男被淘汰了,還可以復活,靠什么在YY上買(mǎi)東西復活選手。現在變成一個(gè)新媒體的融合平臺。大數據提供集資服務(wù),我們經(jīng)濟有壓力,壓力根據中小企業(yè)在平臺上的表現,選出放心的中小企業(yè),放貸一千多個(gè)億,壞賬率只有1.3%。今年7月份統計阿里靠貸款每天利息一百萬(wàn),京東收購了網(wǎng)民在線(xiàn),從信用卡分期貸款,你在京東買(mǎi)東西留地址什么,他提供貸款。蘇寧建立小貸公司解決貸款問(wèn)題,他為了他的營(yíng)銷(xiāo)創(chuàng )造很好的條件。
剛才是說(shuō)互聯(lián)網(wǎng)企業(yè)進(jìn)入金融,那么金融企業(yè)也不能坐以待斃,平安保險跟百度合作,涵蓋保險銀行投資,利用大數據分析消費者在網(wǎng)絡(luò )的消費情況。中信銀行使營(yíng)銷(xiāo)模式陪送從2周縮短到兩天,客戶(hù)開(kāi)發(fā)率提高30%。互聯(lián)網(wǎng)企業(yè)進(jìn)入金融迫使金融企業(yè)加快互聯(lián)網(wǎng)化。
銀行業(yè)進(jìn)入電商,過(guò)去我們銀行業(yè)不做電子商務(wù),現在平安銀行做電子商務(wù),把握客戶(hù)偏好本身習慣包括風(fēng)險,搞了平安好車(chē)網(wǎng),到這個(gè)網(wǎng)上告訴你什么車(chē)型什么比較,4S店服務(wù)怎么樣。同時(shí)它做金融不能只提供這個(gè),涉及貸款、租賃二手車(chē)抵押這一塊,建行、招行、民生銀行等等統統往電子商務(wù)發(fā)展。把街景數據獲得我們開(kāi)車(chē)可以沒(méi)有人,這里面發(fā)現還有一個(gè)手,實(shí)際上沒(méi)有握方向盤(pán),我們公安局規定駕駛室的位置必須坐人,即便是無(wú)人駕駛也得有人,否則不符合公安局的規定,這個(gè)人沒(méi)有開(kāi)車(chē)根據街景自動(dòng)駕駛。我們北京的一卡通,如果把數據收集起來(lái)我們知道北京多少人從哪里換車(chē),每天怎么流向,我們現在中國很多地方有數據的不挖掘,會(huì )挖掘的沒(méi)有數據。要把生活和網(wǎng)絡(luò )結合起來(lái)。
這是上海的江蘇路所有路都有攝象頭,每個(gè)攝象頭后面都有電視屏放在交通管理中心,一個(gè)交通管理中心再大也放不下這么多屏,因此10秒鐘一輪換,通過(guò)大數據挖掘把一條馬路的交通組成一個(gè)視頻,把整個(gè)上海交通組織像一張圖,就像上海市領(lǐng)導直升飛機俯視上海一樣。這是以色列的首都的交通流量,不同顏色表示不同的事件,有些表示事故等等,這些政府統計出來(lái)以后,廣播給所有開(kāi)車(chē)的人。我們現在雖然有交通屏,往往看到堵車(chē)顯示我車(chē)前進(jìn)也前進(jìn)不了,后退也后不了,人家是非常實(shí)時(shí)的提供到你這個(gè)廣播里面,所以這是很好的服務(wù)。
另外旅游很快到國慶了,到國慶之前很多人在網(wǎng)上搜索網(wǎng)游點(diǎn),還有酒店,私家車(chē)的路線(xiàn),根據你搜索我們知道哪個(gè)旅游點(diǎn)最熱,那條路會(huì )堵,真正發(fā)生黃金周的時(shí)候我提前可以知道,大家可以用微信短信研究發(fā)生的熱點(diǎn)。百度成立了定位事業(yè)部,以地圖為載體,覆蓋到餐飲、KTV、上商場(chǎng)等。阿里有保護中心,在移動(dòng)端加強與高德地圖合作。騰訊推出會(huì )員卡,加上財富通和搜搜地圖,線(xiàn)上線(xiàn)下本地化營(yíng)銷(xiāo)你可以看到現在我們所有網(wǎng)絡(luò )都要跟地圖結合。要跟位置結合,要跟本地生活結合。大數據提供醫療這個(gè)同時(shí)谷歌判斷每個(gè)一個(gè)城市產(chǎn)生流感,一旦這個(gè)地方有流感,網(wǎng)民會(huì )搜索我這個(gè)癥狀是不是流感,到哪個(gè)醫院治好,谷歌跟這些判斷哪個(gè)地方有流感,這個(gè)可以體現預測到。
我們利用短信、微博微信我們知道收集熱點(diǎn)和輿情,騰訊對每個(gè)用戶(hù)都建檔案。一個(gè)老頭注冊的時(shí)候說(shuō)是18歲少女,無(wú)論用什么假名你在網(wǎng)上時(shí)間長(cháng)了一定露出你的本性,他說(shuō)我不但知道你是男的,女的,老的,少的,我還知道哪是神經(jīng)病。如果公安局要查神經(jīng)病我可以提供一堆神經(jīng)病的IP地址。上周美國大西洋周刊報道紐約一對夫婦,男的搜索高壓鍋夫人搜索包,結果六個(gè)人要造炸彈,這個(gè)可以分析。
洛杉磯可以告訴你今天哪個(gè)街區會(huì )犯罪,今天是哪個(gè)地方多就巡邏那個(gè)地方,其他不怎么巡邏,發(fā)現大大節警力而且犯罪率下降。
現在進(jìn)一步發(fā)展這是微軟比爾蓋茨,他對全世界員工講話(huà),現在只要找到一張比爾蓋茨照片把比爾蓋茨聲音傳過(guò)來(lái),動(dòng)嘴巴,口形和表情對應。我讓這計算機看一個(gè)貓,我看完以后讓計算機看兩萬(wàn)張沒(méi)有看過(guò)的照片,找貓達到15.8%。
有一個(gè)大學(xué)教授搞人臉識別系統,你不要隨便應答我就知道你張三李四來(lái)的。大家在街上看到某個(gè)人帶著(zhù)不像自己的小孩,拍下來(lái)送到百度網(wǎng)站對比,如果對比率達到100%,百度就會(huì )通知家長(cháng)來(lái)認。手機都有攝象頭,你只要一得手機就可以打開(kāi)了。你現在相親,長(cháng)多高多富都很難弄,他說(shuō)我希望這個(gè)女的長(cháng)的多漂亮,選一個(gè)你認為漂亮的女生一對臉,在網(wǎng)站找一個(gè)差不多的就會(huì )提供你這樣的女生。
大家有這么多訪(fǎng)問(wèn)到谷歌,網(wǎng)上有這么多文章,我可以在這個(gè)里面找到例句,我根據規則,只要跟例句差不多就可以了。現在翻譯用途也是很多的。百度可以看到這是昨天統計今日電影排行榜,小時(shí)代,環(huán)太平洋等我說(shuō)有些電影不好看,我只管收集熱,也可能罵得人多了也排在上面,不見(jiàn)得排上面最好。前一段富二代,什么富春山居圖,小時(shí)代什么不好的電影也上來(lái)了,我們可以看熱點(diǎn)人物。
現在互聯(lián)網(wǎng)企業(yè)當輕運營(yíng)商,我們看到互聯(lián)網(wǎng)企業(yè)除了管道需要運營(yíng)商,現在其他東西都不需要依靠運營(yíng)商都需要獨立判斷。公安局有微信公眾號,招商銀行也有,這些都可以很好的各種各樣的增值服務(wù)都可以出現。電信運營(yíng)商開(kāi)展互聯(lián)網(wǎng)活動(dòng),銀行做電商互聯(lián)網(wǎng)企業(yè)做金融,阿里控制電商的入口,騰訊主刀線(xiàn)交入口,他們希望向對方業(yè)務(wù)拓展,固定想做移動(dòng),移動(dòng)想做固定,廣播做電信,電信想做廣播,運營(yíng)的賣(mài)手機,手機的想做運營(yíng),現在很難區分大家的業(yè)務(wù)。我們看到自留地要種,別的也要搞,現在整個(gè)是渾濁了。電商和搜索會(huì )產(chǎn)生新的業(yè)態(tài)。
互聯(lián)網(wǎng)產(chǎn)生大數據,移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)進(jìn)一步推動(dòng)數據的暴漲,網(wǎng)絡(luò )中心體現去中心化,大數據促進(jìn)了信息融合和產(chǎn)業(yè)跨界結合,大數據引發(fā)更多新業(yè)態(tài)出現,大數據對互聯(lián)網(wǎng)發(fā)展是機遇也是挑戰,是對我們國家互聯(lián)網(wǎng)創(chuàng )新能力的一次大考,謝謝大家!