Teradata CTO寶立明:CIO數據分析需勇于創(chuàng )新

2011/05/25

  第11屆Teradata數據中心峰會(huì )上,eNet硅谷動(dòng)力對Teradata的首席技術(shù)官Stephen Brobst寶立明先生進(jìn)行了專(zhuān)訪(fǎng)。了解到Teradata在數據分析和數據處理方面的優(yōu)勢以及CIO在需要數據分析與處理時(shí)需要注意的問(wèn)題。
  

  Teradata數據分析與處理的優(yōu)勢

  記者:隨著(zhù)數據量的飛速增長(cháng),大家面對更多的信息的時(shí)候會(huì )很迷茫。Teradata如何幫助處理這些海量的信息?

  寶立明:人們對于海量數據感到困惑是因為對于整個(gè)數據的全局沒(méi)有很好的把握,他們所看到的只是破碎的、零散的、局部的數據,就像你通常把一些數據做了一個(gè)總結一樣,而在這個(gè)總結的過(guò)程當中,你會(huì )丟失掉很多細節,而有很多有價(jià)值的信息正隱藏在具體的細節當中。Teradata能幫助用戶(hù)深度了解這些數據的細節,打個(gè)比方,幫助客戶(hù)了解數據每一個(gè)構成的原子或者是分子。要實(shí)現這樣的目標,需要有很強的可伸展性。這種可伸展性可以幫助用戶(hù)能夠去掉那些局部性的對于數據的了解,深入到數據的細節,這樣就可以解開(kāi)用戶(hù)對于整個(gè)大數據的困惑。

  記者:過(guò)去在技術(shù)上,要分析非結構性的信息的難處是什么?在買(mǎi)了Aster Data之后,可以解決這樣的問(wèn)題嗎?

  寶立明:Teradata的數據庫主要用是來(lái)分析結構性的數據。當Teradata收購了第三方的工具之后,我們可以把一些非結構性數據轉化成結構型數據,再用Teradata的解決方案,或者產(chǎn)品進(jìn)行相應的分析。收購Aster Data之后,其實(shí)我們可以直接地把一些非結構性的數據存儲到我們這里,然后可以直接對非結構性的數據進(jìn)行相應的分析。

  如果你問(wèn)我是不是通過(guò)Aster Data,就完全解決了分析非結構性數據的問(wèn)題,我的答案是我們永遠不可能完全把某些問(wèn)題都解決。只不過(guò)是現在通過(guò)收購Aster Data之后,這項工作變的更加容易一些了。

  Teradata客戶(hù)數據保護的優(yōu)勢

  記者:前一陣子大家都知道索尼在網(wǎng)上數據泄露那個(gè)事情,我想知道一下(50:45)在于保護用戶(hù)數據這方面有沒(méi)有一些相應的措施?

  寶立明:我們有一些非常先進(jìn)的加密技術(shù),實(shí)際上所有的設計都是加密的,都是來(lái)自數據庫加密,所以除此以外我們有完全并行的內部的數據庫加密能力,也就是說(shuō)在表格等等都可以。從安全角度來(lái)說(shuō)可以把所有的數據進(jìn)行編加密、保存還有儲存。即使有一些也進(jìn)入了我們的系統,他們也無(wú)法了解這個(gè)數據,而且這些數據都必須加密這是客戶(hù)的選擇,最好的做法就是由客戶(hù)來(lái)進(jìn)行加密。

  記者:在處理海量信息的時(shí)候,怎么保護用戶(hù)的隱私?

  寶立明:關(guān)于隱私的保護的問(wèn)題,我們可以提供某些層次上的用戶(hù)隱私的保護,如:通過(guò)對一些數據進(jìn)行加密,或者只讓需要知道數據的人了解、接觸或者訪(fǎng)問(wèn)到這些數據,比如說(shuō)需要做決策的人,這只是一種層次上的隱私保護。但是更為重要的是,現在人們都非常擔心自己的數據或者信息會(huì )被別人看到,而Teradata可以通過(guò)數據挖掘的軟件解決這些問(wèn)題。通過(guò)數據挖掘軟件,實(shí)際上看到用戶(hù)的數據或者信息的并不是某個(gè)具體的人,而是一個(gè)軟件。這個(gè)軟件用來(lái)處理這些數據,并且判斷這個(gè)數據應該被什么樣的人所使用或者用于什么樣的目的。

  就我個(gè)人而言也是數據的消費者,我一旦收到比較有用的、有意思的廣告,盡管我知道這只是隨著(zhù)郵件而附帶來(lái)的廣告,但是我仍然愿意收到它。所以說(shuō)作為一個(gè)消費者,對于這樣有用的信息數據,我還是能夠接受的。另外我覺(jué)得我作為一個(gè)消費者,我也有權利做出一些決定,我要用哪些數據和信息,不用哪些類(lèi)型的數據或者信息。因此消費者實(shí)際上可以對此有一定的控制能力,同時(shí)也可以來(lái)決定哪些最符合他的利益的數據。

  很多國家的立法者或者政府希望通過(guò)建立或者制定一些保護隱私的法律來(lái)實(shí)現對用戶(hù)信息的保護。但是這些立法者,對于數據相應的分析是非常的不了解。最后導致的結果可能就是這種出于隱私保護目的的法律,最終產(chǎn)生不理想的結果。舉個(gè)例子,在某些國家對于一些電話(huà)用戶(hù)的呼叫記錄,最多只能保持90天,而且這樣的一種呼叫記錄只能夠用于計費的目的。這樣就限制了電信運營(yíng)公司對數據的保存,不能夠很好地來(lái)設計符合消費者或者用戶(hù)需求的電信產(chǎn)品;同時(shí)在定價(jià)方面也受到了很大的限制,進(jìn)而影響了市場(chǎng)的競爭。

  所以這個(gè)例子說(shuō)明,雖然立法者的初衷是想要保護用戶(hù)的隱私,但是由于他缺乏對數據分析的了解,最終可能限制了用戶(hù)真正對信息和數據的使用。電信運營(yíng)商如果要保留用戶(hù)電話(huà)通信的記錄,也有責任對記錄或者信息、數據進(jìn)行保護,以免未經(jīng)授權的人來(lái)使用這些信息和數據。在這樣一個(gè)過(guò)程當中,當然就要用到加密的軟件或者是用到其他數據保護的方法。我們在全球范圍內是和一個(gè)叫做Protegrity公司來(lái)進(jìn)行很好的合作,他們有非常出色的加密的能力和技術(shù),所以我們就把他們加密的技術(shù)嵌入到了我們Teradata公司的產(chǎn)品和解決方案當中,來(lái)為我們的用戶(hù)提供相應的保護。

  記者:最近日本發(fā)生的地震以及一些云供應商的宕機情況讓我們對企業(yè)數據的災難恢復得到了更大程度上的重視,Teradata是如何進(jìn)行數據災難恢復的。

  寶立明:每一個(gè)分支機構當中都會(huì )有一定的數據的存在,關(guān)鍵之處就是在創(chuàng )建這些數據的伊始,你就必須要對這些數據實(shí)現集中化,這樣做的好處就是這些數據不再是像孤島式的一個(gè)一個(gè)存在,而是被集中在一起,這樣你就有一個(gè)單一的數據來(lái)源。你可以通過(guò)使用數據集成的技術(shù),或者是使用Teradata公司所提供的這些技術(shù)和解決方案,深入到每一個(gè)數據的細節進(jìn)行了解。所以實(shí)現這樣一個(gè)數據的集中化之后,隨之而來(lái)的就是它可能也會(huì )出現這種單點(diǎn)的故障,這時(shí)候出現了單點(diǎn)的故障,就必須具備災難恢復的能力。我們經(jīng)常采用的是多系統管理的能力,而且也能夠提供一些多個(gè)負載的能力。如果說(shuō)一旦某一個(gè)系統,由于自然的災害出現了故障,比如說(shuō)由于地震、颶風(fēng)出現了中斷,它就會(huì )自動(dòng)地來(lái)轉到其他的系統進(jìn)行相應的一些數據處理和分析的能力。

  有很多執行這些關(guān)鍵任務(wù)的機構,或者是公司,都在采用這種方式來(lái)對自己的數據進(jìn)行管理。比如說(shuō)像沃爾瑪、e-bay、AT&T和世界銀行。另外中國現在也有很多客戶(hù)在完成或者執行一些關(guān)鍵任務(wù)的時(shí)候,他們也會(huì )采用這樣的方式來(lái)做。

  另外我還想強調一下,我們的災難恢復的系統實(shí)際上是一個(gè)雙有源系統,或者是一個(gè)雙活躍的系統。Teradata產(chǎn)品跟其他的產(chǎn)品不一樣,其他人員在做災難恢復的時(shí)候,通常會(huì )有兩套系統,一套只是備用的,也就是說(shuō)只有出現了災難的時(shí)候,才會(huì )啟動(dòng)這樣的系統來(lái)做。但是我們的不同之處在于我們有兩套系統,這兩套系統都是在有源狀態(tài)下進(jìn)行工作的,也就是都處于活躍的狀態(tài),我們會(huì )在這兩套系統之間,實(shí)現非常好的負載均衡。這兩套系統,都在行之有效地工作,因此也帶來(lái)了非常高的成本的效率。而其他的公司的產(chǎn)品只有一套系統一直在動(dòng),而另外一套系統一直處在無(wú)源的狀態(tài)之下,或者說(shuō)一直不去積極地在工作,這時(shí)候相應的成本也是非常高的。

  CIO進(jìn)行數據分析需勇于創(chuàng )新

  記者:商業(yè)智能現在正在演變成一種商業(yè)分析的趨勢,傳統的數據分析方法已經(jīng)不太適合新的發(fā)展。對于這種新的發(fā)展趨勢,Teradata怎么來(lái)迎合這種新的趨勢跟態(tài)度的?

  寶立明:如果談到商業(yè)智能分析,能夠給人們帶來(lái)什么樣更多的價(jià)值,它最主要的一個(gè)價(jià)值就在于它能夠讓這些知識型的工作人員,更好地對數據進(jìn)行控制。就像剛才我們所提到的,我們提供了一種非常凝結的、云的環(huán)境,讓這些知識性的工作人員,能夠很好地來(lái)控制自己的數據,也能夠控制對于數據的分析。比如說(shuō)像Teradata公司所提供的數據視覺(jué)化技術(shù),就可以使得知識型的工作人員,不需要有IT人員的介入,就可以把自己相應的一些數據進(jìn)行分析和處理。

  記者:在大數據時(shí)代,您也提到有很多技術(shù)在產(chǎn)生,您覺(jué)得這些技術(shù)對于數據倉庫原有的一些技術(shù)只是功能上的擴展還是說(shuō)意味著(zhù)數據倉庫和商業(yè)智能原有的技術(shù)正在過(guò)時(shí)。

  寶立明:我覺(jué)得新技術(shù)或者說(shuō)具有突破性意義的技術(shù)是非常必要的。所以這也就是我們?yōu)槭裁词召廇ster Data這家公司,因為它所提供的就是具有突破性意義的新的技術(shù)。我們認為在一段時(shí)間內,新舊技術(shù)之間是有一個(gè)共存的關(guān)系,但是最終新的技術(shù)還是會(huì )合并成為一體,新技術(shù)要花一定的時(shí)間要不斷演進(jìn),最終慢慢地來(lái)形成對舊技術(shù)的包圍,以及最后把它融為一體。

  記者:您作為數據分析與處理這方面的技術(shù)專(zhuān)家,能不能為我們展望一下您現在正在思考的沒(méi)有成型的未來(lái)的技術(shù)趨勢?
  寶立明:我有四點(diǎn)跟你介紹一下,首先第一點(diǎn),就是剛才在新聞發(fā)布會(huì )的現場(chǎng)也提到的一點(diǎn),我們會(huì )看到傳感器將會(huì )是無(wú)處不在的,物聯(lián)網(wǎng)的不斷發(fā)展,也給我們帶來(lái)了海量的數據,讓我們進(jìn)行分析。

  第二點(diǎn),我們要實(shí)現規模化,很多分析性的規模要進(jìn)入數據庫當中。我們不能只是做數據的拷貝,而更多地要把分析性的功能納入到數據庫當中,比如說(shuō)像現在SAS和Teradata之間的一個(gè)合作,我們可以把SAS公司的數據挖掘的能力納入到我們數據庫當中,另外還有Informix與我們的合作,我們要把它的數據集成功能納入到數據庫當中。

  第三點(diǎn),無(wú)處不在的或者普遍存在的商業(yè)智能。商業(yè)智能在將來(lái)會(huì )發(fā)展成為消費者智能,所以“智能”以及“分析”這兩個(gè)詞應該說(shuō)是未來(lái)非常關(guān)鍵的兩個(gè)要素。而且隨著(zhù)移動(dòng)終端不斷地普及,我們看到越來(lái)越多的智能和分析的能力,會(huì )被終端用戶(hù)通過(guò)移動(dòng)的終端來(lái)實(shí)現。所以移動(dòng)終端對于未來(lái)也是非常重要的。

  第四點(diǎn),這些非傳統性的數據分析,比如說(shuō)像社交媒體,像視頻或者像一些話(huà)音方面的數據,從傳統意義上來(lái)說(shuō),我們是不需要對這些數據進(jìn)行分析的,但是這些數據也成為一個(gè)需要分析的數據。

  記者:現在數據社會(huì )化的趨勢,讓數據分析獲取比較困難。您認為CIO應該如何應對這些數據的獲得與分析?

  寶立明:數據社會(huì )化需要捕捉一些社交媒體所產(chǎn)生的用戶(hù)感覺(jué),這個(gè)時(shí)候我們就必須對這些社交媒體整個(gè)的網(wǎng)絡(luò )有一個(gè)非常清楚的了解和認知,才可以從這個(gè)社交媒體網(wǎng)絡(luò )上提取相應的數據和信息來(lái)近些分析,以此來(lái)得出對用戶(hù)的感覺(jué)、了解和捕捉。這時(shí)候所做的分析就包括,對社交媒體上的用戶(hù)的一些自然語(yǔ)言的處理,以及對他們的行為或者是一些相應的活動(dòng)的分析和處理,這也就是我們收購了Aster Data公司的原因。這個(gè)公司的技術(shù)可以幫助我們處理非結構性的數據,對它們進(jìn)行很好的分析。因此我對于CIO們的建議就是,應該考慮做一些相應的投資,也就是說(shuō)不要再僅僅局限于對傳統性的數據來(lái)進(jìn)行一些分析和處理,而現在需要來(lái)投入一些力量,來(lái)對非結構性的數據進(jìn)行很好的分析。所以他們在相應的策略和考慮的時(shí)候,要進(jìn)行重新的思索和定位。

eNet硅谷動(dòng)力



相關(guān)閱讀:
Radware:IDC云化漸熱 應用交付虛擬化正逢時(shí) 2011-05-23
數據中心虛擬化不斷深入 網(wǎng)絡(luò )則“方向未明” 2011-05-23
構建電信運營(yíng)網(wǎng)絡(luò )數據中心 應對數據難題 2011-05-17
數據中心效率(PUE)計算指南 2011-05-17
中國將是云計算未來(lái)發(fā)展的中心 2011-04-29

熱點(diǎn)專(zhuān)題:  數據中心
分類(lèi)信息:  數據中心_與_企業(yè)
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 盐津县| 六枝特区| 辉南县| 江孜县| 同心县| 义乌市| 盘锦市| 柘荣县| 高平市| 岳阳市| 鹿邑县| 乌海市| 石首市| 溆浦县| 博野县| 绵竹市| 平顺县| 东宁县| 九寨沟县| 崇礼县| 锦州市| 宁阳县| 钦州市| 石嘴山市| 武平县| 新丰县| 赤壁市| 通州区| 堆龙德庆县| 广东省| 嵊州市| 扶余县| 龙陵县| 临朐县| 呼和浩特市| 安福县| 时尚| 普兰县| 康平县| 邓州市| 霸州市| http://444 http://444 http://444 http://444 http://444 http://444