當前中國已經(jīng)進(jìn)入數字經(jīng)濟時(shí)代,數據已經(jīng)成為企業(yè)最寶貴的成長(cháng)沃土,蘊藏著(zhù)無(wú)數生機和寶藏。但是,雖然有著(zhù)"哪里需要數據、數據就到哪里"的美好未來(lái),可現實(shí)卻是"數據缺乏共享、沒(méi)有統一標準、數據管控失效"等一塊塊難啃的石頭。因此,在大數據時(shí)代的開(kāi)荒種田,必須找到一把"鋤頭",必須是一體化的數據大平臺,也只有它才能更好的管理和使用數據,讓數據的價(jià)值真正變現。
近日,北京供銷(xiāo)大數據集團(以下簡(jiǎn)稱(chēng)"SinoBBD")首席信息官楊正洪博士在第五屆全球云計算大會(huì )上和現場(chǎng)嘉賓及行業(yè)專(zhuān)家學(xué)者就目前大數據管理平臺在構架、建設、應用和實(shí)施等多方面的焦點(diǎn)問(wèn)題展開(kāi)深入討論。而他所強調的大數據治理過(guò)程,正是這把"鋤頭"。

圖為北京供銷(xiāo)大數據集團首席信息官楊正洪博士發(fā)表演講
數據需"治"才能"理"
隨著(zhù)數字經(jīng)濟的發(fā)展,被譽(yù)為"未來(lái)新石油"的大數據,已經(jīng)成為許多國家的戰略規劃。2012年,美國出臺了《大數據的研究和發(fā)展倡議》,把大數據稱(chēng)作"未來(lái)社會(huì )發(fā)展的新石油";2015年,我國國務(wù)院正式發(fā)布《國務(wù)院關(guān)于印發(fā)促進(jìn)大數據發(fā)展行動(dòng)綱要的通知》,并在十八屆五中全會(huì )上首次提實(shí)施"國家大數據戰略",大數據已經(jīng)正式上升為國家戰略。正是在各項政策和行業(yè)需求的推動(dòng)下,大數據發(fā)展進(jìn)入一個(gè)高速增長(cháng)期,但對于初嘗大數據業(yè)務(wù)的用戶(hù)來(lái)說(shuō),哪怕只有一小塊石頭,就可能引發(fā)大數據高速路上的事故。
針對目前大數據技術(shù)在企業(yè)中的應用"痛點(diǎn)",楊正洪表示,一直以來(lái),企業(yè)通過(guò)不同平臺、不同渠道收集到大量數據信息,由于缺乏統一管理、組織、標準等情況,導致企業(yè)數據多處于"休眠"狀態(tài),極易形成信息孤島。因此,企業(yè)想要更好地發(fā)揮數據帶來(lái)的價(jià)值,絕不應追求"數據大",一定要將所有數據集中在一個(gè)平臺之上,去構建一個(gè)更加高效、靈活應用的大數據管理平臺。
在這個(gè)時(shí)代,沒(méi)有人會(huì )去懷疑數據的價(jià)值,用戶(hù)缺少的是最終轉化的手段和方法。于是,各行各業(yè)都開(kāi)始了大數據平臺的建設。那么,企業(yè)要想建設大數據應用的總體構架,又當如何入手呢?
對此,楊正洪表示,建設大數據整體構架體系并不復雜,這包括:"三個(gè)平臺、兩個(gè)側翼、一個(gè)機制"。"三個(gè)平臺"指的是大數據云平臺、大數據管理平臺、大 數 據 應 用 平 臺,從下向上依次提供負責計算資源、存儲資源、網(wǎng)絡(luò )資源的基礎平臺,整合業(yè)務(wù)與管理的數據平臺,以及利用AI、ML等技術(shù)的數據分析與價(jià)值挖掘平臺。而在大數據體系建設的兩翼,一是負責統一標準的數據規范體系,另一個(gè)則是統一運維的數據信息安全體系,缺一不可。最后,在這個(gè)層層夯實(shí)、左右支撐的情形下,自然就會(huì )形成適用于企業(yè)自身發(fā)展的大數據管理機制。
打造"一體化"大數據管理平臺
作為一個(gè)新興領(lǐng)域,大數據技術(shù)仍在快速迭代之中,新方法、新工具和新模式不斷涌現。在契合我國大數據發(fā)展整體趨勢的同時(shí),SinoBBD大數據一體化服務(wù)之路具有自身的鮮明特性,同時(shí)也總結出大量為政企用戶(hù)提供數字化轉型和建設大數據業(yè)務(wù)的成功經(jīng)驗。
楊正洪認為,典型的大數據管理道路可以分為四個(gè)階段。第一步,從已有數據開(kāi)始整合,將傳統數據系統與大數據組件相結合;第二步,補充外部數據,實(shí)現全方位數據的整合,內外相通相融;第三步,把數據全部整合在大數據管理平臺上,完成統一的建模、采集、存儲和服務(wù);第四步,與行業(yè)需求緊密結合,建立大數據分析應用。最終實(shí)現對未來(lái)業(yè)務(wù)發(fā)展的洞察力和感知力,形成一種新型的商務(wù)發(fā)展模式。
數據的"大"或"小"并不是關(guān)鍵,重要的是從數據中挖掘價(jià)值,創(chuàng )造價(jià)值。而這個(gè)數據挖掘的過(guò)程要比架構復雜的多,這也是許多企業(yè)眼看著(zhù)"大數據的土地",卻找不到"鋤頭"的問(wèn)題所在。針對現場(chǎng)嘉賓的提問(wèn)和大數據落地難題,楊正洪博士以SinoBBD大數據一體化管理平臺為例,全面講解了數據整合、統一管理等方面的具體方法。
基于大數據基礎組件和MPP等各類(lèi)技術(shù)所構建的SinoBBD統一大數據管理平臺,首先是按照客戶(hù)需求和行業(yè)規范建立標準數據模型,然后從多種數據源獲取數據,經(jīng)過(guò)預處理(清洗、驗證等)、存儲、處理和分析,最后進(jìn)行可視化呈現,從而為用戶(hù)構建統一的大數據資源層。
楊正洪表示,為更好地助力用戶(hù)落地大數據能力,SinoBBD提供的大數據管理平臺就好比一把鋤頭,能夠在這塊土地上實(shí)現企業(yè)愿望,這包括:大數據建模、大數據交換和共享、大數據服務(wù)和大數據管控,為用戶(hù)提供大數據的整合、管控和服務(wù),對外輸出客戶(hù)的大數據目錄和大數據資產(chǎn)系統,通過(guò)高擴展性、高效性、高容錯性和低成本,為用戶(hù)構建出一體化的大數據服務(wù)。
強實(shí)力打造"國之利刃"
在演講的最后環(huán)節,為了讓嘉賓更深入了解大數據管理平臺如何實(shí)施建設,楊正洪還分別從:平臺搭建,數據梳理;數據整合,業(yè)務(wù)創(chuàng )新;成熟運營(yíng),全面鋪開(kāi);這三個(gè)方向做了詳細解讀。
作為國內外知名的大數據專(zhuān)家,楊正洪博士在大數據領(lǐng)域擁有近20年的從業(yè)經(jīng)驗,深刻洞察該領(lǐng)域的產(chǎn)品創(chuàng )新和市場(chǎng)需求。在2013年歸國后,他對中美大數據產(chǎn)業(yè)鏈的深入研究,為國內用戶(hù)建設大數據體系框架提供了大量的理論依據,同時(shí)有力推動(dòng)了SinoBBD大數據管理平臺產(chǎn)品研發(fā)和運營(yíng)管理等工作飛速發(fā)展,為我國電子政務(wù)、公安、環(huán)保等行業(yè)用戶(hù)提供了大數據應用的可靠支撐。
目前,我國大數據產(chǎn)業(yè)雖然提速明顯,但與歐美相比仍然處于起步階段,企業(yè)要在大數據這塊寶地上耕田,發(fā)展離不開(kāi)政策支持、技術(shù)創(chuàng )新和產(chǎn)業(yè)協(xié)助的有機融合。在"互聯(lián)網(wǎng)+"時(shí)代,作為大數據產(chǎn)業(yè)"國家隊",北京供銷(xiāo)大數據集團將持續以支持國家大數據戰略落地為己任,圍繞"3+10+X"的發(fā)展戰略積極投入,為中國的大數據產(chǎn)業(yè)升級提供"國之利刃"。