浪潮集團副總裁談紹興:迎接數據為王的新時代
5月29日消息,2014第十八屆中國國際軟件博覽會在北京展覽館開幕。本屆軟博會以軟件引領信息消費,助力經濟轉型升級為主題,充分展示軟件業在促進信息消費、提高百姓生活質量、提升社會各行各業信息化水平等方面的
5月29日消息,2014第十八屆中國國際軟件博覽會在北京展覽館開幕。本屆軟博會以“軟件引領信息消費,助力經濟轉型升級”為主題,充分展示軟件業在促進信息消費、提高百姓生活質量、提升社會各行各業信息化水平等方面的最新成果。浪潮集團副總裁談紹興做了題為《迎接數據為王的新時代》的主題演講。

浪潮集團副總裁 談紹興
以下是演講實錄:
尊敬的領導大家下午好,我報告的題目是“迎接數據為王的新時代”,大家知道云計算和大數據是當前IT行業最熱門的話題,也是公認的未來新技術發展的方向。政府領導從宏觀產業的角度,互聯網精神和大數據方面做了高屋建瓴的演講,我是從IT角度如何看待大數據,如何看待大數據在我們行業的應用。
我的報告分三個部分;第一是大數據的概述;第二是浪潮在大數據方面的實踐;第三,介紹一下大數據的價值。為了更系統闡述大數據,我們簡單回顧一下信息產業發展的歷史,1945年大型機出現,我們1945到1980年我們稱之為大型機時代,1980到1995年是個人電腦時代,1995到2010是互聯網時代,2010到現在是云計算時代。我們可以預見在2025年信息產業會產生新的模式,我們現在還說不清楚。從數據處理的角度,我們分成了兩個時代;前兩個時代,我們可以稱之為大型機時代,我們更關注計算機的速度和性能。到互聯網的時代,我們進入半數據化的時代,我們更注重搜索,到了云計算時代,我們進入數據為王的時代。從數據技術的發展角度來看,數據結構總共經歷了4個階段;第一個階段是數據的層次模型,和關系網絡模型的時代。第二個時代是結構化數據時代;第三是半結構化數據時代,現在是非結構化數據時代。
什么是大數據概述?結構大數據和非結構大數據,結構大數據是用二維表示實體之間的關系。自然界人與人之間的關系我們可以通過二維碼把他們之間的關系表達出來。這是2007年埃德加提出來的,當時大家并不重視他的意見,他的特點所有運算都用關系運算實現結構化查詢。用戶無需關心數據的獲取、存儲、數據結構,得到的是符合查詢條件的結果。
計算機發展到今天,我們有視頻、郵件、聊天,互聯網上一分鐘每分鐘全球產生7.5PB數據,2.04億封郵件,27.7萬人登陸。結構化數據有一個前提,所有的數據都要有頂層設計和數據結構,后填入數據。第二,當數據量大到一定程度的時候,到了T級或者PB級的時候基本上幾個小時才能查詢出一個結果來。如果我們平常日常講話我有一段語音和視頻,這種數據的處理用結構化數據處理是不可以的。后來誕生非結構化數據,不方便用數據庫二維邏輯表來表現的數據稱之為非結構化數據。數據反映的是自然界原生態的數據,這種數據是鮮貨的,是碎片化的,同時是移動化的。第二,它沒有統一的數據結構。依靠標準和規范彼此約束。第三,沒有死板的查詢方式,也不是唯一的結果,允許帶有不確定性,重視搜索的統計性質。
大數據的定義大家都比較清楚了,大數據是相對傳統的結構化數據,無法在容許的時間內用常規軟件工具對其進行抓取。大數據最后有四個特點,有四個V,其中最重要的是價值,單一的數據價值比較低,大數據的目的在普通翻轉的數據中找到有價值的數據。大數據處理和我們傳統的數據處理在計算機上是不一樣的,這個圖就表示了傳統模式和分布式計算的區別。如果我在一萬本書中統計“浪潮”單詞出現的次數,原來你就要一本本書去查,要查一萬本書。那么現在分布式計算,一臺計算機需要一秒鐘,那么我一萬臺計算機查詢出來的時間還是一秒鐘,結果是一樣的,沒有任何變化。
剛才把大數據給大家做了概述,下面介紹一下浪潮在大數據中的實踐。現在網上開店基本是不收稅的,浪潮現在做了一個產品對網上的網店的交易額進行統計,因為大數據互聯網它的數據是公平的,去年雙十一,整個阿里巴巴官方公布當天交易額是350.19億,但是我們抓取的數據額是350.4億元!這是我們在大數據方面,網上納稅方面的應用。每天監控的酒店住宿信息2億,上網信息每天10萬,航空信息100億,火車信息每天30萬。這個是大數據個案的真實故事,山東淄博發生了一起兇殺案,殺人時間和地點知道,但是原因不清楚,動機和罪犯在哪里都不清楚,通過網上大數據分析,在網上搜索,因為殺人的信息已經新聞披露了,很多網民在看,成千上萬的網民在看這個信息,同時有的網民在看殺人自首判幾年,殺人不自首判幾年?這個范圍我們就在縮小,公安局會把上百萬人縮小到幾十個人,重點排查幾十個人,最后在一個網吧就找到了這樣的嫌疑犯,實施抓捕。最后對流串作案,在一個地方發生了搶劫案,過了一段時間在另外一個城市又發生了搶劫案,這是一個人流串作案,犯罪分子的信息一定在網上、住宿、銀行留出線索!我們最后把嫌疑范圍縮得非常小,然后找到相應的犯罪分子。
再是警務千度,千度有什么特點呢?每一個老百姓你的信息現在在公安局里都是實時跟蹤的,比如要查一個人,這個人叫張金棟,當你查出這個人的時候,你這個人有沒有跟你長相相似的?是不是有常用的名字?你有沒有犯前科?你整個親屬關系?你的上級下級同事,這是一個居民的關系,你曾經住過什么酒店?你去過哪些地方?這些信息都在警務千度里查到。
另外是群體事件的預防,現在我們QQ、微信、微博如此發達,社區里的信息化被稱之為社會的傳感器,每個小區里給開發商發生糾紛了,小區業主利用QQ、微信等跟公安聯系!另外是車輛管理,套牌車,假牌子,如果在同一時間里出現了兩個相同牌照的車,肯定有一個牌子是假的!我們可以通過這種方式縮小查詢范圍。
我們單位里有一些郵件,如果把這些郵件整合了,我們在不改變原有信息的基礎上,通過大數據平臺,我們可以把數據做整合,在不改變原有應用系統情況下,我們也可以實現數據的共享和挖掘。這是大數據應用的特點。
最后介紹一下大數據的價值。張主任也講過大數據是具有很高的價值的,數據和我們生產資料和我們的資金,和我們人才一樣,大數據生產價值保健品潛在的數據價值有3000多億美元,歐洲公共管理的潛在年度價值2500億歐元。汪洋同志在2012年10月到廣東省財政廳進行調研時說,今天大數據在中國的地位相當于30年前的土地,30年前土地是的很便宜,今天的土地很值錢!今天的數據就相當于30年前的土地,我們將正式進入一個數據為王的時代!今天數據很便宜,大家可以隨便抓,30年后這種數據可能就不能隨便抓了,可能國家會立法,對居民的隱私等范圍,包括技術的手段不允許抓數據了。現在是最好的時機。
最后結語:云計算、大數據代表著當今信息技術的發展方向,是未來信息化的關鍵,浪潮愿與各界朋友緊密合作,創新應用,為中國信息化發展貢獻力量。謝謝大家!

責任編輯:葉雨田
免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
-
曹志剛:我們期待風電成為中國的主力能源
2020-11-17風電,能源,主力能源 -
張鈞:未來配電網內涵特征與發展框架研究
2020-11-03配電網,智能配電網,智能配電網建設研討會 -
習近平:持續增強電力裝備、新能源等領域的全產業鏈優勢
2020-11-02電力裝備,新能源,通信設備
-
曹志剛:我們期待風電成為中國的主力能源
2020-11-17風電,能源,主力能源 -
張鈞:未來配電網內涵特征與發展框架研究
2020-11-03配電網,智能配電網,智能配電網建設研討會 -
杜祥琬:創新觀念,推動能源高質量發展
2020-09-28能源,創新,觀點
-
PPT丨王繼業:電力系統儲能發展與挑戰
2020-10-14儲能,電力儲能,儲能應用 -
奮斗姿態書寫人生底色 銀隆儲能“小哥哥”的職場進擊姿勢
2020-10-12銀隆新能源,儲能,新能源汽車 -
鄒驥:通過發展清潔能源 提高中國公信力
2020-06-28鄒驥,清潔能源,綠色低碳能源
-
習近平:持續增強電力裝備、新能源等領域的全產業鏈優勢
2020-11-02電力裝備,新能源,通信設備 -
重磅 | 發改委發文7月起電價降5%
2020-06-29國家發改委,企業,用電成本,電費 -
李克強:放寬配售電業務市場準入 推動建立市場決定能源價格機制
2019-10-12配售電業務市場準入