中國工程院院士李德毅:大數據挖掘帶動的變遷
5月29日消息,2014第十八屆中國國際軟件博覽會在北京展覽館開幕。本屆軟博會以軟件引領信息消費,助力經濟轉型升級為主題,充分展示軟件業在促進信息消費、提高百姓生活質量、提升社會各行各業信息化水平等方
這種摩爾速度在計算時代人們突然發現,存儲也有很大的人脈,尤其是存儲材料,存儲技術的發展使得我們口袋里有一大把硬盤,以前我們是不可想象的,市場價值500塊錢一個TB,為什么還要把這個數據清洗的那么干凈呢?我們進入了存儲階段,這個比摩爾速度快,我們就從數據庫時代計算時代進入了搜索時代。存儲技術在交互的發展,我們有了存儲的網絡和陣地。于是社會進步了半結構化的數據階段,萬維網之父第一個把超文本技術引入互聯網的,發出世界上第一個Web服務器和Web客戶機。人類進入了新的時代,進入了Web時代!他是一個50后,沒有統一的數據結構,依靠規范和標準彼此約束,所有媒體數據均以實體的形式存在,實體可以是碎片化的文本、語音、圖片、視頻。甚至是軟件實體通過超連接產生聯系。我們軟件供應商把它定制為半結構化數據的組成形式C/S、B/S、云計算。人們通過超鏈接和超媒體,依靠HTTP、HTML、WSDL等標準規范來約束。數據圍繞實體,實體圍繞鏈接轉。挖掘實質上就是云計算環境下的探索和個性化的服務,沒有死板的查詢方式,也不是唯一的結果,允許帶有不確定性,重視探索的統計性質。現在我們發展到了圖搜索、語音搜索,各種各種的語音、圖片等搜索引擎導致了互聯網上的繁榮內容服務。
我們不需要筆記本和iPad,萬人一面的搜索服務受到質疑!這個時代存儲新聞價值比例是9倍化的時代,我們把它作為遺產繼承下來。大數據使得我們進入新的時代,就是我說的水不轉,云在轉。網絡是以帶寬為支撐的,尤其是互聯網的帶寬有一個速度,比9倍還翻一番!用帶寬換計算、換存儲,風起云涌。現在我們就處在網絡化的時代和交互的時代移動互聯網時代的大數據挖掘主要是網絡環境下非結構化數據挖掘!這些數據形態反應是帶毛的、鮮貨的原始的數據。非結構化數據的挖掘的特點是什么呢?原生態數據常是低價值的,強噪音、并購、冗余的冷數據!人們首先關注的不再是大眾,而是小眾,現在我們是小河游水,任何一個公司首先關注的是特定群體的小眾,滿足小眾萬人需求才談得上滿足更多小眾乃至大眾的需求,由下而上,勝過由上往下。我們的頂層設計在這個時候不靈了!人們關心的是發現失聯、發現異常!無比注重因果、主次、時許,誰在前誰在后也不太關心。大數據給我們畫了一個美麗的餅,但是我個人認為不是這樣的。移動互聯網大數據挖掘過程中,數據的簡約具有各自適應性!我本人長期以來用認知物理學方法實現數據的自適應簡約。我們在國內外第一次提出了數據場思想,把人臉變成數據場,大家可以看到這張人臉跟人是有相似之處的,你可以用線性的方法也可以用非線性的方法,如果想突出他的眼睛、鼻子和嘴巴,我可以用這種方法來突出。用物理學中場的方法類比形成數據場,像素點之間相互影響越小,特征點個數越多,圖像的描述越細節,反之特征點個數越少!

責任編輯:葉雨田
免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
-
曹志剛:我們期待風電成為中國的主力能源
2020-11-17風電,能源,主力能源 -
張鈞:未來配電網內涵特征與發展框架研究
2020-11-03配電網,智能配電網,智能配電網建設研討會 -
習近平:持續增強電力裝備、新能源等領域的全產業鏈優勢
2020-11-02電力裝備,新能源,通信設備
-
曹志剛:我們期待風電成為中國的主力能源
2020-11-17風電,能源,主力能源 -
張鈞:未來配電網內涵特征與發展框架研究
2020-11-03配電網,智能配電網,智能配電網建設研討會 -
杜祥琬:創新觀念,推動能源高質量發展
2020-09-28能源,創新,觀點
-
PPT丨王繼業:電力系統儲能發展與挑戰
2020-10-14儲能,電力儲能,儲能應用 -
奮斗姿態書寫人生底色 銀隆儲能“小哥哥”的職場進擊姿勢
2020-10-12銀隆新能源,儲能,新能源汽車 -
鄒驥:通過發展清潔能源 提高中國公信力
2020-06-28鄒驥,清潔能源,綠色低碳能源
-
習近平:持續增強電力裝備、新能源等領域的全產業鏈優勢
2020-11-02電力裝備,新能源,通信設備 -
重磅 | 發改委發文7月起電價降5%
2020-06-29國家發改委,企業,用電成本,電費 -
李克強:放寬配售電業務市場準入 推動建立市場決定能源價格機制
2019-10-12配售電業務市場準入