論大數(shù)據(jù)分析的正確方法 應(yīng)理智對待
據(jù)統(tǒng)計(jì),從人類文明開始到2003年,人類共創(chuàng)造了5TB(兆億字節(jié))的信息。現(xiàn)在,同樣的數(shù)據(jù)量僅需兩天就能夠被創(chuàng)造出來,且速度仍在加快。如此龐大的數(shù)據(jù)量使數(shù)據(jù)分析復(fù)雜化,而大數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)將加深這種復(fù)雜度。
這種情況下,我們需要清楚:什么樣的數(shù)據(jù)應(yīng)被保存。如果從整體性出發(fā),數(shù)據(jù)采集和存貯算不上大數(shù)據(jù),對海量數(shù)據(jù)進(jìn)行分析計(jì)算之后的結(jié)果才有實(shí)際價(jià)值。這亦是大數(shù)據(jù)的價(jià)值所在。
關(guān)于大數(shù)據(jù)數(shù)量,業(yè)內(nèi)一種較為激進(jìn)的觀點(diǎn)認(rèn)為,“大數(shù)據(jù)”的叫法存在問題,因?yàn)閿?shù)據(jù)只有“大”是沒有用處的。雖然數(shù)據(jù)無處不在,但唯有復(fù)用性強(qiáng)和可轉(zhuǎn)化成有用抽象信息的數(shù)據(jù)才更有價(jià)值。
即使我們的數(shù)據(jù)搜集、處理能力逐漸增強(qiáng),仍然要堅(jiān)持“不是任何數(shù)據(jù)都重要”這一準(zhǔn)則。對企業(yè)來講,具體需遵循兩點(diǎn),一是堅(jiān)持?jǐn)?shù)據(jù)廣泛性,對內(nèi)掌握企業(yè)內(nèi)部分析數(shù)據(jù),對外摸準(zhǔn)用戶喜好和習(xí)慣;二是堅(jiān)持?jǐn)?shù)據(jù)關(guān)鍵性,從最重要處著手,把握數(shù)據(jù)復(fù)用性,達(dá)到最大價(jià)值又使成本最優(yōu)化。
《哈佛商業(yè)評論》近期發(fā)表了一篇題為“更大的數(shù)據(jù)會導(dǎo)致更好的決策嗎?”的文章,這篇文章提出警告,把重點(diǎn)放在量的方面將導(dǎo)致大錯(cuò)誤。如今很多企業(yè)試圖通過龐大的數(shù)據(jù)量獲得利益,但只有少數(shù)企業(yè)真正取得成功,這是過分注重?cái)?shù)據(jù)“量”帶來的弊端。
大數(shù)據(jù)分析之?dāng)?shù)據(jù)質(zhì)量與數(shù)據(jù)分享
我們知道,要保證分析結(jié)果的準(zhǔn)確性,必須確保被分析數(shù)據(jù)真實(shí)有效,至少絕大部分?jǐn)?shù)據(jù)樣本要有質(zhì)量保證。但在大量數(shù)據(jù)從數(shù)據(jù)源匯聚而來的過程中,難免有以次充好的數(shù)據(jù)混入。
在淘寶網(wǎng)購時(shí),賣家信用等級是買家購買與否的重要參考。為了提高產(chǎn)品銷售量,刷信用等級成了業(yè)內(nèi)公開的秘密,伴隨著部分賣家弄虛作假、違規(guī)提高信用等級的過程,將產(chǎn)生大量失真數(shù)據(jù),在欺騙消費(fèi)者的同時(shí),也會直接影響后期數(shù)據(jù)分析結(jié)果。
其次,中國互聯(lián)網(wǎng)產(chǎn)業(yè)中,“數(shù)據(jù)割據(jù)”現(xiàn)象較嚴(yán)重,即掌握大量核心數(shù)據(jù)的幾大互聯(lián)網(wǎng)巨頭各自為戰(zhàn),不愿分享。如掌握搜索數(shù)據(jù)的百度,掌握社交數(shù)據(jù)的騰訊,掌握消費(fèi)數(shù)據(jù)的阿里巴巴,他們都意識到數(shù)據(jù)對于未來企業(yè)競爭力的重要性,因此不會將自己手中的數(shù)據(jù)籌碼輕易示人。
仍舊以百度、騰訊、阿里巴巴為例,按照目前他們在中國互聯(lián)網(wǎng)的流行程度,我們可以大體估計(jì)同時(shí)使用這三種應(yīng)用的用戶個(gè)體占互聯(lián)網(wǎng)總用戶數(shù)的比率,保守估計(jì),達(dá)到50%不成問題。因此,這三方數(shù)據(jù)一旦實(shí)現(xiàn)共享,將能拼湊出一幅完整的網(wǎng)絡(luò)信息圖譜。反之,“數(shù)據(jù)割據(jù)”造成大數(shù)據(jù)斷層和片面性,使其利用價(jià)值大打折扣。
CMIC認(rèn)為,在大數(shù)據(jù)洪流洶涌襲來的當(dāng)下,信息的流動才是重中之重,互聯(lián)網(wǎng)巨頭們的數(shù)據(jù)割據(jù)思維嚴(yán)重阻礙著整個(gè)產(chǎn)業(yè)的發(fā)展。尤其對于那些擁有大數(shù)據(jù)分析技術(shù)卻無大數(shù)據(jù)源的中下游企業(yè)來說,面臨“巧婦難為無米之炊”的窘境。

責(zé)任編輯:小沈
- 相關(guān)閱讀
- 泛在電力物聯(lián)網(wǎng)
- 電動汽車
- 儲能技術(shù)
- 智能電網(wǎng)
- 電力通信
- 電力軟件
- 高壓技術(shù)
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計(jì)落地:鼓勵(lì)“光儲充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計(jì) -
中國自主研制的“人造太陽”重力支撐設(shè)備正式啟運(yùn)
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng)
-
新基建助推 數(shù)據(jù)中心建設(shè)將迎爆發(fā)期
2020-06-16數(shù)據(jù)中心,能源互聯(lián)網(wǎng),電力新基建 -
泛在電力物聯(lián)網(wǎng)建設(shè)下看電網(wǎng)企業(yè)數(shù)據(jù)變現(xiàn)之路
2019-11-12泛在電力物聯(lián)網(wǎng) -
泛在電力物聯(lián)網(wǎng)建設(shè)典型實(shí)踐案例
2019-10-15泛在電力物聯(lián)網(wǎng)案例
-
新基建之充電樁“火”了 想進(jìn)這個(gè)行業(yè)要“心里有底”
2020-06-16充電樁,充電基礎(chǔ)設(shè)施,電力新基建 -
燃料電池汽車駛?cè)雽こ0傩占疫€要多久?
-
備戰(zhàn)全面電動化 多部委及央企“定調(diào)”充電樁配套節(jié)奏
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計(jì)落地:鼓勵(lì)“光儲充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計(jì) -
中國自主研制的“人造太陽”重力支撐設(shè)備正式啟運(yùn)
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業(yè)發(fā)展
-
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng) -
5G新基建助力智能電網(wǎng)發(fā)展
2020-06-125G,智能電網(wǎng),配電網(wǎng) -
從智能電網(wǎng)到智能城市