避免失敗 如何像Google一樣玩轉大數據
在這場數據的淘金中許多公司滿載而歸,然而大數據投資失敗的公司也不可謂不多,所以就有了之前的一篇文章 Why Big Data Projects Fail。對此,商業智能工具研發總監、esProc、esCalc高級顧問Jim King否
在這場數據的淘金中許多公司滿載而歸,然而“大數據”投資失敗的公司也不可謂不多,所以就有了之前的一篇文章“ Why Big Data Projects Fail”。對此,商業智能工具研發總監、esProc、esCalc高級顧問Jim King否認了這個看法,并以google(谷歌)為例給大數據投資者提出了一些警示。
以下為譯文:
首先看一下大數據成功典范Google,看看他們是如何玩轉大數據的:
1. 收集數據,捕捉每個網站、電子郵件、Cookie內容,并提取關鍵信息。
2. 為信息創建復合索引。不用說,廣告相關索引是必不可少的。
3. 將目錄和內容儲存在分布式服務器中。
4. 當用戶瀏覽網站以及搜索或訪問電子郵件時,Google會對這些請求做復雜的轉換處理,同時幾個索引項會隨之確定。
5. 根據索引在服務器中查詢數據,返回搜索結果或者廣告。
在這里不難發現,與Hadoop有關的只有3和5,也就是數據儲存和查詢。而這兩項也是最容易實現的兩項,比如Hadoop就是個具有良好擴展性及低成本的解決方案。
那么實現3和5就可以像Google一樣發玩轉大數據了?很顯然不行,因為關鍵選項2和4并沒有實現,而2和4就是所謂的業務分析算法。這些算法由業務專家根據數據、業務知識、市場趨勢精心打造,是許多企業商業策略制定的重要手段及核心。這才是4V理論中的“Value”。
這也是現下許多大數據投資失敗的原因,因為當下的大數據只提供了數據存儲和查詢的策略,缺乏了提高企業競爭力的業務分析解決方案,而恰恰這才是最重要的。事實上,現在的大數據工具都是為IT專家打造的,他們可以通過C++或者Java實現MapReduce功能,但是卻無法提供有價值的商業算法。
因此大數據成功的關鍵不在于Hadoop是否部署成功,而在于對業務有幫助算法的制定,而在人才嚴重缺乏的當下,不妨從數據工具入手。降低工具使用的門檻,讓業務專家可以參與其中,才能發揮大數據真正的作用,對業務起到立竿見影的改善。
總結
工具的部署誰都可以,關鍵在于業務算法的制定,讓業務專家無縫的參與數據的分析才是成功的開端。

責任編輯:廖生玨
免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
深度報告 | 基于分類監管與當量協同的碳市場框架設計方案
2020-07-21碳市場,碳排放,碳交易 -
碳市場讓重慶能源轉型與經濟發展并進
2020-07-21碳市場,碳排放,重慶
-
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
2020年二季度福建省統調燃煤電廠節能減排信息披露
2020-07-21火電環保,燃煤電廠,超低排放
-
四川“專線供電”身陷違法困境
2019-12-16專線供電 -
我國能源替代規范法律問題研究(上)
2019-10-31能源替代規范法律 -
區域鏈結構對于數據中心有什么影響?這個影響是好是壞呢!