大數(shù)據(jù)時代 大數(shù)據(jù)安全
大數(shù)據(jù)安全背景
大數(shù)據(jù)時代,社會信息化和網(wǎng)絡(luò)化的發(fā)展導(dǎo)致數(shù)據(jù)爆炸式增長,全球數(shù)據(jù)量大約每兩年翻一番,這意味著人類在最近兩年產(chǎn)生的數(shù)據(jù)量相當(dāng)于之前產(chǎn)生的全部數(shù)據(jù)量。大數(shù)據(jù)技術(shù),悄然滲透到各個行業(yè)領(lǐng)域,逐漸成為一種生產(chǎn)要素發(fā)揮著重要作用。然而,大數(shù)據(jù)技術(shù)使得產(chǎn)率提高和生活方式改變的同時,隨之而來的安全挑戰(zhàn)已無法忽視。
2017年4月,全國信息安全標(biāo)準(zhǔn)化技術(shù)委員會2017年第一次工作組"會議周"在武漢召開。會上,《大數(shù)據(jù)安全標(biāo)準(zhǔn)化白皮書》正式發(fā)布。
《大數(shù)據(jù)安全標(biāo)準(zhǔn)化白皮書》由中國電子技術(shù)標(biāo)準(zhǔn)化研究院、清華大學(xué)、四川大學(xué)、阿里云計算有限公司等25家企事業(yè)單位共同編制,重點介紹了國內(nèi)外的大數(shù)據(jù)安全法規(guī)政策、標(biāo)準(zhǔn)化現(xiàn)狀,重點分析了大數(shù)據(jù)安全所面臨的安全風(fēng)險和挑戰(zhàn),給出了大數(shù)據(jù)安全標(biāo)準(zhǔn)化體系框架,規(guī)劃了大數(shù)據(jù)安全標(biāo)準(zhǔn)工作重點,提出了開展大數(shù)據(jù)安全標(biāo)準(zhǔn)化工作的建議。全國信息安全標(biāo)準(zhǔn)化技術(shù)委員會將積極推動產(chǎn)學(xué)研用單位參與大數(shù)據(jù)安全標(biāo)準(zhǔn)化工作,開展大數(shù)據(jù)安全標(biāo)準(zhǔn)的研制,為大數(shù)據(jù)產(chǎn)業(yè)安全有序發(fā)展提供標(biāo)準(zhǔn)化支撐。
通過對當(dāng)前典型大數(shù)據(jù)應(yīng)用場景以及大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀進行調(diào)研分析,大數(shù)據(jù)安全挑戰(zhàn)是由于其他差異而產(chǎn)生的。大數(shù)據(jù)環(huán)境和傳統(tǒng)數(shù)據(jù)環(huán)境之間的差異包括:
大數(shù)據(jù)收集,匯總和分析
用于存儲和容納大數(shù)據(jù)的基礎(chǔ)架構(gòu)
應(yīng)用于分析結(jié)構(gòu)化和非結(jié)構(gòu)化大數(shù)據(jù)的技術(shù)
由于優(yōu)先考慮的是為大量數(shù)據(jù)提供速度,所以安全性通常放最后考慮;因為沒有對數(shù)據(jù)進行特定的分類存儲和傳輸。從而導(dǎo)致不同技術(shù)的整合引入了新的安全挑戰(zhàn),產(chǎn)生了安全隱患。在大數(shù)據(jù)系統(tǒng)支持關(guān)鍵基礎(chǔ)設(shè)施的情況下,安全必須考慮在內(nèi)。由于大數(shù)據(jù)系統(tǒng)是復(fù)雜且異構(gòu)的,所以安全保障必須是整體性的,以確保服務(wù)的可用性和連續(xù)性。
在整個大數(shù)據(jù)平臺建設(shè)過程,從大數(shù)據(jù)應(yīng)用中產(chǎn)生的各種問題,我們總結(jié)了下文中的各個需求,具體情況如下:
大數(shù)據(jù)平臺建設(shè)示意圖
運維入口:
開發(fā)人員賬號混用、操作無詳細記錄、高危險誤操作無法控制、敏感數(shù)據(jù)泄露。
應(yīng)用入口:
敏感數(shù)據(jù)泄露、數(shù)據(jù)訪問無詳細記錄、應(yīng)用冒名訪問開放接口。
典型的行業(yè)大數(shù)據(jù)安全挑戰(zhàn)
大數(shù)據(jù)技術(shù)在行業(yè)中的應(yīng)用越發(fā)的廣泛,所暴露出來的大數(shù)據(jù)安全問題,越發(fā)嚴重。以下是對部分行業(yè)調(diào)查分析。
電子政務(wù)
政務(wù)大數(shù)據(jù)覆蓋行業(yè)范圍廣泛、數(shù)據(jù)結(jié)構(gòu)多樣、關(guān)聯(lián)關(guān)系復(fù)雜,而且涉及大量個人隱私數(shù)據(jù)、國家敏感數(shù)據(jù)等重要數(shù)據(jù),因此在開展政務(wù)大數(shù)據(jù)應(yīng)用的同時,數(shù)據(jù)和平臺安全尤為重要。電子政務(wù)大數(shù)據(jù)面臨的安全風(fēng)險和挑戰(zhàn)主要包括:
1) 平臺安全
大數(shù)據(jù)平臺是政府使用數(shù)據(jù)資源的基礎(chǔ)平臺,平臺安全是保障政府安全可靠利用數(shù)據(jù)資源的基礎(chǔ)。大數(shù)據(jù)平臺除了面臨傳統(tǒng)的惡意代碼、攻擊軟件套件、物理損壞與丟失等安全威脅外,由于自身架構(gòu)要根據(jù)政府業(yè)務(wù)需求和安全要求變化不斷改進,因而產(chǎn)生傳統(tǒng)的身份認證、數(shù)據(jù)加密手段適用性問題。
2) 服務(wù)安全
構(gòu)建基于互聯(lián)網(wǎng)的一體化公共服務(wù)平臺,面向公眾提供基于大數(shù)據(jù)的便民服務(wù),是落實國家推進國家治理體系和治理能力現(xiàn)代化、建設(shè)服務(wù)型政府要求的重要任務(wù)。基于互聯(lián)網(wǎng)建設(shè)的政務(wù)在線服務(wù)窗口,是政務(wù)大數(shù)據(jù)為社會公眾服務(wù)的重要組成部分,便捷的互聯(lián)網(wǎng)應(yīng)用環(huán)境下,在提質(zhì)增優(yōu)公共服務(wù)的同時也為便民服務(wù)帶來嚴峻的安全挑戰(zhàn),需要應(yīng)對基于Web 的攻擊、Web應(yīng)用程序攻擊/注入攻擊、拒絕服務(wù)攻擊、網(wǎng)絡(luò)釣魚、用戶身份盜竊等威脅,抵御信息泄露、網(wǎng)絡(luò)癱瘓、服務(wù)中斷等安全風(fēng)險。
3) 數(shù)據(jù)安全
各部門在開展業(yè)務(wù)和對政務(wù)大數(shù)據(jù)進行開發(fā)利用的同時,數(shù)據(jù)自身安全非常重要,涉及數(shù)據(jù)生命周期各階段相關(guān)的數(shù)據(jù)采集、數(shù)據(jù)傳輸、數(shù)據(jù)存儲、數(shù)據(jù)處理、數(shù)據(jù)交換、數(shù)據(jù)銷毀等活動。政府部門數(shù)據(jù)公開、行業(yè)間以及行業(yè)內(nèi)部數(shù)據(jù)平臺化共享時的數(shù)據(jù)安全,是迫切需要解決的問題, 是大數(shù)據(jù)資源實現(xiàn)開放共享、相關(guān)"數(shù)據(jù)掘金"應(yīng)用得以發(fā)展的關(guān)鍵。
4) 數(shù)據(jù)確權(quán)問題
政務(wù)數(shù)據(jù)的所有權(quán)、使用權(quán)、管理權(quán)涉及多個部門,特別是政府授權(quán)社會資本方搭建的公共服務(wù)系統(tǒng)所產(chǎn)生的數(shù)據(jù),涉及個人隱私、國家經(jīng)濟命脈,在進行大數(shù)據(jù)分析中,必須做到權(quán)責(zé)分明,厘清數(shù)據(jù)權(quán)屬關(guān)系,防止數(shù)據(jù)流通過程中的非法使用,保障數(shù)據(jù)安全流通。但是,目前數(shù)據(jù)權(quán)屬仍缺乏法律支撐,數(shù)據(jù)使用尤其跨境流動所產(chǎn)生的安全風(fēng)險日益凸顯。
5) APT 攻擊防御
APT是黑客針對客戶所發(fā)動的網(wǎng)絡(luò)攻擊和侵襲行為,是一種蓄謀已久的"惡意網(wǎng)絡(luò)間諜威脅"。這種行為往往經(jīng)過長期的經(jīng)營與策劃,并具備高度的隱蔽性。APT攻擊以竊取核心資料為目的,對政府部門大數(shù)據(jù)應(yīng)用產(chǎn)生重大安全威脅,因此必須在政務(wù)大數(shù)據(jù)中高度防范此類攻擊。
健康醫(yī)療
作為典型的實踐科學(xué),醫(yī)學(xué)中有很多知識來源于經(jīng)驗積累。而目前經(jīng)驗積累的最直接、客觀的體現(xiàn)就是"數(shù)據(jù)"。因此,利用健康醫(yī)療過程中產(chǎn)生的海量數(shù)據(jù),開發(fā)其潛在價值,使其助力健康醫(yī)療事業(yè)的發(fā)展,成為醫(yī)療行業(yè)、技術(shù)研發(fā)領(lǐng)域等相關(guān)有識之士共同努力的目標(biāo)。健康醫(yī)療大數(shù)據(jù)在促進業(yè)務(wù)發(fā)展的同時,面臨的安全挑戰(zhàn)主要表現(xiàn)在:
1) 數(shù)據(jù)權(quán)屬不清
健康醫(yī)療大數(shù)據(jù)起源于個人患者本身,那么數(shù)據(jù)權(quán)屬到底是屬于個人、還是產(chǎn)生數(shù)據(jù)的醫(yī)療機構(gòu)一直沒有定論;另外,第三方機構(gòu)在原始數(shù)據(jù)基礎(chǔ)上挖掘延伸出的新數(shù)據(jù),其歸屬權(quán)也沒有明確規(guī)定。
2) 應(yīng)用復(fù)雜性高
目前各地區(qū)和機構(gòu)在進行健康醫(yī)療領(lǐng)域信息化建設(shè)時大都根據(jù)自身需求建立獨立的信息系統(tǒng),這些信息系統(tǒng)架構(gòu)各異、數(shù)據(jù)格式不同,導(dǎo)致數(shù)據(jù)在安全共享、交換和處理時的復(fù)雜度大幅提升。
3) 個人隱私保護難
健康醫(yī)療數(shù)據(jù)中包含特別敏感的個人隱私信息,必須依法進行管控和保護;對涉及健康醫(yī)療數(shù)據(jù)的管理要以相應(yīng)的法律法規(guī)做指導(dǎo),在進行健康醫(yī)療數(shù)據(jù)的收集、存儲、挖掘等應(yīng)用時,需要解決個人隱私保護的難題。
電商行業(yè)
電商行業(yè)作為基于互聯(lián)網(wǎng)技術(shù)衍生的新型業(yè)務(wù),積累了大量商家數(shù)據(jù)、買家數(shù)據(jù)、商品數(shù)據(jù),以及在買賣交易過程中產(chǎn)生的訂單數(shù)據(jù)、交易數(shù)據(jù)和用戶行為數(shù)據(jù)等。借助大數(shù)據(jù)技術(shù)發(fā)展契機,電商行業(yè)也開始了大數(shù)據(jù)時代的轉(zhuǎn)型。電商行業(yè)基于長期積累的海量數(shù)據(jù),開始在不同業(yè)務(wù)方向利用大數(shù)據(jù)技術(shù)分析、挖掘數(shù)據(jù)價值。電商行業(yè)大數(shù)據(jù)在促進業(yè)務(wù)發(fā)展的同時,相應(yīng)的安全挑戰(zhàn)也隨之浮現(xiàn),主要表現(xiàn)在:
1) 數(shù)據(jù)權(quán)屬不清
電商業(yè)務(wù)的開展主要包括電商平臺、商家和消費者三方,電商業(yè)務(wù)產(chǎn)生的數(shù)據(jù)如何劃分其所有權(quán)、控制權(quán)和使用權(quán),是在電商業(yè)務(wù)中合理使用數(shù)據(jù)的前提。當(dāng)前電商業(yè)務(wù)的大數(shù)據(jù)應(yīng)用中,通常利用電商平臺對數(shù)據(jù)進行分析,也存在商家或商家授權(quán)獨立軟件提供商使用商家數(shù)據(jù)進行分析的情況,在權(quán)利歸屬不明確的情況下,責(zé)任的歸屬也難以界定,相關(guān)數(shù)據(jù)安全難以保障。
2) 大數(shù)據(jù)聚合分析風(fēng)險
電商業(yè)務(wù)的大數(shù)據(jù)應(yīng)用涉及對消費者相關(guān)的數(shù)據(jù)分析,雖然可以通過隱私保護政策、用戶授權(quán)協(xié)議的形式獲取相關(guān)數(shù)據(jù)的使用合法授權(quán),而且在對電商業(yè)務(wù)分析的過程中也會采用匿名化處理的方式,保證用戶的個人信息安全。但是,在對大數(shù)據(jù)加工計算的過程中,如何保障不會因為大數(shù)據(jù)的聚合分析而實現(xiàn)"去匿名化",依然是亟待解決的難題。
3) 數(shù)據(jù)版權(quán)保護
電商生態(tài)圈內(nèi)的數(shù)據(jù)流動和共享較為普遍,目前主要通過法律協(xié)議方式約束對數(shù)據(jù)的使用。但由于缺乏有效的數(shù)據(jù)版權(quán)保護技術(shù)手段及措施, 難以甄別是否存在超出范圍的數(shù)據(jù)擴散或使用問題。
4) 數(shù)據(jù)跨境安全
目前國家大力支持跨境電商業(yè)務(wù),而跨境電商業(yè)務(wù)必然涉及數(shù)據(jù)的跨境問題。不同國家和地區(qū)的數(shù)據(jù)保護法規(guī)對數(shù)據(jù)跨境流動的要求存在差異性,比如俄羅斯明確提出俄羅斯公民的數(shù)據(jù)應(yīng)在俄羅斯境內(nèi)更新后方可傳到海外進行處理;歐盟則擴大了數(shù)據(jù)保護法律適用的管轄范圍。這些法規(guī)將給跨境電商企業(yè)帶來高昂的合規(guī)成本,制約了跨境電子商務(wù)的發(fā)展。如何處理數(shù)據(jù)跨境安全合規(guī)與跨境電商戰(zhàn)略發(fā)展的矛盾,是亟待解決的難題。
電信行業(yè)
電信運營商擁有大量的數(shù)據(jù)資源,如網(wǎng)絡(luò)信息、用戶終端信息、用戶位置信息等,同時電信行業(yè)近年來利用大數(shù)據(jù)進行深度挖掘分析,將豐富的網(wǎng)絡(luò)、用戶等數(shù)據(jù)資源加工抽取后封裝為服務(wù),向客戶提供。大數(shù)據(jù)給電信行業(yè)帶來新的發(fā)展機遇,電信運營商借助已有的數(shù)據(jù)積累優(yōu)勢,不斷發(fā)展大數(shù)據(jù)應(yīng)用,但同時數(shù)據(jù)的集中管理、數(shù)據(jù)對外開放等新技術(shù)特點和業(yè)務(wù)新形態(tài)應(yīng)用,也使電信行業(yè)大數(shù)據(jù)面臨新的安全風(fēng)險和挑戰(zhàn),主要包括:
1) 供應(yīng)鏈安全
通信數(shù)據(jù)在移動網(wǎng)絡(luò)設(shè)備中產(chǎn)生,而這些設(shè)備是由多家供應(yīng)商提供。同時,存在大數(shù)據(jù)平臺系統(tǒng)第三方供給代建設(shè)、代維護等問題,在特定階段,部分設(shè)備的操作權(quán)在供應(yīng)商手中,這意味著供應(yīng)鏈的各環(huán)節(jié)存在安全風(fēng)險。
2) 數(shù)據(jù)集中管理
在大數(shù)據(jù)業(yè)務(wù)應(yīng)用發(fā)展的驅(qū)動下,電信運營商的數(shù)據(jù)由原來的各系統(tǒng)分散存儲轉(zhuǎn)變?yōu)榇髷?shù)據(jù)平臺集中存儲模式,大數(shù)據(jù)資源的安全風(fēng)險更加集中,一旦發(fā)生安全事件將涉及海量客戶信息及公司數(shù)據(jù)資產(chǎn)。
3) 平臺組件開源
大數(shù)據(jù)平臺多使用開源軟件,這些軟件設(shè)計初衷主要考慮高效數(shù)據(jù)處理,缺乏安全性保障,滯后于電信業(yè)務(wù)發(fā)展的安全防護能力,存在安全隱患。
4) 敏感數(shù)據(jù)共享
在電信運營商內(nèi)部信息系統(tǒng)建設(shè)相對分散,敏感數(shù)據(jù)跨部門、跨系統(tǒng)共享留存比較常見,其中一旦存在系統(tǒng)安全防護措施不當(dāng),均可能發(fā)生敏感數(shù)據(jù)泄漏,造成"一點突破、全網(wǎng)皆失"的嚴重后果。
大數(shù)據(jù)應(yīng)用安全實踐
我們在推廣大數(shù)據(jù)應(yīng)用的同時,大數(shù)據(jù)的安全問題不容忽視。需要推動大數(shù)據(jù)安全關(guān)鍵技術(shù)和大數(shù)據(jù)安全解決方案的研究。從以上的各個行業(yè)分析情況來看,各個行業(yè)大數(shù)據(jù)安全問題大同小異,主要存在:認證,授權(quán),審計,加密等方面的安全管控問題,合眾大數(shù)據(jù)安全管控系統(tǒng)(以下簡稱:DSM系統(tǒng)),實現(xiàn)了可視化的大數(shù)據(jù)平臺用戶管理,網(wǎng)關(guān)代理配置及自動化部署,權(quán)限、脫敏規(guī)則配置,告警通知配置及展示,審計日志展示及報表展示功能等,實現(xiàn)在網(wǎng)關(guān)上對用戶訪問大數(shù)據(jù)平臺組件做用戶鑒權(quán)、權(quán)限控制、數(shù)據(jù)脫敏、安全審計等的功能,以滿足客戶大數(shù)據(jù)平臺自身安全管控的需求。
DSM架構(gòu)圖
DSM總體目標(biāo)是實現(xiàn)大數(shù)據(jù)平臺的用戶安全和數(shù)據(jù)安全,用戶安全是指訪問大數(shù)據(jù)平臺的用戶,其身份認證的安全、權(quán)限控制的安全,保證合法的用戶能夠訪問大數(shù)據(jù)平臺上指定的組件和數(shù)據(jù)。數(shù)據(jù)安全是指存儲在大數(shù)據(jù)平臺上的數(shù)據(jù)的安全,包括數(shù)據(jù)全生命周期的整體安全,包括數(shù)據(jù)源的安全、數(shù)據(jù)加密、數(shù)據(jù)脫敏、數(shù)據(jù)訪問的審計等方面。
典型案例分析
電信,聯(lián)通,移動三大運營商通過了大數(shù)據(jù)安全管控系統(tǒng),實現(xiàn)的是Hive、HBase、Impala、Spark SQL的網(wǎng)關(guān),利用代理式網(wǎng)關(guān)訪問后端數(shù)據(jù)平臺實現(xiàn)靈活的數(shù)據(jù)脫敏等安全防護功能:
限制了所有人員及應(yīng)用程序?qū)ive、HBase、Impala、Spark SQL的訪問,網(wǎng)關(guān)能夠?qū)υL問行為進行鑒權(quán)及數(shù)據(jù)脫敏,防止惡意用戶即程序訪問大數(shù)據(jù)平臺進行非法操作。
網(wǎng)關(guān)引擎是部署在大數(shù)據(jù)平臺數(shù)據(jù)庫組件與應(yīng)用之間,可以將網(wǎng)關(guān)當(dāng)作大數(shù)據(jù)平臺的一層防火墻,外部攻擊首先需要沖破網(wǎng)關(guān)的保護才能進一步攻擊大數(shù)據(jù)平臺,增加惡意用戶的攻擊難度。
在網(wǎng)關(guān)側(cè)實現(xiàn)了對Hive、Impala、Spark SQL、HBase的實時數(shù)據(jù)脫敏功能。實時脫敏技術(shù)是通過網(wǎng)關(guān)解析內(nèi)部協(xié)議,與應(yīng)用層無關(guān),因此不影響上層應(yīng)用開發(fā)。
通過大數(shù)據(jù)管控平臺DSM解決了運營商行業(yè)所面臨的大數(shù)據(jù)安全管控問題,未來隨著大數(shù)據(jù)安全訴求的增加,將在電力、金融、電子商務(wù)、軍工等行業(yè)進行部署,實現(xiàn)各個行業(yè)的大數(shù)據(jù)平臺得到安全管控,保護大數(shù)據(jù)系統(tǒng)安全,業(yè)務(wù)安全,數(shù)據(jù)安全。
- 相關(guān)閱讀
- 熱門技術(shù)
- 電力通信
- 智能電網(wǎng)
- 云計算
- 大數(shù)據(jù)
-
ofo:今日起與廣州政府實現(xiàn)大數(shù)據(jù)信息共享
-
年度盤點:大數(shù)據(jù)+人工智能網(wǎng)絡(luò)安全應(yīng)用回顧及展望
-
Kubernetes為什么會逐漸成為云計算的標(biāo)準(zhǔn)?
2018-01-18標(biāo)準(zhǔn)
-
儲能的重要性被擺上臺面丨盤點2017
-
5大亮點,5大趨勢——關(guān)于能源互聯(lián)網(wǎng)的今天和明天,讀這一篇就夠了
-
百度發(fā)布Apollo2.0版無人車 新增攝像頭傳感器