從數據分析到人工智能:政府該如何利用數據?
本文為Eddie Copeland在2018年3月27日于愛丁堡數據峰會上發表的演講內容,闡述了數據分析與人工智能的結合的重要性,及其政府在其中所起到的作用,首發于Nesta網站,由全球智慧城市聯盟翻譯。
在過去的五年中,我一直在和一些人探討公共部門組織該如何更好地使用他們自身的數據以獲得更多的好處。
我強調了“使用他們自己的數據”,因為英國似乎采取了一種不同的數據處理方式。
一方面,我們一直是開放數據的有力擁護者:我們希望在公共部門組織發布他們的數據集后,其他人可以在這些數據的基礎上發現一些有趣的結果。
另一方面,我們對智慧城市充滿熱情,在可以為城市提供更多數據的新技術上投入數百萬英鎊,但公共部門組織的人員卻完全不知道如何使用這些數據。
現在,我承認,在這些領域中有不少成功的故事和經驗。
但是中間還缺失了一部分內容。缺失的部分是公共部門組織的廣泛認可,即他們應該是自己數據的主要消費者。
多年來,記者和評論員們在糾結用什么詞來形容數據,是新的石油、燃料?還是促進創新的種子茁壯成長的肥沃土壤?不管將數據比作什么,其核心都是要表現出數據是有價值的。對公共部門組織來說,如果不能從數據中獲得好處,那么數據就沒有價值可言。
那么,我提到的數據的價值到底指什么?
我花了相當多的時間來研究公共部門組織如何改善自身,以及如何應對他們所面臨的壓力,然后突然醒悟,數據能夠推動人們不斷嘗試和檢驗更好的工作方式。
目前的問題是,該行業目前的數據處理方式阻礙了工作人員從中獲得好處。具體來說,這是一種“拼圖”問題:每個團隊都有自己的小數據拼圖,但沒有人能把這些碎片拼在一起,看看圖片會顯示什么。
這就是問題所在。
例如,我們知道共享服務可以產生價值,前提是設計和執行環節都沒有出現問題。但是,如果相關組織既沒有大量的數據,又無法把握問題、需求和發展機會,那么組織該如何與其他機構分享更多的數據、團隊和資源呢?
我們知道,如果組織資源稀缺,就有必要重點面向需求最大的領域。如果公共部門組織不能獲取那些能夠顯示需求量的數據集,那就很難繼續深入發展了。
我們也知道,一些最復雜和最費錢的公共服務,比如成人和兒童社會關懷,可能需要多達三十個組織共同努力來提供一個家庭所需的服務。如果這些組織沒有彼此之間的相關數據,他們如何高效智能地協調工作?
公共服務改革的最高目標是:預測和預防,或者說是預測和早期干預。很簡單,我們知道在問題還沒產生嚴重后果的時候,或者已經造成了最小危害時,或者更直白地說,就是解決問題的成本還不高的時候,進行干預是合情合理的。公共部門組織可以做到這一點,但前提是他們能夠匯總和分析預測未來風險的數據集。
導致拼圖難以成形的原因是眾所周知的。在我們成功地解決這些問題之前,我們需要反復分析數據。
目前存在一些技術問題。多年來,每個公共部門組織都購買或開發了自己的IT系統,其中許多系統很難互通和共享數據。更糟糕的是,一些IT供應商甚至向公共部門客戶索取相關數據。
數據方面也存在問題。即使這些組織之間可以訪問數據集,但這些數據往往是根據不同的格式和約定進行記錄的,比對數據就像是在比較蘋果和橘子一樣。
法律上也存在著一些問題。有一些做法是法律不允許的,因此禁止此類做法是合情合理的。但是,對于另外一些數據方面的做法,普通公共部門的工作人員并不確定這些做法是否符合數據保護立法,所以這些做法也沒有繼續下去了。他們需要謹慎行事,這是可以理解的。
最后是組織方面的問題。每個公共部門組織都是在過去的某個時候建立起來的,并且以某種方式服務于某個社區。這些組織需要在精神上,組織結構上和文化上形成系統合作的理念。
他們必須要進行合作。
數據分析辦公室
為了幫助這些組織克服其中的一些障礙,兩年前,Nesta推出了數據分析項目辦公室,幫助城市和地區對數據進行分析,并采取相關措施促進公共服務改革。
到目前為止,我們已經直接參與了三個試點項目的工作,在每一個項目案例中,我們都發現以下四個問題可以幫助工作人員確定一個特定的公共服務挑戰是否可以用數據來解決。
1 - 我們的問題是否足夠具體、足夠有影響力?運用數據需要時間、金錢和政策的支持。除非要解決的問題能夠激發所有的相關人員參與進來,否則很難確保數據可以解決問題。
2 - 我們知道要采取怎樣的干預措施嗎?給這個問題一個很好的答案是非常重要的:“如果你有關于這個問題所需的所有信息,你會做出怎樣不同的選擇?”。數據并不是一種干預,數據是一種推動力,所以我們想要做什么?
3 - 我們知道需要什么樣的信息產品嗎?一線工作人員或服務經理應該在紙上或平板電腦屏幕上看到哪些相關信息?是地圖,熱點圖,優先列表,儀表板,警報等信息嗎?
4 - 創建信息產品所需的數據是否可用?數據是否可以用于此類目的?
在這些問題的基礎上,我們與倫敦十二個行政區、GLA和ASI數據科學開展合作,共同發展倫敦數據分析辦公室的試點項目,該項目旨在開發一種預測算法,以發現未知的HMO。 (關于該試點的全面報告將很快公布)
我們還與數字彈射中心(Digital Catapult),英國東北部地區的地方當局、警察和衛生組織進行合作,收集有關酒精危害問題的數據,探索這些問題的性質和影響程度。(該試點項目最終失敗了,因為我們未能清楚地回答上面提到的第2個問題,也未能明確更好的信息將會帶來什么樣的影響。)
目前,我們在與埃塞克斯郡的警方、當地議會和公共部門進行合作,應用數據分析技術來識別企業是否苛待勞工。
分享經驗
在以上案例中,數據都發揮了重要作用。然而,在許多方面,有關如何使用數據的談論和實踐過程才能反映數據的真正價值。無論最終的結果如何,不同的公共部門聚集在一起,共同商討面臨的問題和所需的信息,這就足以產生巨大的價值了。
令人高興的是,許多組織都認同了這一觀點。目前,大曼徹斯特郡、西米德蘭茲郡、伍斯特郡、埃塞克斯郡等地涌現了數據分析辦公室,并且很快倫敦也會建立一個數據分析辦公室。Nesta希望數據分析辦公室能夠支持各部門互相學習,并提煉出有用的東西。
迄今為止,我們發現許多關于如何充分利用數據分析的經驗都過于簡單乏味。因此,我將強調三個最重要的經驗。
公共部門領導人需要創造有利于數據發揮作用的空間和文化。我的這句話強調的是兩件事。首先,公共部門領導人需要樹立一種意識,即如果不能深入分析數據,那么就不能做出重大的決定或進行改革。公共部門的專業人員有權根據自己的專長選擇不同的方式來處理數據,但他們無權無視數據所涵蓋的內容。這種思維應該自上而下地建立起來。
其次,公共部門領導人需要認識到,在他們的組織中,他們所擁有的數據分析師可能并沒有完全發揮其能力。這些分析師需要做的不是緊盯每月的圖表報告和KPI報告,而是應該讓他們與服務經理和前線員工一起處理更高價值的問題。
地方當局應該實現各部門的數據互聯。我們的經驗表明,如果公共部門組織不能將其內部IT系統之間的數據集連接起來,那么就不能與其他組織開展數據方面的合作。他們需要將關于地址和居住者的數據集(使用UPRN)連接起來,創建地理空間和個人數據的黃金記錄
我們需要統一整個公共部門的法律法規。我們需要結束當前這種混亂的局面,每個公共部門都各自的法律法規,并且對同一立法有不同的解釋。GDPR(《通用數據管理條例》)的引入是一個大好的機會,能夠讓我們在新規則的解釋方面達成共識,有利于造福所有人。
簡而言之,如果想要享受數據科學帶來的好處,我們首先需要解決數據的問題。
還有比這更令人激動的事情嗎?
人工智能的作用
Nesta是一個鼓勵創新的機構:我們總是在探索新興的發展趨勢。對于那些希望更加智慧地使用公共部門數據的人來說,人工智能的發展是他們最感興趣的關注點。
毫無疑問,對人工的炒作很多。然而,正如Geoff Mulgan在最近的一篇文章中所概述的那樣,人工智能確實能夠為政府和更廣泛的公共部門帶來巨大的價值。
在我看來,最有潛力的領域(無論是好是壞)是將機器學習用于算法決策。
為何如此重要?
我們經常提到制定政策一定要以證據為基礎。對于政治家和政策制定者來說,在制定政策時,在宏觀層面上使用證據是件好事,但如果在做出緊急決策時還要過于顧慮證據,那么就無法取得很大的成效。每個公共部門組織的真正成效在于其員工每天所做的成千上萬個小決定的總和。
人工智能有助于我們在這個領域做出基于證據的決策:幫助一線工作者在最重要的時刻,基于對已知工作的智能分析,做出更明智的決定。
很明顯,這有很大的可能性會導致嚴重的錯誤,特別是在對群體或個人產生重大影響的決策時應用算法。
在我看來,使用一種算法來實現它從未被設計過的目的是不可接受的,比如一些私營部門的公司試圖利用個人信用評分來決定是否雇傭應聘者。
如果沒有首先考慮訓練數據中不可避免的偏差,以及如何采取措施減輕偏差的情況下,就不能應用算法。
用于做出個人決策的算法數據必須保持透明。
為了讓更多的人參與這個話題的討論,最近我發布了公共部門使用算法決策的原則草案(鏈接)。我已經收到了大量有關如何改進草案的有用反饋。
草案包含10條原則,但本質上歸結為關鍵的一點:如果使用人工智能的人不能合理地理解其基本目標、功能和限制,那么使用人工智能來進行決策就是不合適的。
人們在這方面很容易犯錯,我們多年來一直冒著公眾信任崩潰的風險在使用這種技術。最近的一些報道顯示,即使是那些世界上最大的公司,也會在出現決策錯誤時遭到強烈反對。
這是公共部門無法承受的錯誤。
當涉及到政府對數據的使用時,Nesta將繼續促進有關數據使用的基本經驗交流,同時探索應用新技術的最佳方式。
從數據分析到人工智能,我們還有很長的路要走。
責任編輯:仁德財
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市