大數據治國 防民甚於防疫
2020年3月2日

在大數據時代,為何類似17年前SARS的武漢肺炎又在中國重演,最為核心的問題是政府沒有建立起一個公開透明的社會共享的公共訊息系統,仍然以傳統的思維及意識形態為標準的方式來控制、管制和篩選訊息,這必然會導致訊息傳遞中的失真、誤導及扭曲⋯⋯

撰文:易憲容

智慧中國為何沒有預警

與17年前相比,目前中國醫療專業人員和民眾對冠狀病毒認知水平、現有的醫療技術與條件肯定是不可同日而語。還有,中國作為數碼經濟的第二大國及強國,對於相關訊息的搜集、獲得、處理也應該有長足的進展。當年世界衞生組織對中國SARS的最早訊息,是通過加拿大的衞生情報監視系統「全球公共衞生情報網」(Global Public Health Intelligence Network, GPHIN)在網上搜尋及訊息處理而獲得的。但是,這次武漢肺炎的爆發,智慧中國及智慧城市並沒有起到相應的預警作用。何也?以下從數據經濟角度來觀察該事件的始末。

在大數據時代,不僅海量的數據湧出,而且人類處理數據的能力也以幾何級數方式在提升。通過海量數據的挖掘,關注事件之間的關聯關係,是尋求事件真相的重要途徑。正如美國著名的金融科技專家邁爾.舍恩伯格(Viktor Mayer-Schönberger)認為的,如果數百萬條電子醫療記錄顯示橙汁和阿司匹林的特殊組合可能治療癌症,那麼找出具體的藥理機制就沒有這種治療方法本身來得重要。

也就是說,如果中國的醫療機構有一個公開透明整全的醫療記錄訊息系統,那麼醫生李文亮發出新冠狀病毒武漢肺炎預警時,政府根本就不需要把這類訊息打壓成「謠言」,而擔心造成社會民眾的恐慌,因為民眾能夠通過公開透明的醫療記錄訊息來了解事件的真相。

反之,政府則可把這種所謂「謠言」點滴訊息進行相關性數據挖掘,發現事件真相。比如,對武漢肺炎病患者的出行訊息比對,很快就可以了解到武漢肺炎傳染的性質,而不是政府部門輕易地對此下結論:這種新冠狀病毒不會人傳人;通過對武漢肺炎病患者之前訊息的比對可追蹤了解可能感染的區域與範圍;通過手機的訊息,對曾在武漢華南海鮮批發市場使用過的支付寶客戶此後的支付地,能幫助政府有關部門追蹤了解可能感染者的出行軌跡及武漢肺炎可能傳播的範圍;通過民眾對新冠狀病毒的相應知識及治療藥物訊息的搜尋,能夠幫助政府相關部門了解可疑患者的規模、所在地點及區域等等。這些都是政府挖掘事件真相、進行有效決策的重要依據。

如果中國建立起了這樣一個公開透明的《全國公共衞生監測訊息網》,那麼這次武漢肺炎就可控制在萌芽狀態,避免這場影響全國及全球類似17年前的巨大災難不會在中國重演。

海量訊息輕易流失

但是,中國作為一個數據經濟的大國、強國,並沒有建立起這樣一個公開透明的讓廣大民眾數據共享的公共訊息系統,海量的訊息輕易流失。這些海量訊息沒有成為社會共享的數據資源及政府決策的依據,而是形成一個個「數據孤島」,甚至於把本來為大眾共享的公共訊息讓少數人轉化為可壟斷的撰寫論文的私人訊息。

再加上,在大數據時代,政府還是採取傳統思維方式與手段來控制、管理及篩選海量的訊息,政府希望以此方式讓社會大眾知道什麼和不知道什麼。這不僅無法通過大數據挖掘以相關性來尋求事件的真相,讓海量的數據資源流失與浪費,更為甚者會讓訊息在傳遞過程中失真、誤導及扭曲,從而造成整個社會恐慌及無知事件出現。

可以說,武漢封城前幾個小時500萬人的出逃、口罩搶購的恐慌、雙黃連可治療武漢肺炎鬧劇的出現等都是與這種訊息傳遞過程中的訊息失真、誤導及扭曲所導致的結果。

所以,對武漢肺炎爆發後的治理反思,首先就是要建立起一個讓整個社會數據共享的、公開透明的公共訊息系統。通過這個系統不僅可讓海量訊息成為資源,也可能讓社會大眾獲得所需要的知識與訊息,及時地了解各種事情發生的真相,並由此形成明確的大眾預期及社會共識。否則,類似武漢肺炎的傳染病災難還會在中國重演。

大數據具有6V特徵。一是海量(Volume);二是快速(Velocity);三是多樣性(Variety);四是真實性(Veracity);五是可見性(Visibility);六是價值(Value)。根據大數據的基本特徵,數字經濟所關注的大數據,其核心就是如何通過便利、低成本的數據技術分析把數據轉化為訊息,通過這些訊息來了解事件的真相,尋求事件之間的關聯性,建立最有效的預測模型,實現對不可見因素的當前和未來狀態的預測,為決策提供好的依據。

——原文請閱三月份《信報財經月刊》