眾新聞 Logo
眾新聞 CitizenNews
眾聞

【政府開放數據落後】IT人和義工自製互動網抗疫:官方上載Data應早過張竹君


 

武漢肺炎疫情持續逾三個月,人人自危的日子中,有三位IT人建立「武漢肺炎民間資訊」網頁,聯同一班義工網友日日人手更新疫情資訊,希望用科技自救,以小市民力量同心抗疫。

時間回到1月底,內地爆發武漢肺炎後,香港社會人心惶惶。1月23日,政府公布本港出現首兩宗確診個案後,搶購日用品、炒賣口罩的情況隨即出現。26歲、曾開發「vote4.hk 區議會投票指南」(下稱「vote4.hk」)的軟件工程師梁逸風(Brian)憶述:「嗰陣時見到政府有啲怠慢,我想知道邊度中咗招又比較難搵。我去咗政府個網站,佢只係列咗啲PDF,或者有資料係分散喺唔同媒體網站,所以就諗不如綜合晒放落一個網站。」

1月26日年初二下午,Brian就在「vote4.hk」團隊的Telegram群組分享概念,打算湊齊三個人就開始新計劃。群組內34歲的軟件工程師黃漢斌(Nandi)、32歲的數據專才黃浩華(浩華)看到訊息後,爽快答應。三人成行,著手分工設計網頁。

負責整體架構的Nandi形容,那幾天農曆新年假期好chur,每天起床就開始「揼code」,除了食飯和睡覺外,就是做網頁。最後只是短短兩天,他們於年初四晚推出「武漢肺炎民間資訊」 網站,透過連結不同網頁集合資料,只要相關平台有更新,網站都會即時更新。

(左起)Nandi、浩華、Brian是「武漢肺炎民間資訊」 網站製作的主力。鄭悅庭攝及製圖

以市民角度出發

網站推出首日就有100萬個用戶瀏覽,現時網站已有380萬個用戶瀏覽、3000萬觀看次數,平均一日有10多萬人瀏覽,遠超團隊預期。幸好,去年vote4.hk的經驗讓他們知道單靠一個伺服器,難以應付突如其來的瀏覽量。今次他們嘗試將資料放到像Microsoft雲端、Google spreadsheet等可供多人同時使用的地方,再轉至靜態網站,確保網站順暢。他們指出,在愈多確診病例的日子,網站的瀏覽量就愈高,估計與大眾對疫情恐慌有關。

網頁主要有四個版面:

- 個案資料(一般市民最關心的,就是確診人數。政府早期未推出官方疫情資訊網,只每日上載個案資料PDF文件檔。他們嘗試以程式閱讀PDF,綜合個案資料)

- 急症室等候時間(見到不少人擔心急症室輪候時間會因疫情而加長,他們就根據醫管局網頁,列出公立醫院的等候時間)

- 懷疑炒賣口罩的商舖(搶購潮出現,有不少「公海group」流傳懷疑炒賣口罩的商鋪名單,他們加以整合)

- 抗疫貼士(想到大眾或想對武漢肺炎有更多了解,他們收集眾多網上資料放到網頁上)

Brian解釋:「你當我哋係用一個普通市民嘅角度去諗,究竟應該show啲咩俾人睇,睇下能力範圍以內做唔做到。」隨著各式各樣的回應和建議,他們陸續加入不同新內容,包括:英文版網頁、確診個案詳情、全球疫情、高危地區、即時新聞、文宣圖集等。

政府數據格式、速度問題

說起來簡單順利,但在建立網頁初期,三位IT人也遇過不少挑戰,其中很大部分是來自政府的數據處理。他們指出,香港政府公布的數據主要有兩個問題:數據格式不統一、數據更新速度慢。

在數據格式方面,政府的文件中,有時並列在同一欄目的數據有著不同格式。比如說,在「疑似個案在潛伏期內乘搭過的航班/火車/船/車名單」中,航班編號的欄位曾出現中英夾雜的內容,有數字、有短句。Brian批評:「喺資料格式嘅統一上,其實佢好多謬誤,佢咁樣放對於我地嚟講已經係好唔consistent。」同時,政府公布的資料內容愈來愈豐富,表格的欄目愈來愈多,但如沒有特意留意,根本不會知道。各種情況下,即使一早編寫了電腦程式,實際上也要常常作出調整才能閱讀政府網上資料,十分費時。

政府更新資料的速度,更是遠遠落後於大眾需要知道的時間。網頁大部分資料都是以程式讀取不同網頁,再自動更新。有一天,他們突然收到很多人回應指網頁內容出錯,才發現原來一直讀取的政府網站,每天晚上才會更新一次。然而,每日下午四點半,市民已能透過衛生防護中心的記者會得知每日最新確診數字。故此,只靠政府網頁的話,中間就會出現了至少數小時的延誤。後來,他們見到政府在網站加上了「最後更新時間」,又發現原來每晚的更新時間也不同,Brian無奈說:「都好事嚟嘅,我知道佢delay,所以我就放棄咗佢喇。」

「我哋讀緊政府啲data,但係佢未update,跟住我哋俾人鬧。變咗我哋一開始,好好咁寫咗啲自動讀data嘅嘢,全部都係useless。我哋唔係唔想用data,而係我哋發現data根本用唔到。」

另一邊廂,鄰近的澳門和台灣都有官方疫情資訊網頁,內容較香港詳盡,包括有個案的病徵、社區口罩供應等。浩華說:「其實我會覺得,唔需要用外國嚟比,都知道香港有幾差。有時未必係好電腦嘅問題,而係話你個政府有無叫啲藥房去俾口罩資料你呢。如果無嘅,咪跪咗喺度,就係咁簡單。」

「武漢肺炎民間資訊」 網站列出確診個案,但讀取政府網站資料的過程,卻令IT人頭痛。

人是最重要

疫情爆發期間,公眾關注病人去過哪兒。然而,政府公布的資料,一般只列出確診個案的性別 、年齡、入住醫院等。要知道個案詳情,就得靠衛生防護中心的記者會,以及各大傳媒的跟進報道。然而,這些內容都很難以電腦程式自動處理。加上要應對上述的數據問題,三人就想到邀請義工直接輸入資料。Brian解釋:「我哋就加個flexibility,咁義工可以隨時更新。去到後期,真係用政府啲open data可能得兩成,其他八成都係義工24小時睇mon住。」

23歲、現為學生、負責聯絡義工的義務編輯Ivan是三人的朋友。四人是透過浩華發起的g0vhk認識的。g0vhk是一個旨在以技術解決社會問題的社群,他們不定期進行Hackathon,讓IT人和非IT人就不同社會議題交流,嘗試集合眾人之力,以項目形式解決問題,去年的vote4.hk就是其中一個。

最初Brian、Nandi和浩華三人開發網頁時,Ivan幫忙支援。他記得,每早8點起床後,先查看有沒有在凌晨新增的個案。等到中午12點,再留意衛生防護中心有沒有突發的資料更新。到了4點半,就要專心聽記者會,同步將個案資料整理,再放上網頁。又會從不同媒體捕捉個案的軌跡,更新個案資料。完成後,就會做例如更新口罩消息、整理懶人包內容、將中文譯成英文等。到了晚上11點到凌晨2點,大約是就衛生防護中心和政府新聞處在網上發布文件的時間,他會到相關網頁下載資料。

Ivan後來有感工作量太大,便開始招募義工。他坦言,要找到合適的義工是頗困難的事。

為了保持網頁的質素,他先在Telegram上以文字對話進行面試,了解對方是否有時間應付網頁的工作。然後再進行測試,如請對方快速在記者會後交出詳盡的個案總結、到外國領事館網站找資料等。最後,雖收到逾千人自薦當義工,真正加入義工團隊的只有約20人。他解釋,如此認真和嚴謹,是想盡力保持資料的詳細程度和準確度:「因為對外有個形象,總會覺得資訊網嘅招牌會係點樣,要maintain住。」

團隊中,也不是人人都隨時候命,「大家盡量補位,如果真係得一、兩個人得閒,就做咗啲最重要嘅嘢先,跟緊啲case先。」Ivan憶述,在青衣長康邨康美樓爆發當晚,團隊通宵處理資料,一班網友要拿起電話溝通。

由於偶有新人加入,為了令團隊合作順利,Ivan訂立了一套詳盡的工作流程,列出每日聽記者會的注意事項、空閒時可以做的事(如更新懶人包、核實疑似炒賣口罩資訊等)。他又設了一套用字、排版準則,務求令內容更加精準。

三人形容,他們主要是負責前期工作,網頁現時的更新和運作,大多是靠Ivan和義工完成。Brian笑道:「我哋developer寫完(網頁),就拍拍籮柚走架喇!」然後又認真道:「好多時大家去睇呢啲IT project係睇技術嘅含金量,但我想講,最重要係你每日好有恒心keep住去maintain、去update。」

在developer的世界裡,日常的溝通主要是在網上互相交流怎樣「打code」。每人揀選想做的部分,就埋頭工作,只要跟隨原先定好的工作流程,達到效果便可。然而,義工們各有背景,合作時有很多對話和交流。為減少磨擦,Ivan要學習耐心與義工溝通,既要尊重對方感受,又要達到網頁要求,年輕的他感慨:「點樣處理人際關係,真係一個藝術。」

「我嘅角度去睇,義工嗰邊今次係做得好好。個網站嘅架構係相對low tech嘅,唔係咩人工智能雲端大數據呀,Nandi好聰明用一啲好簡單嘅技術就achieve到,難嘅嘢就喺人嗰度。講到尾都係人最重要,特別係義工。」Brian說。

浩華讚揚義工團隊合作得好,很有質素:「好老土講句,Content is King,呢啲你automate唔到,so far個quality跟得上,仲有咩怨言呢?」Nandi亦同樣感激:「純用政府data,變咗做一個政府嘅網站其實係無用。啲人係唔會keep住睇,唔會每日都有十萬個人睇,除咗多謝都唔知講乜。」

「武漢肺炎民間資訊」 網站內的地圖,記載患者去過的地方。

數據的價值

四人都是義務工作,投入大量心力,是甚麼原因令他們堅持呢?

Ivan說:「好窩心嘅係,有好多市民留言,話好多謝你哋咁整。最窩心係收到一位媽媽留言,話11歲嘅小朋友都想幫手。因為其實我哋義工投放咗好多時間,義工都會睇番份feedback form,呢啲留言就係我哋做落去嘅動力。」

浩華指:「Impact 就是 reward,都想有個lesson,其實data真係緊要。」他希望現在儲起的數據,有助其他人日後研究疫情。Nandi續說:「如果我哋有呢個data set,假設有啲好有talent嘅人,或可以喺呢啲data set搵到有用嘅資訊,同埋保證係機讀格式囉,哈哈!」

「對我嚟講有人用就開心嘅。有陣時喺Facebook見到有人cap圖或者share個網站,或者兜咗個圈之後,條link返番嚟喺WhatsApp出現,證明呢啲project有佢嘅價值喺度。」Brian笑說。

他分享,有一日收到來自「So-sick」的電郵,對方指現時到「So-sick」網站 (www.sosick.org) 的話,就會自動彈到「武漢肺炎民間資訊」網,內心頗受鼓舞。「So-sick」網站是17年前沙士期間,四位青年設立的網站。他們透過公布「民間疫廈名單」,逼使政府後來每日公布疫廈資料,擴大公民知情權。

沒想到,17年後,民間還是要以自發力量發布疫情資訊,「17年後進步咗嘅,係香港人嘅意識,而唔係政府。政府可以做好多嘢,但就要市民用寶貴嘅時間同光陰,去做政府應該要做嘅嘢。」

期望將來政府可以怎樣改善?Nandi想了想,答:「如果佢啲data可以早過張竹君出嘅話,我覺得就係一個好事。」Brian同意:「如果佢啲data直接出,可能記者都問少好多問題,或者問嘅問題可以更加精準囉。」

張竹君每日430出來,IT人有感如政府能之前先公布最新資訊,有助大眾更好掌握疫情發展。資料圖片



請加入成為眾新聞的月費訂戶,長期支持我們的工作。所有訂戶都可以收到我們的「每周時事」通訊 。

月費訂戶網址:hkcnews.com/aboutus/#subscribe