眾新聞 Logo
眾新聞 CitizenNews
眾聞

開放數據指數報告:「資料一線通」缺漏重要資訊 部門開放標準參差



香港互聯網協會今日(14日)發布第一期「香港開放數據指數」評估報告,指出政府為開放數據而設的門戶網站「資料一線通」,發布的資訊量不及其他官方網站,而各部門、公私營機構發布的數據,在開放授權、元數據、歷史檔案等標準不一致,令公眾無所適從。報告建議政府設立網上平台,讓公眾提出要求及意見,政府隨後應回應市民訴求。

相關報道:民間推香港開放數據指數 土地、商業登記各47分並列榜尾 本土研究社:官地、牌照屋資訊最黑箱

左起:「香港開放數據指數」研究員周穗斌、g0vhk發起人 黃浩華、香港互聯網協會董事鄭斌彬。吳婉英攝

開放數據(Open Date)指可以被任何人免費使用、重用及再次分發的數據,主要來自政府。國際社會普遍認為開放數據可令政府更透明開放,改善公共服務,並有助商業發展及激發社會創新等。

推動開放及無障礙互聯網的民間組織「香港互聯網協會」,參照國際指標及評估工具,設計「香港開放數據指數」,旨在評估及推動香港的開放數據發展。指數評估範圍包括:1. 政府開放數據平台「資料一線通」及 2. 其他官方網站 所載的公共數據,當中包括政府數據,以及由私人機構持有、涉及公眾利益的數據,例如公共交通數據。

協會按12項指標為政府「資料一線通」及其他官方網站評分:

香港開放數據指數2019/20評估報告截圖

對比評估得分後,協會指出現行開放數據政策有多個問題:

「資料一線通」缺部份重要資訊

「資料一線通」為政府資訊科技總監辦公室統籌,各政府部門及公、私營機構共同推行的開放數據門戶網站,以免費發放各種公共資料。不過,報告顯示,在12項指標中,僅得批量下載/API 、開放授權、機器可讀、開放格式、永久保存 5項,「資料一線通」的評分高於其他官方網站,但兩者差距並不顯著。至於其他指標,「資料一線通」的評分更低於其他官方網站,例如在「網上可獲得」指標,「資料一線通」只有7.27分(滿分為10),較其他官方網站得分9.02為低。

香港互聯網協會指,情況反映部分已於其他官方網站發布的重要數據,尚未以開放數據形式,透過「資料一線通」公開,包括政府招標公告、聯絡方式、旅遊警示、公共房屋(包括輪候時間及編配狀況)等。

「香港開放數據指數」研究員周穗斌以旅遊警示資料為例,指武漢肺炎疫情下,政府向哪些國家或地區發出旅遊警示,是市民切身的資訊。目前保安局網站,有最新旅遊警示的資料,但該些資料只是一般市民閱讀的格式,並沒有以機器可讀的格式、以開放數據形式發布,如果航空公司、旅行社、保險公司等希望取得最新旅遊警示資料,需要人手處理。只要政府為旅遊警示資訊提供API(Application Programming Interface,應用程式介面),允許程式開發人員採用自動化及自主的方式讀取數據,便可以省卻相關人手,提高經濟效益。

保安局網站列出的旅遊警示資料,並非以開放數據形式發布。

被問到政府為何沒有將該些重要數據經「資料一線通」發布,周穗斌表示,政府未有披露相關準則,協會亦不知道政府何不以開放數據形式發布該些資訊。

各網站開放數據標準不一致

此外,報告發現「資料一線通」、各政府部門及其他機構網站發布數據的標準不一致,甚至有缺失,問題較嚴重的包括開放授權、元數據、歷史紀錄(檔案)等指標。

開放授權:開放數據國際標準,一般主張對公共數據採用開放授權(open license),即是在較少或無任何限制下,准許用戶獲取、再次使用或發放他人的作品或數據等。

在12項指標之中,香港在開放授權一項的表現最差,只有4.07分(10分為滿分)。報告指出,各網站、各數據集的版權授權條款不一,往往未能以簡要說明公眾可以用該些數據至何種程度。

以教育局網頁為例,「重要通知」提到,網站的內容有版權規限,除非網站訂明可用,或事先得到教育局的書面授權,否則「嚴禁將該等版權作品複製、改編、分發、散布,或提供予公眾」;從網下載的材料,「僅限於作個人用途或非商業性質的內部用途」。周穗斌形容,何謂「個人用途」定義模糊,根據教育局網頁的表述,該些資源不算是開放授權。

教育局網頁的「重要通知」頁面。

周續指,「資料一線通」亦有發布教育局提供的資料、數據,但「資料一線通」的「使用條款及條件」則指,市民可「免費瀏覽、下載、分發、複製和列印有關資料」,「作商業和非商業用途」。根據「資料一線通」的「使用條款及條件」,該些資料獲政府開放授權。

「資料一線通」的「使用條款及條件」頁面。

報告指出,部份官方網頁的「條款及細則」或「重要通知」,通常以專業法律語言寫成,一般人未必明白網頁所載的資料,在哪些情況下可利用或與他人分享。若公眾不明瞭該些條款帶來的潛在法律風險,便窒礙公眾對開放數據的使用。

報告提到,國際間早有制定出標準化的版權授權條款,而主張共享知識及創意的非牟利組織「共享創意」(Creative Commons)所訂立的標準較為普及。報告建議香港考慮引入這類標準化及符號化的版權授權體系。

元數據(metadata):包括數據集的背景資料,例如數據主題、建立數據的日期、數據擁有者、數據管理者等,以助用家掌握數據的特質。

報告指出,元數據有助公眾適當、準確地運用數據,值得重視,惟研究發現,「資料一線通」及其他官方網站的元數據,普遍不足以描述數據集的特徵,很多時都沒有說明數據的首次發佈日期、覆蓋週期及檢索關鍵詞等,也沒有說明收集數據的目的、方法等背景資料。

報告以犯罪數據為例,指出新加坡政府提供的元數據包括數據管理者、最後更新日期、建立數據日期、涵蓋時期、發布頻率、數據來源、網址、版權持有者等,但香港的「資料一線通」只列出數據管理者及來源,其他元數據均欠奉。

左:「資料一線通」提供的元數據。右:新加坡政府提供的元數據,明顯較「資料一線通」的詳盡。香港開放數據指數2019/20評估報告截圖

報告建議「資料一線通」及其他官方網站發布數據時提供元數據,包括數據集的背景資料。理想的做法,是在每一個數據集的網頁上,提供一小段文字說明其採集的來源、目的, 及使用侷限等等。

歷史紀錄(檔案):指過往的數據集文檔。欠缺歷史紀錄(檔案),公眾則難以利用歷史數據與最新數據作對比分析。

報告指,提供歷史紀錄(檔案)的做法在香港尚未普及,很多數據提供者在更新數據後,就刪除或隱藏舊文檔。報告提到,「資料一線通」在設計上有考慮存檔需要,有提供「下載歷史數據」功能,但研究發現並非所有數據集都有歷史數據,公眾有時無法得知數據可以追溯至何時,亦不知過往發布過多少個版本。

有份建立建立「武漢肺炎民間資訊」網頁的g0vhk發起人黃浩華,在記招上分享存取武漢肺炎數據的經驗。他提到,「資料一線通」發布「檢疫中心使用情況」的數據,只涵蓋4至5月,沒有更早的2至3月數據,不便公眾追蹤整段疫情期間檢疫中心的使用情況。

相關報道:【政府開放數據落後】IT人和義工自製互動網抗疫:官方上載Data應早過張竹君

報告建議資訊提供者將過往數據集存檔,在每次更新數據集後,再將舊數據存檔於固定網絡地址,以便利的方式讓市民隨時檢索及存取。

倡借鏡上海台北 設公眾論壇

報告建議政府就開放數據設立互動參與平台、公眾論壇,讓市民公開表達需求,並就開放數據情況提出意見。政府要對市民需求作出公開回應,不單開放數據,同時開放參與過程。

報告指,上海台北等鄰近城市,已成立開放數據公眾參與平台,值得香港借鏡。以台北政府設立的討論區為例,當市民提出要求或意見之後,相關政府部門對每一項帖文都要答覆及跟進。

臺北市政府資訊局設網上平台,讓市民提出開放資料建議。

與此同時,報告建議政府成立跨部門工作小組,審視政府開放數據的標準,並敦促各部門在數據管理、資訊科技、法律、行政管理、檔案各方面,按統一標準發佈數據。




請加入成為眾新聞的月費訂戶,長期支持我們的工作。所有訂戶都可以收到我們的「每周時事」通訊 。

月費訂戶網址:hkcnews.com/aboutus/#subscribe