公立醫院資源分配不勻的問題一直為人詬病。眾新聞今次嘗試從不同途徑,收集各聯網、各醫院的醫療及人口數據,分析不同地區居民的醫療需求、各聯網及醫院面對的壓力,以及資源分配的情況,並製作成互動的圖表,方便讀者自行從資料中探索。

我們製作「數說香港醫療資源分配」專題,由資料搜集到出街,大約用了3個星期時間。早期收集數據階段,已經舉步為艱。我們從現有的公開資料著手,第一步是讀醫管局每年發表的年報,裡面有病床數目、住院服務、急症室服務、門診服務、醫療人手的統計數字,「公立急症室醫院資源」雷達圖的數據(見上圖),主要來自年報的資料。
不過,醫管局的公開資料,一般只有PDF版本,有時也提供電子書、HTML版本,但這些格式,都是不便於抽取數據再進行分析的。以醫管局2015-16年報為例,我們先下載那份240頁的PDF文件,然後將當中第220至221頁(病床數目、住院服務、急症室服務、門診服務數據)、226至227頁(醫療人手數據)抽出。先將多頁的PDF文件「拆件」,再抽取其中有用的幾頁出來,是為了減少之後轉換格式的混亂情況,並縮短轉換時間。抽取出需要的幾頁PDF文件後,我們再將其格式由PDF轉為Excel可讀的XLS格式。我們亦抽取過醫管局2014-15、2013-14、2012-13、2011-12年報的相關數據,以及其他數字,包括高層薪酬、醫療人手開支等,作前期分析,每次都要經過上述「拆件」、轉換格式的過程,相當費時。
我們曾經透過電郵向醫管局查詢各聯網的人口數字,但醫管局的公關沒有直接在電郵回覆相關數字,反而指示記者從立法會財委會審核2017至18年度開支預算文件中找「第18 節 FHB(H) - 第5頁」。於是,我們就從過千頁的PDF格式檔案中,拆出當中需要的3頁數據,再轉換做XLS檔案。當我們大費周章將多個龐大的PDF檔案轉換成XLS檔案,其實才是比較、分析數據的第一步。
這些PDF格式,除了不便記者分析數據,還對Editorial Engineer製作互動表時造成麻煩。PDF或已轉化的XLS格式,都不是電腦可直接讀取的格式。記者將數據整理成Google Spreadsheet檔案後,Editorial Engineer再逐一將spreadsheet的數字copy and paste到程式中。
「PDF真係好低B,呢個係冇用嘅barrier。如果政府係因為怕被人利用造假資訊、包病毒,而用PDF格式,其實佢應該整個方便人搵資料嘅地方,等人人都知道去嗰個reference point搵資料先啱。」眾新聞的Editorial Engineer批評,政府透過PDF格式發放資料,只算是release data(公開數據),而非真正open data(開放數據)。
他又舉例指,資料一線通上,部分政府數據既有「API available」、電腦可直接讀取的JSON、XML、CSVY等格式,同時有方便一般人讀取的XLS格式檔案,做法較為可取。不過,資料一線通上的數據有限,今次我們亦未能在該網上找所需的醫療數據。


低處未算低,醫管局發布新聞稿的PDF檔案中,一些內容明明是文字或數字,卻以一個個圖像檔的格式來呈現,例如我們用以製作內科病床使用率Heat Map的「公立醫院急症服務及內科住院病床使用率數據」,PDF檔案的文字或數字是不能選取的(見下圖),更不能直接轉換為Excel檔案。眾新聞的Editorial Engineer得悉該「圖像PDF檔」後,一度驚呼:「你(醫管局)請啲人有冇競爭力㗎!?」



有至少兩星期的內科病床使用率數據,我們是以人手輸入數字,直至後來無意中發現政府新聞公報也有相同的資料,而且政府新聞公報上載的檔案,是可以轉換為Excel的PDF檔案(見下圖),這才免卻逐個數字人手輸入的麻煩,亦大大減少打錯字的機會。

醫管局公開的資料畢竟有限,我們曾經嘗試向醫管局查詢其他數字,例如各聯網一些常見、非緊急手術的平均等候時間、藥物開支、ICU(加護病房)病床數目等,但醫管局以各種理由拒絕提供,例如:醫管局沒有恆常整合、發布那些資料,以前立法會議員查詢時,醫管局要特別整理那些數字給議員,但一般情況醫管局沒有人手處理記者查詢之類。

我們曾因應前線醫生懷疑局方低估流感高峰期的內科病床使用情況,兩次向醫管局查詢「內科病床使用率」的計算方法,惟局方始終未有明確回覆。我們又曾自行整合15間急症醫院提供緊急「通波仔」及溶血劑治療的服務時間資料,請醫管局核實資料,但醫管局連核實都不願意做。報導發布後,醫管局人員甚至主動致電記者,質問報導中為何只提到「無法核實」、「無進一步補充」等字眼,他強調醫管局已經以他們自己的方式答了我們的提問,並非沒有回答問題。
醫管局到底如何回答,以下兩篇報道我們將記者的提問和醫管局的答覆原文刊登,讓讀者公評:
我們明白「數說香港醫療資源分配」專題的資料,未足以呈現目前公營醫療系統的全貌,例如「公立急症室醫院資源」雷達圖只有各醫院的病床總數,但ICU與普通科病房的病床,每日開支可以是萬元與千元的分別,當中患者病情的複雜程度、所需醫療人手亦有極大差異。又如「醫院聯網資源一覽」中,未有計算跨聯網求醫的需求,但要將這納入考慮,則不能光計算跨聯網求醫者的人數,更要知道病人接受了什麼治療,因為不同手術,如換肝與白內障手術,當中涉及的成本相去甚遠,若以一個換肝病人與白內障患者相提並論,亦不公允。惟這裡有太多數字,我們沒法取得,更遑論作進一步分析。

若政府肯開放更多數據,增加資訊透明度,除有利傳媒監察,還讓普羅市民有多機會了解公共行政體系。就今次專題而言,公營醫療資源如何分配是眾人之事,市民亦應該有知情權,並在充足資訊下參與政策討論。
推動香港開放數據的資訊科技界立法會議員莫乃光指出,香港沒有公開資料法、檔案法,政府部門可能根本沒有儲存資料,即使有儲存數據,亦沒有動機公開資料,而負責的資訊科技總監辦公室淪為「無牙老虎」,未有能力要求其他部門根據某標準處理及發放資料。「啲部門唔緊張,講得衰啲,甚至乎會專登留難你。」
莫乃光批評,香港在開放數據方面落後於其他亞洲城市,惟港府態度散漫。「政府同我哋講,開放數據政策只限於open啲已經open嘅嘢,其實好hea、好是旦。」根據英國Open Knowledge International的開放數據排名,同屬亞洲的台灣排全球第1,日本、新加坡分別排名16、17,而香港僅得24。