除了系統設計,數據的質量也是建立系統的重要考量之一。雖然政府已擁有大部分大馬人的資料,但這些資料存放在不同的系統與數據庫中。
主要數據庫(PADU)註冊限期已到,數天前,接近一半18歲及以上的大馬人已完成註冊。
ADVERTISEMENT
就像一杯水一樣,有人認為“半杯滿”,政府已獲足夠的數據,可評估中低收入群體的真實情況。有人則覺得“半杯空”,註冊人數偏低。
連砂拉越與沙巴政府,也對PADU保持觀望態度,還指示暫停註冊。從IT角度看,PADU成敗取決於使用率。若它日後被廣泛使用,便是成功,反之則失敗。
人們對PADU的批評,包括用戶體驗欠佳,以及擔憂保安不足,資料有外洩的風險。有者認為,政府無需一箇中央數據庫,它可以從不同部門與系統,整合人民的資料。
從IT從業者的角度來看,即使是一箇中央系統,它也未必需要一箇中央數據庫。如同行內人士所言,系統可以通過API等技術與其他系統連接,實現數據共享。
然而,每一個系統設計都有它的弱點。例如,新系統可以內置API技術,但要連接的系統可能沒有相應的接口。因此,確保部門內所有相關係統都有API是一個挑戰。
當然,政府可以考慮翻新所有相關的系統,但這會帶來成本問題。更重要的是,若人們對PADU系統的保安系統有所保留,他們會如何看待部門被翻新後的系統?
從這個角度看,放棄中央數據庫未必能解決問題,它可能會把問題從一個系統,轉移到多個系統身上。更為棘手的是,當一個系統需要與不同部門的系統緊密相連時,系統的建設與運作就需要各部門的密切配合。
由於每個部門都有其獨特的權力、工作文化和背景,類似於跨部門項目所面臨的挑戰可能會比一般項目更為耗時費力。
在系統設計領域,越多系統參與,意味著出現故障的機會越大。若把一個系統想像成船隻,一個“分散式系統設計”猶如把許多船隻連接在一起。
一旦其中一個系統出現問題,就有機會上演“火燒連環船”,導致整體系統癱瘓。為了避免“一物倒,全盤倒”的風險,系統設計者必須投入額外的資源,提升系統的可靠性。
除了系統設計,數據的質量也是建立系統的重要考量之一。雖然政府已擁有大部分大馬人的資料,但這些資料存放在不同的系統與數據庫中。
要把所有資料連接起來,至少會面臨三個挑戰。第一是數據的時效性。不同的系統,它們收集資料的時間並不一致,所以未必能提供最新的資料。
第二個挑戰是數據的準確度。不同的系統,所收集的數據的質量有別。對於這一堆質量參差不齊的數據,勉強把它們參雜在一起聯合使用,效果未必如想像般好。
如果將這些質量參差不齊的新舊數據交叉使用,作為補貼政策的唯一參考,未必能準確反映人們的最新情況。這樣的策略未必能把錢發到真正需要援助的人手上。
第三個挑戰跟速度有關。由於數據以不同的格式,存放在不同的數據庫,它們不能輕易被整合為一,滿足新系統的需求。其中一個做法是通過ETL技術,把資料從原來系統抽取、轉換、再加載到目標系統,此過程需要時間,也需要資源。
政府究竟是否需要一箇中心數據庫?PADU究竟是可有可無,還是不可或缺?
我認為對於補貼合理化計劃,雖然中心數據庫不是唯一的方法,但 “分散式系統設計”的挑戰也不少。在人們沒有機會審核各自資料的情況下,後者的數據質量備受質疑。
若要在兩個方案之間二選一,取決於補貼政策對數據的需求、政府用於發展系統的預算,以及現有數據的質量和時效性。
可能有人會認為,中心數據庫的概念已過時,但在過去20年,我在 IT職場上學會了一件事,科技不分新或舊,只分適合與不適合,以及能否滿足客戶的需求。不管是黑貓或白貓,能捉老鼠的就是好貓。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT