癌症研究主題式資料庫
肺癌主題式資料庫、乳癌主題式資料庫已在衛福部資科中心開放申請
簡介
肺癌主題式資料庫與乳癌主題式資料庫是已在衛生福利資料科學中心開放申請之整合性資料庫,由國家衛生研究院研究團隊會同衛生福利部統計處合力完成建置,目前正在建置的有肝癌主題式資料庫及大腸直腸癌主題式資料庫。這些主題式資料庫是在『健康大數據永續平台』跨部會計畫中之分項計畫:「健康大數據主題式資料庫建立及整合分析」中完成。為使大家瞭解這些癌症研究主題式資料庫建置的內容以及其潛在的用途,特此簡介。
肺癌主題式資料庫
本資料庫納入了1979-2020年在癌登檔中曾罹患肺癌者為個案,針對這些個案串連了其健保資料庫之處方及治療明細檔、醫令明細檔等,以及癌登檔、死因統計檔等,共14個資料檔(詳見「肺癌主題式資料庫使用手冊」),提供肺癌相關研究的材料,可進行長期追蹤研究,而非僅是橫斷面研究。
乳癌主題式資料庫
本資料庫納入了1979-2019年(最近會再更新至2020年)在癌登檔中曾罹患乳癌者為個案,針對這些個案串連了乳癌個案之健保資料庫之處方及治療明細檔及醫令明細檔、癌登檔、死因統計檔等14個資料檔(詳見「乳癌主題式資料庫使用手冊」),並增加了乳癌篩檢檔(2004-2021),在研究範圍上,更增加預防及預測的面向。
資料加值欄位
本主題式資料庫除現有資料檔之串聯,並做了一些加值,舉例如下:對癌登檔及死因檔均做了ID清理(詳見各使用手冊),另外關於癌症研究中,特別依美國國家癌症研究所NCI之SEER死因分類法,提供加值欄位描述癌症研究中國際上常用之死因分類,以便做存活分析時採用競爭風險或特定死因之概念,這在多發癌症狀況特別重要。此外,加值欄位中也增加了癌前共病的欄位,將共病變項一起考量,可瞭解共病對於癌症患者存活的影響。
資安維護
本資料庫均經去識別化處理,沒有任何可識別個案的資訊,且申請通過的計畫,僅能於衛生福利資料科學中心設置之獨立作業區內使用,攜出之統計結果均須經審核通過為summary tables的形式,以確保每個人的資料被保護。
應用範例
這些主題式資料庫的應用範例很多,僅以我們最近的一篇論文介紹如下:利用台灣癌登資料(1979-2019),以及長表(2011-2019,有個案吸菸狀況及腫瘤期別的訊息),死因檔(1985-2019)、健保資料庫(2000-2020),內政部人口資料(2011-2019),國民健康訪問調查五波資料,及臺灣人體生物資料庫(2008-2021),我們分析此整合資料集。研究發現40-84歲侵襲性肺癌無論在哪個年齡層,哪個期別,或吸菸狀態,女性肺腺癌的發生率(2011-2019)均高於男性。這篇論文發表在JAMA Network Open 2023 Nov.,對肺腺癌的病因學及可能的臨床轉譯應用提供了進一步探索的方向。
結語
藉由這些建置的癌症別主題式資料庫,可更深入了解各癌別在台灣的流行病學樣貌、治療的效益趨勢、成本效益評估等,鼓勵醫研界多加利用,若有需要,亦可和相關資料庫研發團隊聯絡(熊昭、張憶壽研發團隊,contact: hsiung@nhri.edu.tw)
Reference
Chien LH, Jiang HF, Tsai FY, Chang HY, Freedman ND, Rothman N, Lan Q*, Hsiung CA*, Chang IS*. Incidence of Lung Adenocarcinoma by Age, Sex, and Smoking Status in Taiwan. JAMA Netw Open. 2023 Nov 1;6(11):e2340704.