臨床科研數(shù)據(jù)庫系統(tǒng)的現(xiàn)狀與未來(下)(臨床研究數(shù)據(jù)庫)
導讀
本文介紹臨床科研數(shù)據(jù)庫系統(tǒng)的主要的技術問題,提出與隨訪系統(tǒng)以及醫(yī)療業(yè)務信息系統(tǒng)的整合、圍繞研究問題從原始數(shù)據(jù)直接提取科研數(shù)據(jù)的能力是未來臨床科研數(shù)據(jù)庫系統(tǒng)發(fā)展的重點。
《臨床科研數(shù)據(jù)庫系統(tǒng)的現(xiàn)狀與未來(上)》已介紹臨床科研數(shù)據(jù)庫的三種常見類型、特點,以及系統(tǒng)的發(fā)展演變。本文將闡述其主要技術問題以及未來發(fā)展重點。
三、臨床科研數(shù)據(jù)庫系統(tǒng)的主要技術問題
根據(jù)臨床科研數(shù)據(jù)庫的發(fā)展需求,構建一個完整、高效、靈活的臨床科研數(shù)據(jù)庫半臺需要解決以下關鍵技術問題。
3.1 病例數(shù)據(jù)模型的表達
臨床科研數(shù)據(jù)是圍繞科研問題從原始的醫(yī)療(電子病歷)數(shù)據(jù)或其他來源數(shù)據(jù)中采集加工的病例特征數(shù)據(jù)。針對原始觀察性醫(yī)療數(shù)據(jù),可采用類似于電子病歷的數(shù)據(jù)模型表示,這方面有標準化的數(shù)據(jù)模型可供借鑒,如觀測性醫(yī)療結果合作組織(OMOP)的通用數(shù)據(jù)模型(CDM)。而對于特征化的數(shù)據(jù),則每個研究都有所不同,需要結合病例表單進行定義。
作為平臺化的臨床科研數(shù)據(jù)庫系統(tǒng),要能夠根據(jù)臨床科研的數(shù)據(jù)需求和科研設計者的需要,動態(tài)建立和表達每一研究項目對應的數(shù)據(jù)模型。解決數(shù)據(jù)模型動態(tài)定義的問題,當前有三種技術路線:
1、基于傳統(tǒng)的關系數(shù)據(jù)庫表達和動態(tài)建立所定義的模型;
2、基于XML或對象數(shù)據(jù)庫表達和建立所定義的模型;
3、基于底層的Key-Value通用模型,在其上進一步建模構建所定義的模型。
三種方式各有特點,但后兩種方式更便于數(shù)據(jù)平臺的統(tǒng)一管理和處理實現(xiàn)。RedCap系統(tǒng)采用了關系數(shù)據(jù)庫MySQL基礎上的Key-Value表示方法。臨床數(shù)據(jù)交換標準協(xié)會(CDISC)制定的臨床研究數(shù)據(jù)交換標準,采用了基于XML文檔和類似于“Key-Value"的數(shù)據(jù)元素,有很好的適應性。
3.2 病例表單的靈活定義
病例采集表單由臨床科研數(shù)據(jù)庫平臺所提供的界面元素類型、屬性、組合、布局等進行定義,其靈活性決定了數(shù)據(jù)錄入采集界面的美觀和易用性。對數(shù)據(jù)校驗的定義能力很大程度上影響到數(shù)據(jù)的錄入質量,除了常規(guī)的類型一致性、非空值、值域校驗外,數(shù)據(jù)項之間的校驗可采用表達式、函數(shù)以提高校驗表達能力。
3.3 醫(yī)療數(shù)據(jù)的自動關聯(lián)與提取
根據(jù)臨床科研數(shù)據(jù)庫所定義的數(shù)據(jù)項,最大程度地從原始醫(yī)療數(shù)據(jù)中自動關聯(lián)和提取病例數(shù)據(jù),是減輕臨床科研人員數(shù)據(jù)整理工作量的關鍵,也是當前臨床科研數(shù)據(jù)庫系統(tǒng)的關鍵技術。要較好地實現(xiàn)這一目的,除了提供數(shù)據(jù)項映射外,要實現(xiàn)對時間點、醫(yī)療事件的自動識別,以及數(shù)據(jù)項的計算處理和自動判斷。更進一步,針對原始醫(yī)療記錄中大量的自由文本,需要采用規(guī)則定義、機器學習等方法,實現(xiàn)從自由文本中自動提取結構化數(shù)據(jù)項。由于自然語言處理技術的進展和局限性,把這一技術集成到臨床科研數(shù)據(jù)庫平臺還處于發(fā)展之中。
四、未來發(fā)展
隨著需求、技術和應用的發(fā)展,未來的臨床科研數(shù)據(jù)庫系統(tǒng)還將進一步發(fā)展。其中,有以下幾點值得關注。
4.1 與院后隨訪系統(tǒng)的整合
院后隨訪數(shù)據(jù)作為患者臨床結局的反映,是多數(shù)臨床研究中必須收集的數(shù)據(jù)。傳統(tǒng)的院后隨訪除了患者到門診隨訪外,主要依靠臨床研究人員電話隨訪,存在工作量大、失訪率高、數(shù)據(jù)質量受限等普遍性問題。隨著互聯(lián)網(wǎng)、移動通信技術的發(fā)展,通過網(wǎng)頁、微信、App等多種形式的患者院后隨訪服務以及患者自報告結局(PRO)成為可能,隨訪問卷、原始報告等都可以由患者直接錄入或上傳。未來的臨床科研數(shù)據(jù)庫應能與新型的院后隨訪系統(tǒng)相集成,實現(xiàn)臨床數(shù)據(jù)與隨訪數(shù)據(jù)的一體化整合,從而有效提升科研數(shù)據(jù)完整度。
4.2 與醫(yī)療業(yè)務信息系統(tǒng)的協(xié)同
從醫(yī)療記錄中回顧性提取科研數(shù)據(jù)是科研數(shù)據(jù)采集的難點,實踐中始終存在著原始記錄不全、結構化技術要求高的困擾。建立“臨床科研一體化”的電子病歷系統(tǒng),由醫(yī)護人員在診療現(xiàn)場電子病歷系統(tǒng)中直接以結構化方式錄入各類醫(yī)療記錄(即“前結構化”)也有諸多探索,但實現(xiàn)全結構化的電子病歷無論是從技術上還是應用上目前都不理想。然而,結合臨床研究需要,把結構化的科研數(shù)據(jù)表單以“插件”形式集成到臨床電子病歷系統(tǒng)中,兼顧臨床記錄的描述性和科研數(shù)據(jù)的結構化,卻是可行的。另外,近幾年,在臨床專業(yè)學會的推動下,一些專科化的檢查開始推行結構化報告,也為科研數(shù)據(jù)采集提供了便利。未來,臨床科研數(shù)據(jù)采集需求會更多地體現(xiàn)在醫(yī)療業(yè)務信息系統(tǒng)中,兩類系統(tǒng)之間的協(xié)同互補將是發(fā)展的趨勢。
4.3 回顧性研究數(shù)據(jù)收集利用模式的改變
在目前的科室??茖2?shù)據(jù)庫中,有相當一部分是為未來的回顧性研究建設。一方面,在研究問題不確定的情況下,建設和維持科研數(shù)據(jù)庫需要投入專門力量,長期持續(xù)難度大;另一方面,隨著電子病歷數(shù)據(jù)的完善和數(shù)據(jù)處理分析技術能力的提升,當提出研究問題時,能夠針對研究問題直接從原始數(shù)據(jù)中提取所需特征變量開展研究。
結語:
專業(yè)化數(shù)據(jù)服務能力的支持,能最大程度地減輕臨床科室工作量,這一趨勢在醫(yī)院的大數(shù)據(jù)中心工作實踐中已經(jīng)開始顯現(xiàn)。在這種模式下,臨床研究所需要的數(shù)據(jù)特征更為精準、數(shù)目縮小,對病例錄入表單的定義需求降低,對從原始數(shù)據(jù)到科研特征數(shù)據(jù)的加工能力要求提高。
未來,臨床科研數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)加工功能會進一步加強,預先建庫的模式將更多地轉為有研究問題時的即時建厙和數(shù)據(jù)加工,整個過程將進一步簡化。
文章來源:[1]薛萬國,喬屾,車賀賓,孫曉春.臨床科研數(shù)據(jù)庫系統(tǒng)的現(xiàn)狀與未來[J].中國數(shù)字醫(yī)學,2021,16(01):2-6.
文章內容有刪減