[摘要] 人用經(jīng)驗(yàn)是中醫(yī)藥臨床實(shí)踐的總結(jié),也是中藥新藥研發(fā)中評(píng)價(jià)中藥安全性、有效性和臨床價(jià)值的重要數(shù)據(jù)來源。 收集和總結(jié)中藥人用經(jīng)驗(yàn)數(shù)據(jù),應(yīng)用相關(guān)統(tǒng)計(jì)分析,形成可用于評(píng)價(jià)的證據(jù)是中藥人用經(jīng)驗(yàn)研究關(guān)鍵一環(huán)。該文嘗試歸納并 探討目前中藥人用經(jīng)驗(yàn)的臨床數(shù)據(jù)特點(diǎn)和統(tǒng)計(jì)分析方法,對(duì)數(shù)據(jù)類型、結(jié)局評(píng)價(jià)、偏倚評(píng)估、混雜因素及缺失值的處理逐一進(jìn) 行總結(jié)。該文強(qiáng)調(diào)中藥人用經(jīng)驗(yàn)的數(shù)據(jù)分析對(duì)于中醫(yī)藥證據(jù)形成的重要性,同時(shí)提出了目前的難點(diǎn),如數(shù)據(jù)質(zhì)量不高,內(nèi)部 差異性大;缺少個(gè)體化數(shù)據(jù)處理方法;缺少“病證結(jié)合”中醫(yī)特色數(shù)據(jù)的方法等。相信隨著相關(guān)方法的規(guī)范化和科學(xué)化,中藥 人用經(jīng)驗(yàn)數(shù)據(jù)能為中藥新藥的研發(fā)提供有力的證據(jù)。
近年來,國家發(fā)布了一系列政策文件指導(dǎo)中醫(yī)藥工作, 明確將中藥新藥研發(fā)作為中醫(yī)藥發(fā)展的重點(diǎn)任務(wù)之一,為中 藥新藥研發(fā)帶來了歷史性機(jī)遇[。其中,中藥注冊分類的配 套文件強(qiáng)調(diào)了人用經(jīng)驗(yàn)的重要性,基于悠久的歷史傳承和廣 泛的使用,人用經(jīng)驗(yàn)是中醫(yī)藥的獨(dú)特優(yōu)勢,為中藥新藥的研 發(fā)提供了有力的佐證[2]。
目前《中藥注冊分類及申報(bào)資料要求》中明確基于古代 經(jīng)典名方、醫(yī)療機(jī)構(gòu)制劑、名老中醫(yī)方等具有人用經(jīng)驗(yàn)的中 藥新藥審評(píng)技術(shù)要求,加快中藥新藥審批,根據(jù)處方來源和 組成、臨床中藥人用經(jīng)驗(yàn)及制備工藝情況等可適當(dāng)減免藥效 學(xué)試驗(yàn)3]。中藥人用經(jīng)驗(yàn)的主要來源是古籍醫(yī)案、醫(yī)療機(jī)構(gòu) 制劑及名老中醫(yī)等專家經(jīng)驗(yàn)方。但是"人用經(jīng)驗(yàn)"不直接等 同于堆砌的“人用數(shù)據(jù)”,而是需要通過嚴(yán)謹(jǐn)?shù)恼撟C總結(jié)為 “人用證據(jù)”[24]。因此,從臨床經(jīng)驗(yàn)數(shù)據(jù)中評(píng)價(jià)療效、形成證據(jù)是中藥人用經(jīng)驗(yàn)中重要的一環(huán)。
目前,藥物療效評(píng)價(jià)主要是基于隨機(jī)對(duì)照臨床試驗(yàn),分析 藥物效果得出證據(jù)。然而中藥人用經(jīng)驗(yàn)的臨床數(shù)據(jù)類型比較 復(fù)雜,主要是以個(gè)體醫(yī)案、病例等累積而來的臨床數(shù)據(jù),混雜 因素眾多,其分析方法顯得多樣而復(fù)雜5]。因此本文試論述 中藥人用經(jīng)驗(yàn)中臨床數(shù)據(jù)以及分析統(tǒng)計(jì)方法,供同行參考。
1 臨床數(shù)據(jù)類型
由于中醫(yī)藥已經(jīng)廣泛在臨床上使用,相關(guān)的臨床試驗(yàn)設(shè) 計(jì)更傾向于實(shí)用性而非解釋性,因此各種類型實(shí)用性臨床試 驗(yàn)(PRCT) 更加契合中醫(yī)藥的臨床設(shè)計(jì)原則[6]。但在大多數(shù) 情況下,中藥人用經(jīng)驗(yàn)的臨床數(shù)據(jù)沒有預(yù)先的干預(yù)設(shè)計(jì),所 以一般更多采用觀察性研究的方法來評(píng)估藥物效力。而根 據(jù)觀察人群是否存在對(duì)照組,又可以把觀察性數(shù)據(jù)分為觀察 類試驗(yàn)性數(shù)據(jù)和非試驗(yàn)數(shù)據(jù),見圖1。
1.1 類試驗(yàn)觀察性數(shù)據(jù) 臨床試驗(yàn)的目的是確定藥物療效 (effectiveness),其特征必須包含干預(yù)組、對(duì)照組,以及2組干 預(yù)前和干預(yù)后的數(shù)據(jù)。觀察性研究并沒主動(dòng)干預(yù),但是含有 中藥治療人群和對(duì)照人群,以及2組干預(yù)前和干預(yù)后的數(shù) 據(jù),因此把含有這4種元素的臨床數(shù)據(jù)稱為類試驗(yàn)觀察性數(shù) 據(jù),用于評(píng)估藥物效力 (efficacy)。干預(yù)前/后的數(shù)據(jù)如果 是 不 同 時(shí) 間 點(diǎn) 分 別 收 集 , 則 為 縱 向 數(shù) 據(jù) (longitudinal observational data),如果依靠回顧一次性記錄,則為斷面數(shù)據(jù) (cross-sectional data)[8]。 在縱向數(shù)據(jù)中,如果滿足的基本條 件,即治療前后記錄相關(guān)指標(biāo),則為縱向類試驗(yàn)數(shù)據(jù) (longitudinal pre-post data)。如果治療前和治療后多次重復(fù) 測量數(shù)據(jù),則為中斷時(shí)序縱向類試驗(yàn)數(shù)據(jù) (longitudinal interrupted time series data)?。在觀察性研究中,中斷時(shí)序 縱向數(shù)據(jù)由于可以矯正時(shí)間依賴性偏倚,因此在評(píng)估中藥療效的內(nèi)部效度(藥物與療效的因果關(guān)系)方面較好。雖然斷 面數(shù)據(jù)質(zhì)量整體不及縱向數(shù)據(jù),但是也能為中藥療效的內(nèi)部 效度評(píng)估提供一定信息[0]。在斷面數(shù)據(jù)中,也可以根據(jù)多 次,或者一次性收集治療前后的結(jié)果,分為中斷時(shí)序斷面數(shù) 據(jù)(cross-sectional interrupted time series data)和前后性斷面 數(shù)據(jù)( cross-sectional pre-post data),前者的數(shù)據(jù)質(zhì)量優(yōu)于后 者。如果數(shù)據(jù)僅僅提供治療后信息,則會(huì)混入大量混雜信 息,幾乎不能評(píng)價(jià)治療與結(jié)局之間的因果。
1.2 非試驗(yàn)數(shù)據(jù) 在實(shí)際的臨床數(shù)據(jù)中,往往有大量的醫(yī) 案、門診病歷等數(shù)據(jù),這些數(shù)據(jù)缺乏對(duì)照組,因此為非試驗(yàn)數(shù) 據(jù)。相比于類試驗(yàn)觀察性數(shù)據(jù),非試驗(yàn)數(shù)據(jù)對(duì)于療效評(píng)價(jià), 以及中藥-療效的因果關(guān)系推論要弱,然而在中藥人用經(jīng)驗(yàn) 中,絕大部分?jǐn)?shù)據(jù)都為非試驗(yàn)性,合理收集這些數(shù)據(jù),歸納分 析結(jié)果仍可能為后續(xù)的臨床試驗(yàn)設(shè)計(jì)提供不少佐證[7, 非試驗(yàn)數(shù)據(jù)根據(jù)數(shù)據(jù)記錄時(shí)間,以及是否重復(fù)測量,同樣可 分為中斷時(shí)序縱向數(shù)據(jù)、縱向前后數(shù)據(jù)、中斷時(shí)序斷面數(shù)據(jù) 以及前后性斷面數(shù)據(jù)4種。其中縱向數(shù)據(jù)能提供的信息很 為優(yōu)質(zhì),即使在非試驗(yàn)數(shù)據(jù)中,采用與目標(biāo)值對(duì)比的方法,時(shí) 序縱向數(shù)據(jù)也能在一定程度上評(píng)估中藥的療效和安全 性[12]。相反,橫斷面數(shù)據(jù)由于患者的狀況會(huì)隨時(shí)間變化,或 其混入其他因素,可能會(huì)導(dǎo)致嚴(yán)重的信息偏倚。因此在收集 臨床數(shù)據(jù)時(shí),應(yīng)注重保存類試驗(yàn)觀察性數(shù)據(jù)。而在缺少對(duì)照 組時(shí),也應(yīng)該保證有治療前后的數(shù)據(jù),避免回顧性記錄而產(chǎn) 生偏倚。
2 結(jié)局及安全性評(píng)價(jià)
結(jié)局指標(biāo)是評(píng)價(jià)藥物療效的核心數(shù)據(jù)。在中藥人用經(jīng) 驗(yàn)中,既要考慮臨床評(píng)價(jià)利用度,又要顧及中醫(yī)藥自身實(shí)踐。 一般建議在中藥人用經(jīng)驗(yàn)的療效評(píng)價(jià)上,主要結(jié)局還是采用 國際公認(rèn)的結(jié)局指標(biāo),次要結(jié)局可選取報(bào)告結(jié)局(PRO), 用 于評(píng)估患者生命質(zhì)量等[13]。中藥人用經(jīng)驗(yàn)數(shù)據(jù)一般采用病 證結(jié)合記錄,證候評(píng)分是中醫(yī)藥數(shù)據(jù)的特色,但證候評(píng)分與 重要療效的關(guān)系要謹(jǐn)慎處理,評(píng)分的高低與患者實(shí)際的療效 獲益不一定呈絕對(duì)相關(guān)[14]。結(jié)局指標(biāo)選擇可以參考高質(zhì)量 指南、系統(tǒng)綜述或隨機(jī)對(duì)照試驗(yàn)等,也可以參考國際核心結(jié) 局指標(biāo)集,如 COMET 核心結(jié)局等。此外在循證基礎(chǔ)上,應(yīng)該 鼓勵(lì)完善和應(yīng)用中醫(yī)藥相關(guān)的核心指標(biāo)集進(jìn)行療效 評(píng)價(jià)[15]。
安全性的評(píng)價(jià)是中約人用經(jīng)驗(yàn)數(shù)據(jù)的一個(gè)重點(diǎn),也是其 薄弱環(huán)節(jié)[16]。在平時(shí)的臨床記錄中,往往忽視不良事件的 記錄, 一些不合理的低不良事件率在很多時(shí)候是由于沒有合 理記錄造成。因此平日需加強(qiáng)病歷臨床數(shù)據(jù)管理,規(guī)范不良 事件的定義和等級(jí),平時(shí)按照要求上報(bào)和處理。在規(guī)范化方 面使用如 MedDRA、WHOART、ICD10 等統(tǒng)一標(biāo)準(zhǔn)的不良反 應(yīng)編碼慣例或字典[17-18
在結(jié)局統(tǒng)計(jì)方面,中藥人用經(jīng)驗(yàn)臨床數(shù)據(jù)包含大量混雜 因素,因此需要通過多種方法對(duì)藥物的效力值進(jìn)行矯正。即使應(yīng)用了分層、匹配和模型矯正后,對(duì)結(jié)果的解讀也需要慎 重,此時(shí)得出的統(tǒng)計(jì)結(jié)果可以為后續(xù)臨床試驗(yàn)作為參考,但 不能直接解讀為藥物的療效或者效力[1921]。此外,中藥人用 經(jīng)驗(yàn)數(shù)據(jù)的類型和統(tǒng)計(jì)目的與臨床試驗(yàn)有較大差別,由于沒 有預(yù)先設(shè)定臨床有效閾,且樣本量較多,基于中藥人用經(jīng)驗(yàn) 的統(tǒng)計(jì)往往會(huì)出現(xiàn)有統(tǒng)計(jì)學(xué)意義,而無臨床意義的情況(如 某種中藥確定有降壓作用,但是由于作用太弱沒有應(yīng)用價(jià) 值)。因此中藥人用經(jīng)驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)結(jié)果應(yīng)注重描述性統(tǒng) 計(jì),強(qiáng)調(diào)結(jié)果的臨床解讀而弱化統(tǒng)計(jì)學(xué)意義,為后續(xù)試驗(yàn)提 供更多的信息[22]。對(duì)于病案記載的中醫(yī)證候,可應(yīng)用評(píng)分 工具進(jìn)行評(píng)估,并建議采用標(biāo)準(zhǔn)化差異統(tǒng)計(jì),用于排除偏倚。 對(duì)于多個(gè)互相不能重合的結(jié)局,應(yīng)該選擇競爭風(fēng)險(xiǎn)模型 competing risk model),考慮多種潛在結(jié)局來評(píng)估藥效,避免 錯(cuò)誤估計(jì)藥物對(duì)某種結(jié)局的效果[23]。
3 偏倚評(píng)估
相對(duì)于設(shè)計(jì)良好的臨床試驗(yàn)數(shù)據(jù),中藥人用經(jīng)驗(yàn)數(shù)據(jù)由 于沒有良好的質(zhì)控,往往存在較大偏倚。中藥人用經(jīng)驗(yàn)數(shù)據(jù) 可見各種選擇性偏倚和信息偏倚,如僅在醫(yī)院收集臨床經(jīng)驗(yàn) 數(shù)據(jù),會(huì)出現(xiàn)伯克森偏倚[2];中醫(yī)藥證候結(jié)局具有多樣性, 僅觀察一種證候結(jié)局時(shí),可能造成競爭風(fēng)險(xiǎn)偏倚[25];而信息 偏倚在中藥人用經(jīng)驗(yàn)數(shù)據(jù)中更為常見,如回憶偏倚、報(bào)告偏 倚、誘導(dǎo)偏倚等。而臨床記錄的不規(guī)范,則會(huì)產(chǎn)生藥物暴露 錯(cuò)分和結(jié)局錯(cuò)分偏倚[26]。
對(duì)于選擇性偏倚,在數(shù)據(jù)收集、篩選流程和細(xì)節(jié)上要謹(jǐn) 慎設(shè)計(jì),制定相應(yīng)的納入排除樣本標(biāo)準(zhǔn),明確每種偏倚產(chǎn)生 的原因和每個(gè)步驟可能產(chǎn)生的偏倚,以提高樣本的可分析 性[27]。對(duì)于信息偏倚,應(yīng)盡量提取相同指標(biāo)的重復(fù)測量信 息,并采用回歸稀釋方法評(píng)估測量誤差并對(duì)其校正。對(duì)于矛 盾數(shù)據(jù)需要溯源,查看原始醫(yī)案/病歷記錄。對(duì)于異常值,需 要在統(tǒng)計(jì)分析計(jì)劃中預(yù)先制定敏感性分析的方案,并依次在 統(tǒng)計(jì)分析報(bào)告中進(jìn)行異常值的敏感性分析。此外還有來源 于混雜因素的偏倚,由下面單獨(dú)討論[26]。
4 混雜因素處理
混雜是指干預(yù)對(duì)結(jié)果的影響(或關(guān)聯(lián))被另一個(gè)變量的 存在所扭曲的情況,是數(shù)據(jù)偏倚產(chǎn)生的重要原因之一。由于 混雜因素與藥物干預(yù)/療效單獨(dú)相關(guān),因此在評(píng)估時(shí)常常扭 曲干預(yù)和結(jié)果之間實(shí)際關(guān)系,從而導(dǎo)致錯(cuò)誤估計(jì)中藥療效。 控制混雜因素好的方法即是隨機(jī)對(duì)照過程,通過隨機(jī)分組 可以使比較基線相等,排除混雜因素。然而由于中藥人用經(jīng) 驗(yàn)的臨床數(shù)據(jù)多為觀察性,且數(shù)據(jù)的來源、質(zhì)控均不嚴(yán)格,因 此混雜因素問題可能是中藥人用經(jīng)驗(yàn)數(shù)據(jù)分析的一大難點(diǎn), 需要重點(diǎn)處理[28-29
在識(shí)別混雜因素方面,需要緊密結(jié)合臨床知識(shí),盡可能 納入并矯正潛在對(duì)藥物療效有影響的因素[30]。由于中藥 人用經(jīng)驗(yàn)數(shù)據(jù)質(zhì)控問題,可能存在較多未知的混雜因素,超 出臨床醫(yī)師的判斷范圍,此時(shí)可以結(jié)合一些統(tǒng)計(jì)學(xué)方法,如傳統(tǒng)的逐個(gè)相關(guān)性分析法,結(jié)合有向無環(huán)圖分析因子之間 的關(guān)系,從而判斷是否為混雜因素[31]。此外一些機(jī)器學(xué)習(xí) 的方法,如 Lasso 回歸的手段可分析各個(gè)因子對(duì)療效結(jié)局的 影響力,XGBoost算法可計(jì)算各種因子組合對(duì)療效的貢獻(xiàn) 度[32]?;谶@些方法配合知識(shí),能更好地識(shí)別出混雜 因素。
在矯正混雜因素方面,對(duì)于連續(xù)性變量的結(jié)局指標(biāo), 一 般采用前后差值,或協(xié)方差方法來防止基線偏倚,或采用更 為穩(wěn)健的中斷時(shí)序設(shè)計(jì)矯正基線[33.34]。在數(shù)據(jù)量較大情況 下,對(duì)于潛在因素應(yīng)多分層,分層除了可以較好矯正混雜因 素以外,還可以繼續(xù)分析藥物和其他因素的協(xié)同作用。此 外,還可以依靠各種統(tǒng)計(jì)工具對(duì)混雜因素進(jìn)行矯正,見表1。 各種回歸模型是矯正混雜因素的常用方法,如應(yīng)用多重線 性回歸處理連續(xù)性數(shù)據(jù)資料,應(yīng)用Logistic 回歸處理一般分 類資料,應(yīng)用 Poisson 回歸處理偏態(tài)分布資料,應(yīng)用Cox 回歸處理生存資料等[35-36]?;貧w分析可以同時(shí)考慮多個(gè)因素的 作用,排除混雜因素的影響,但是要求結(jié)局事件的例數(shù)不能 太少。此外可以用隨機(jī)匹配法,使中藥組和對(duì)照組之間具有 可比性,而常用的匹配方法為傾向性評(píng)分法(propensity score method)[20]。 傾向性評(píng)分法可針對(duì)混雜因素進(jìn)行模擬 擬合后打分,根據(jù)分?jǐn)?shù)相似度進(jìn)行匹配,使2組基線相近。 除了直接匹配,利用傾向性評(píng)分還可以進(jìn)一步聯(lián)合分層、回 歸、加權(quán)等方法矯正混雜因素,相比于回歸法,傾向性評(píng)分可 以用于混雜因素較大,樣本數(shù)量較小的數(shù)據(jù),但難以像回歸 方法構(gòu)建矯正以后的中藥量-效的非線性關(guān)系[3]。中藥人用 經(jīng)驗(yàn)數(shù)據(jù)往往包含大量的未知混雜因素,對(duì)其處理也一直是 業(yè)界的難題之一。工具變量(IVA) 分析是處理未知混雜因 素的常用辦法,如孟德爾隨機(jī)化設(shè)計(jì)就引入了基因型這一工 具變量[38]。但是在中醫(yī)藥的研究中,如何尋找合適的工具 變量,仍然存在爭議和困難。
5 數(shù)據(jù)缺失處理
不同于臨床試驗(yàn)數(shù)據(jù),中藥人用經(jīng)驗(yàn)數(shù)據(jù)由于沒有統(tǒng)一 規(guī)范設(shè)計(jì),存在大量缺失值,因此對(duì)于缺失值的處理是中藥 人用經(jīng)驗(yàn)的必經(jīng)環(huán)節(jié)。缺失值可以根據(jù)數(shù)據(jù)內(nèi)部隨機(jī)屬性, 分為完全隨機(jī)缺失、隨機(jī)缺失和非隨機(jī)缺失3種[3]。 一般 來說對(duì)于完全隨機(jī)缺失,其結(jié)果不依賴任何其他變量,因此 可直接對(duì)樣本進(jìn)行填補(bǔ),如應(yīng)用LOF 方法、多重插補(bǔ)法或回 歸方法進(jìn)行變量填充[40]。但是在中藥人用經(jīng)驗(yàn)臨床中,由 于記錄的模式問題,絕大多數(shù)缺失都存在非隨機(jī)性(如醫(yī)院 或者個(gè)人記錄的偏好,中醫(yī)醫(yī)案的風(fēng)格導(dǎo)致),如果直接刪除 或用傳統(tǒng)方法填補(bǔ),可能會(huì)造成偏倚[4]。因此這時(shí)可利用 模式混合模型(pattern mixture models)進(jìn)行插補(bǔ),但是由于此 方法需要的樣本量較大,因此還需要對(duì)缺失值進(jìn)行敏感性分 析,從而保證缺失填充的準(zhǔn)確性[42]。
6 問題與展望
目前在中藥人用經(jīng)驗(yàn)臨床數(shù)據(jù)的處理和統(tǒng)計(jì)中,存在不 少問題和難點(diǎn),如記錄質(zhì)控不高、規(guī)則不統(tǒng)一、標(biāo)準(zhǔn)和指標(biāo)難以收集和歸一化。諸多中醫(yī)藥個(gè)性化數(shù)據(jù),如如何在數(shù)據(jù)收 集和分析中合理處理組方配伍、量效關(guān)系等因素;如何納入 并統(tǒng)計(jì)評(píng)估中醫(yī)藥特色的指標(biāo),實(shí)現(xiàn)“病證結(jié)合”;如何構(gòu)建 中藥人用經(jīng)驗(yàn)臨床證據(jù)等級(jí)的評(píng)估等。但盡管存在這樣和 那樣的問題,作者相信隨著國家的重視,交叉學(xué)科的融入以 及新方法的推廣,這些問題會(huì)逐個(gè)得到解決,中藥人用經(jīng)驗(yàn) 數(shù)據(jù)收集和處理過程將會(huì)更加科學(xué)、嚴(yán)謹(jǐn),形成規(guī)范,指導(dǎo)中 藥新藥的研發(fā)。
關(guān)于我們
業(yè)務(wù)范圍
藥械注冊