劉 曼 許敏怡 劉玉秀,4△ 陳文松 鞏浩雯 熊殷
【提 要】 目的 探討隨機對照試驗(randomized controlled trial,RCT)中應用限制性隨機化方法的選擇偏倚對統計檢驗決策的影響。方法 采用Monte-Carlo模擬比較4種常用的限制性隨機化方法在不同的參數設置和猜測策略下進行統計檢驗時的一類錯誤率表現。結果 4種限制性隨機化方法均會導致一類錯誤率超過預設的顯著性水平(如5%),區組長度越小、選擇效應越大,一類錯誤率膨脹越嚴重,在同等條件下,PBD的一類錯誤率膨脹最大,其次是BCDWIT、BUD、BSD。結論 臨床試驗中應用限制性隨機化方法存在的潛在選擇偏倚會導致一類錯誤率膨脹,應注意優選隨機化方法并加強實施過程管理。
隨機對照試驗(randomized controlled trial,RCT)是評估醫療干預措施效果的金標準。隨機化被認為是RCT中創建可比治療組和減少偏倚的關鍵部分。限制性隨機化是一類為了控制組間均衡性而設置一些限制條件的隨機化方法,受到普遍歡迎[1]。然而,在開放或非盲態試驗中,由于限制性隨機化方法的“限制”特點,若選擇和操作實施過程不當則容易產生可預測性并選擇性分配受試者,進而導致選擇偏倚[2]。本文通過分析該類選擇偏倚對一類錯誤率的影響,研究其在不同隨機化方法下對檢驗決策的影響,為隨機化方法選擇和偏倚防范提供參考。
1.猜測策略
研究表明,在RCT中,若采用限制性隨機化設計方法,當研究者知曉已經入組受試者的分配信息時,即使在實行了分配隱蔽并不能直接獲得下一例分配組別的情況下,也往往會猜測下一例的分配,其猜測分配的行為模式一般符合Blackwell-Hodges收斂策略(BH策略)[2-3],即猜測下一例分配到當前例數較少的一組。對于兩組試驗,記試驗組為E,對照組為C,總樣本量為N,入組受試者的序號為i。假設研究者在整個試驗的過程中對每一例分配都猜測,且期望試驗組具有更好的效果,令gi為第i個分配的猜測分組,則
(1)
其中,di-1為前i-1名受試者中試驗組和對照組的樣本量之差,即di-1=NE(i-1)-NC(i-1),R服從于伯努利分布,即R~Ber(0.5),1代表試驗組E,0代表對照組C。若gi=1,研究者將有意識或潛意識地選擇具有有利于E組試驗成功的特征變量的受試者;若gi=0,研究者將傾向選擇具有不利于C組試驗成功的特征變量的受試者;若gi=R,研究者沒有猜測的依據,則以相同的概率隨機選擇第i個受試者分到E組或C組。在這種猜測策略下,研究者可以使期望的正確猜測次數最大化。
文獻報道的另一種猜測策略是僅在特定情況下進行猜測[4],該策略假設研究者已知組大小及當前組內的先前分配,可得出當前受試者分配給試驗組E的條件分配概率P{E},則可根據P{E}猜測下一例的分配,若P{E}超過固定的臨界值q,猜測第i個受試者分配到E組。反之若P{E}小于固定的臨界值1-q,猜測第i個受試者分配到C組。其中,q是人為設定的,通常≥1/2。顯然該猜測策略較為復雜,似乎不夠符合臨床試驗中研究者的猜測行為模式。因此,本研究僅采用BH猜測策略。
2.選擇偏倚與檢驗的一類錯誤
在選擇偏倚的影響下,臨床試驗中的治療差異檢驗可能會出現一類錯誤率膨脹,例如,即使沒有實際的治療效果,組間的異質性也會導致組間療效差異顯著。Proschan[5]率先提出了收斂策略對療效假設檢驗的一類錯誤率的影響,并基于BH策略提出如下模型。假設試驗研究者偏向于試驗組,并且有足夠的候選受試者。即當研究者猜測下一個患者將被分配到試驗組時,他會招募一名具有某些特征變量、預期結果更好的受試者;在猜測下一個受試者將被分配到對照組時,則招募一名預期結果較差的受試者;在隨機猜測下一個治療時,將會招募一名結果中等的受試者。研究者能夠區分結果較好、較差或中性的受試者的程度由參數η表示, 稱為選擇效應。
(2)
xi~N(μ1,σ2),i∈{1,…,n}
(3)
yi~N(μ2,σ2),i∈{1,…,n}
采用雙側獨立兩樣本t檢驗來檢驗以下假設[6]:
H0:μ1=μ2?H1:μ1≠μ2
(4)
在沒有治療效果的原假設下,我們假設研究者偏愛試驗組,希望通過選擇偏倚提高一類錯誤率,達到證明試驗組優于對照組的目的。
對于二分類的響應變量,假定兩組的響應結果均服從二項分布,即
xi~Binomial(n1,π1),i∈{1,…,n}
(5)
yi~Binomial(n2,π2),i∈{1,…,n}
采用Pearsonχ2檢驗來檢驗兩組率是否相等。
1.模擬場景參數設置
所有Monte-Carlo模擬在SAS 9.4系統環境下實現。對于連續(二分類)的響應變量,設置兩處理組,每組各100例;兩組的均數(成功率)均設置為0.4,選擇效應(η)相應設為0.2、0.1、0.05;隨機化方法選擇區組隨機設計(permuted block design,PBD)、大棒設計(big stick design,BSD)、帶不平衡限制的偏幣設計(biased coin design with imbalance tolerance,BCDWIT)、區組甕設計(block urn design,BUD)方法;模擬研究的區組選擇較小區組長度(4,8,10)和較大的區組長度(20,50,200),相應的最大容許不平衡數(maximal tolerated imbalance,MTI)取值為2、4、5、10、25;具體參數設置見表1。
表1 4種限制性隨機化方法一類錯誤率模擬的參數設置(檢驗水準α=0.05)
2.模擬過程
基于各種隨機化設計生成隨機列表。根據生成的隨機列表和研究者的選擇偏好,模擬受試者進入E組或C組的分配。研究者可以根據BH猜測策略選擇強、中、弱特征的受試者[6]。
對于相關參數的每個組合,重復數據生成整個過程1萬次。設定檢驗水準α=0.05,使用t檢驗或χ2檢驗對每個生成的數據集進行分析,以檢驗E和C兩組之間的差異,使用一類錯誤率評估檢驗決策的性能。一類錯誤率是指P值小于0.05的模擬數據集的比例。一類錯誤率偏離0.05表示存在偏倚。
為了在更現實的環境中檢驗選擇偏倚對一類錯誤率的影響,我們重復進行了模擬,但改變了研究者在每種情況下都能選擇具有偏好特征受試者的理想情況。即并沒有足夠的受試者供研究者選擇,具體來說,當研究者嘗試招募一名強特征受試者時,他只有50%的機會這樣做。同樣,研究者每次嘗試招募弱特征受試者時,也只有50%的機會。若招募不到合適的受試者則招募中等強度的受試者。
1.連續響應變量的一類錯誤率膨脹
由圖1可得,當研究者有100%的概率選擇合適的受試者時,在區組隨機化方法下,隨著區組長度的增大,一類錯誤率逐漸減小,當選擇效應為總效應的1/2時,除了區組長度為200的其余區組長度的一類錯誤率均較大,區組長度為4時,一類錯誤率膨脹至22%;同時,隨著選擇效應的減小,一類錯誤率也逐漸降低,但仍高于名義水平。而當研究者只有50%的概率選到合適的受試者時,其一類錯誤率膨脹明顯減小,但在區組長度為4時,一類錯誤率也膨脹至10%。可見,在BH收斂策略下,無論選擇效應有多小,只要有選擇,就會導致一類錯誤率增大,且區組長度越小,一類錯誤率膨脹越大。
*:對應不同的研究者猜測情況,guess=50%表示研究者有50%的概率選到心儀的受試者,guess=100%表示研究者有100%的概率選到合適的受試者
各類情況下的BUD的一類錯誤率的變化趨勢與PBD大致相同,即隨著區組長度的增加而減小(圖1),但該趨勢僅在區組長度較小(小于10)時較為明顯。在100%選擇的理想情況下,區組長度為4時,一類錯誤率最大為12%。當受試者人數有限無法供研究者任意選擇時,各區組長度下的一類錯誤率大致相同,一類錯誤率在區組長度為4時較大(8%)。
BSD的一類錯誤率隨著MTI的增加而降低(圖2),當受試者足夠供研究者選擇時,MTI為2,選擇效應為0.2下的一類錯誤率為11%,當MTI大于4時,一類錯誤率明顯降低。而當受試者人數有限無法供研究者隨意選擇時,一類錯誤率的情況有所好轉,選擇效應較大、MTI較小時,一類錯誤率較大。
注:對應不同的研究者猜測情況,guess=50%表示研究者有50%的概率選到心儀的受試者,guess=100%表示研究者有100%的概率選到合適的受試者
BCDWIT是BSD和偏幣設計的綜合(圖2),當選擇效應較大時,一類錯誤率隨著MTI的增加而減小,選擇效應為0.2、MTI為2時,一類錯誤率膨脹至15%;當選擇效應較小(0.05)時,一類錯誤率降低到名義水平;而當受試者人數有限無法供研究者任意選擇時(guess=50%),一類錯誤率明顯降低,其趨勢與100%猜測的情況大致相同。
2.分類響應變量的一類錯誤率膨脹
在二分類響應變量情況下,一類錯誤率隨區組長度和選擇效應的變化趨勢與連續變量大致相同,但其值均明顯增大,在100%猜測的區組設計下,區組長度為4,選擇效應為總效應的1/2時,一類錯誤率竟膨脹至0.68,50%猜測的情況下,也膨脹至0.22,BUD、BSD的一類錯誤率雖較PBD小,但也膨脹至30%。
為了方便比較4種隨機化設計的一類錯誤率膨脹,我們列舉了區組長度為4或MTI為2的參數設置下對應的一類錯誤率模擬結果(表2)。綜合來看,PBD在各種選擇效應和研究者猜測情況下,都有一類錯誤率膨脹,且大都高于其他幾種方法,其次是BCDWIT,BCDWIT的一類錯誤率膨脹雖較前者小,但仍高于名義水平,一類錯誤率膨脹最小的是BSD,在選擇效應為0.2時,一類錯誤率為0.1092;因此,在同一參數設置下,各隨機化設計的一類錯誤率膨脹順序為PBD>BCDWIT>BUD>BSD。
表2 MTI為2(區組長度為4)時幾種限制性隨機化方法的一類錯誤率
本文分析了限制性隨機化方法下因選擇受試者導致的選擇偏倚,并通過Monte-Carlo模擬比較了4種限制性隨機化方法在不同的參數設置和猜測策略下的一類錯誤率表現。模擬研究發現,該種選擇偏倚會導致一類錯誤率超過預定的顯著性水平,在同一MTI下,PBD的一類錯誤率膨脹最大,其次是BCDWIT、BUD、BSD。當然,若當受試者人數有限無法供研究者任意選擇時,一類錯誤率膨脹會減輕。這一結果從另一角度也印證了前人對上述4種限制性隨機化方法性能研究的結論[5,7]。
其實,有關選擇偏倚對臨床試驗一類錯誤率膨脹的影響早有研究,對于平行組設計中的正態分布結果數據,Proschan[5]使用Z檢驗進行分析,并推導了隨機分配規則(RAR)下的一類錯誤率膨脹公式。Kennes等人[6]繼續這項工作,模擬了PBD的一類錯誤率膨脹情況,并進一步擴展到多中心試驗[8]。但以往的研究多考慮正態分布變量,隨機化方法也僅限于PBD,本研究在此基礎上探討了多種限制性隨機化方法的一類錯誤率膨脹行為,并考慮了二分類結果變量的情形。結果發現二分類結果變量更易受到這種選擇偏倚的影響,其一類錯誤率膨脹更大。
盡管我們的模擬也表明在4種限制性隨機化方法中,PBD最易導致一類錯誤率膨脹,但該方法因操作上的簡便性仍廣為應用。2015年Lin等報道,在NEJM、Lancet、JAMA期刊上發表的RCT文獻中有82%采用了區組隨機化方法[9]。我們對2018年發表在NEJM上全年的RCT論著進行了分析發現,分層區組隨機化(72.65%)最多,其次為區組隨機化(11.11%)、最小化(9.40%)、簡單隨機化(4.27%)[1]。但區組設計方法隨機性能低下已有明確研究結論,2006年,Berger甚至強烈建議不使用區組設計[10]。毋庸置疑,人們在現實臨床試驗中偏愛選擇PBD方法的現狀亟待關注和改善。近年有些學者對限制性隨機化方法下選擇偏倚的檢測和校正進行了探討[11-12],但遠未解決實際應用問題,應需今后進一步加強方法學研究及應用。
猜你喜歡 區組錯誤率限制性 變化區組隨機化及其SAS宏實現中國衛生統計(2022年4期)2022-10-12——平衡不完全區組設計定量資料一元方差分析">如何正確運用方差分析——平衡不完全區組設計定量資料一元方差分析四川精神衛生(2022年2期)2022-05-09因“限制性條件”而舍去的根中學生數理化·中考版(2021年9期)2021-11-20中醫臨床研究中區組設計應用現狀的計量學分析*天津中醫藥大學學報(2020年1期)2020-03-03小學生分數計算高錯誤率成因及對策新課程·上旬(2019年1期)2019-03-18骨科手術術中限制性與開放性輸血的對比觀察臨床醫藥文獻雜志(電子版)(2017年11期)2017-05-17正視錯誤,尋求策略教師·中(2017年3期)2017-04-20髁限制性假體應用于初次全膝關節置換的臨床療效臨床骨科雜志(2017年1期)2017-03-07解析小學高段學生英語單詞抄寫作業錯誤原因試題與研究·教學論壇(2016年27期)2016-08-11多組數據方差分析模型:以殺蟲劑藥效為例科技視界(2014年5期)2014-12-27