2021-4-9 | 醫(yī)學(xué)教育科技論文
本文作者:張巧蓮 鄭玉建 單位:新疆醫(yī)科大學(xué)學(xué)報(bào)編輯部 新疆醫(yī)科大學(xué)公共衛(wèi)生學(xué)院
在醫(yī)學(xué)論文寫(xiě)作中,醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法應(yīng)用是必不可少的,正確使用能保證科研工作順利進(jìn)行,并使科研成果更具有科學(xué)性、代表性和可靠性。反之,如果使用不當(dāng)或者誤用,會(huì)直接影響研究結(jié)果的質(zhì)量,反而會(huì)使讀者產(chǎn)生誤解,甚至有時(shí)會(huì)導(dǎo)致錯(cuò)誤的結(jié)論。近年來(lái),醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法在醫(yī)學(xué)科研中的應(yīng)用越來(lái)越受到國(guó)內(nèi)廣大醫(yī)學(xué)科研工作者的重視,統(tǒng)計(jì)分析結(jié)果表達(dá)已成為醫(yī)學(xué)論文中一個(gè)不可缺少的重要組成部分。醫(yī)學(xué)統(tǒng)計(jì)學(xué)是評(píng)價(jià)醫(yī)學(xué)科技論文質(zhì)量?jī)?yōu)劣的重要依據(jù),然而從近年發(fā)表的論文來(lái)看,有不少作者對(duì)統(tǒng)計(jì)方法的使用還不熟悉,實(shí)際應(yīng)用中統(tǒng)計(jì)方法濫用、錯(cuò)用和誤用的情況時(shí)有發(fā)生[1]。據(jù)國(guó)外20世紀(jì)60年代到80年代對(duì)不同醫(yī)學(xué)期刊發(fā)表論文的調(diào)查,有統(tǒng)計(jì)學(xué)錯(cuò)誤的論文比例最高者達(dá)66%,最低者也有20%[2-4]。國(guó)內(nèi)有學(xué)者對(duì)5種中華醫(yī)學(xué)會(huì)系列雜志論著中統(tǒng)計(jì)學(xué)方法的應(yīng)用狀況進(jìn)行了調(diào)查,結(jié)果顯示,1985年統(tǒng)計(jì)錯(cuò)誤的論文比例為24%,1995年為36%[5]。這些調(diào)查研究均說(shuō)明統(tǒng)計(jì)方法誤用的嚴(yán)重性以及正確應(yīng)用的緊迫性。國(guó)外從20世紀(jì)70年代起就有針對(duì)醫(yī)學(xué)論文的科研設(shè)計(jì)與統(tǒng)計(jì)方法應(yīng)用情況的調(diào)查研究,國(guó)內(nèi)學(xué)者也進(jìn)行了相關(guān)研究[6]。這種研究有助于及時(shí)了解醫(yī)學(xué)科研論文中統(tǒng)計(jì)方法的應(yīng)用質(zhì)量,發(fā)現(xiàn)存在的問(wèn)題,提高醫(yī)學(xué)科研工作者應(yīng)用統(tǒng)計(jì)方法的水平。筆者總結(jié)了近年來(lái)已發(fā)表的醫(yī)學(xué)科技論文中常見(jiàn)的統(tǒng)計(jì)學(xué)問(wèn)題,希望能引起各位專(zhuān)家學(xué)者和臨床醫(yī)生的共識(shí)與重視,促進(jìn)我國(guó)醫(yī)學(xué)期刊質(zhì)量的提高。
1 統(tǒng)計(jì)設(shè)計(jì)存在的常見(jiàn)問(wèn)題
統(tǒng)計(jì)設(shè)計(jì)是整個(gè)研究中最重要的一環(huán),是研究工作應(yīng)遵循的依據(jù)。常見(jiàn)的統(tǒng)計(jì)設(shè)計(jì)問(wèn)題有:忽視組間均衡性,樣本缺乏代表性,樣本例數(shù)不足,未設(shè)置對(duì)照組,未隨機(jī)分組,未提出統(tǒng)計(jì)分析方法等。針對(duì)以上問(wèn)題,在科研設(shè)計(jì)中一定要遵循實(shí)驗(yàn)設(shè)計(jì)的四大原則即“隨機(jī)、對(duì)照、均衡、重復(fù)”的原則[6]。
1.1不遵循或不重視隨機(jī)化原則
隨機(jī)化是科研設(shè)計(jì)的重要原則,直接影響研究結(jié)果的可信度。隨機(jī)化既要隨機(jī)抽樣,還要隨機(jī)分組,并有足夠的樣本量作前提。然而,在醫(yī)學(xué)論文中許多作者對(duì)此不夠重視,主要表現(xiàn)在論文中統(tǒng)計(jì)處理隨機(jī)化不突出,隨機(jī)化缺失情況比較常見(jiàn),有的論文甚至將隨機(jī)誤解為隨意、隨便,不采用隨機(jī)化處理方法,導(dǎo)致結(jié)果缺乏可靠性。還有些文章中沒(méi)有提出“隨機(jī)”抽樣的設(shè)計(jì)與方法,沒(méi)有排除標(biāo)準(zhǔn),給人隨意選擇病例之感,且病例數(shù)少,因此沒(méi)有代表性,所得出的結(jié)論不可靠。部分文章雖然注明了“隨機(jī)”,但未提及采取什么方法進(jìn)行隨機(jī)化研究或兩組間的例數(shù)相差甚遠(yuǎn),不符合隨機(jī)化的一般規(guī)律,沒(méi)有臨床參考價(jià)值[7]。
1.2缺少對(duì)照研究或?qū)φ战M設(shè)計(jì)不合理
正確設(shè)立對(duì)照是臨床或?qū)嶒?yàn)研究的一個(gè)核心問(wèn)題,設(shè)立對(duì)照的意義在于說(shuō)明臨床試驗(yàn)或?qū)嶒?yàn)研究中干預(yù)措施的效應(yīng),減少或防止偏倚和機(jī)遇產(chǎn)生的誤差對(duì)試驗(yàn)結(jié)果的影響。目前,國(guó)內(nèi)許多期刊發(fā)表的論文對(duì)照組設(shè)計(jì)不合理現(xiàn)象比較普遍,尤其有些作者對(duì)某種新藥或新技術(shù)在臨床的應(yīng)用觀察研究中,不設(shè)對(duì)照組,缺乏對(duì)照觀察,得出的結(jié)論缺乏科學(xué)性,令人懷疑。有的文章雖然設(shè)立了對(duì)照組,但在分析結(jié)果時(shí),卻沒(méi)有將試驗(yàn)組與對(duì)照組的結(jié)果進(jìn)行比較,而僅將各組間的自身前后進(jìn)行比較,從而使該研究失去對(duì)照意義。對(duì)照組選擇不當(dāng),還表現(xiàn)在兩組間重要的臨床特征和基線情況相差太大,無(wú)可比性,如性別、年齡、病情、經(jīng)濟(jì)情況和文化程度等不一致,如有些論文將健康人或志愿者作為對(duì)照組,使結(jié)果受到非處理因素的影響,產(chǎn)生偏倚或系統(tǒng)誤差,使結(jié)論不可信[7]。
1.3均衡性原則掌握不夠
均衡性原則要求實(shí)驗(yàn)中的各組之間除處理因素不同外,其他可控制的非處理因素要盡可能保持一致。特別對(duì)疾病預(yù)后有重要影響的臨床特性一定要在組間分布均衡。各組間越均衡,可比性越強(qiáng)。有些作者在對(duì)病例進(jìn)行分組時(shí),忽視了均衡性原則,兩組之間沒(méi)有可比性,結(jié)論自然是錯(cuò)誤的。具體表現(xiàn)在:有的文章對(duì)治療組與對(duì)照組的相應(yīng)統(tǒng)一指標(biāo)沒(méi)有設(shè)在均衡的水平上。對(duì)治療組情況交代的比較詳細(xì),而對(duì)對(duì)照組的年齡、性別、病情等不予交代,或所選對(duì)照組的年齡與治療組不在一個(gè)年齡段,影響了作者對(duì)指標(biāo)的觀察[7]。
1.4重復(fù)的原則掌握不好
所謂重復(fù),一是指重復(fù)試驗(yàn)或平行試驗(yàn),二是指各樣本組的例數(shù)要有一定的數(shù)量,即樣本的例數(shù)要足夠大。雖然隨機(jī)化是增強(qiáng)非處理因素均衡性的重要方法,但當(dāng)各組內(nèi)例數(shù)過(guò)少時(shí),盡管采用了隨機(jī)化分組的方法,也難以保證非處理因素的均衡一致。在隨機(jī)化分組的基礎(chǔ)上,只有樣本例數(shù)足夠大,才能使非處理因素均衡一致,同時(shí)也才能使抽樣誤差減小,增強(qiáng)樣本對(duì)總體的代表性。一般來(lái)說(shuō),在隨機(jī)分組的前提下,樣本例數(shù)越大,各組之間非處理因素的均衡性越好;但當(dāng)樣本量太大時(shí),往往又會(huì)給整個(gè)實(shí)驗(yàn)和質(zhì)量控制工作帶來(lái)更多的困難,同時(shí)也會(huì)造成浪費(fèi)。為此,在實(shí)驗(yàn)設(shè)計(jì)時(shí),還應(yīng)保證在實(shí)驗(yàn)結(jié)果具有一定可靠性的前提下,確定最少的樣本例數(shù)。一般說(shuō)來(lái),計(jì)數(shù)指標(biāo)每組樣本不得少于20~30例,計(jì)量指標(biāo)每組樣本不得少于5~10例。在多因素分析時(shí),一般認(rèn)為樣本例數(shù)至少為觀察指標(biāo)的5~10倍[8]。
1.5樣本的含量
樣本的含量的大小直接影響到結(jié)論的可靠性。樣本量過(guò)少,則抽樣誤差大,結(jié)果可靠性差,且經(jīng)不起重復(fù)驗(yàn)證;反之,盲目加大樣本量也會(huì)造成人、財(cái)、物的浪費(fèi),同時(shí)也造成非抽樣誤差增大。故應(yīng)在保證研究結(jié)果精確可靠的前提下,確定最小的樣本量。如某篇論文報(bào)道某藥治療的臨床療效,實(shí)際總例數(shù)為10例,其中6例有效,于是作者得出有效率為60%。顯然,有限的病例數(shù)不能充分說(shuō)明該藥是否有效,作者貿(mào)然得出結(jié)論,容易給他人造成假象甚至誤導(dǎo)[9]。
2 統(tǒng)計(jì)方法選擇與使用不當(dāng)
在選擇統(tǒng)計(jì)方法之前,首先應(yīng)確定研究資料是計(jì)數(shù)資料還是計(jì)量資料。只劃分其類(lèi)別而得到的資料為計(jì)數(shù)資料,也叫定性資料,如根據(jù)治療結(jié)果計(jì)算出的治愈率、陰性率、陽(yáng)性率等。測(cè)定某個(gè)具體數(shù)值而得到的資料為計(jì)量資料,如血壓值、血細(xì)胞計(jì)數(shù)、血氧分壓測(cè)定等許多物理診斷和化驗(yàn)檢查的結(jié)果。目前,醫(yī)學(xué)論文中計(jì)數(shù)資料最常用的統(tǒng)計(jì)方法為χ2檢驗(yàn),計(jì)量資料最常用的統(tǒng)計(jì)方法為t檢驗(yàn)。值得注意的是,各種假設(shè)檢驗(yàn)方法均有其適用條件,應(yīng)根據(jù)資料特點(diǎn)來(lái)選用最適當(dāng)?shù)姆椒ā>鶖?shù)與標(biāo)準(zhǔn)差分別是描述正態(tài)分布資料集中和離散趨勢(shì)的指標(biāo)。能否選用“均數(shù)±標(biāo)準(zhǔn)差”來(lái)描述某一資料的分布特征,關(guān)鍵看該資料是否符合正態(tài)分布。當(dāng)資料不符合正態(tài)分布或方差不齊時(shí),應(yīng)將資料轉(zhuǎn)換使之符合正態(tài)分布,方差齊性后再用t檢驗(yàn)或方差分析,否則用秩和檢驗(yàn)。有些作者在使用t檢驗(yàn)時(shí),未考慮到上述適用條件而盲目使用,造成統(tǒng)計(jì)學(xué)處理不當(dāng)或統(tǒng)計(jì)學(xué)計(jì)算錯(cuò)誤[10]。